PyPI - letta-nightly - Versions diffs - 0.8.17.dev20250722104501__py3-none-any.whl → 0.9.0.dev20250724081419__py3-none-any.whl - Mend

letta-nightly 0.8.17.dev20250722104501py3-none-any.whl → 0.9.0.dev20250724081419py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (96) hide show

letta/__init__.py +5 -3
letta/agent.py +3 -2
letta/agents/base_agent.py +4 -1
letta/agents/voice_agent.py +1 -0
letta/constants.py +4 -2
letta/functions/schema_generator.py +2 -1
letta/groups/dynamic_multi_agent.py +1 -0
letta/helpers/converters.py +13 -5
letta/helpers/json_helpers.py +6 -1
letta/llm_api/anthropic.py +2 -2
letta/llm_api/aws_bedrock.py +24 -94
letta/llm_api/deepseek.py +1 -1
letta/llm_api/google_ai_client.py +0 -38
letta/llm_api/google_constants.py +6 -3
letta/llm_api/helpers.py +1 -1
letta/llm_api/llm_api_tools.py +4 -7
letta/llm_api/mistral.py +12 -37
letta/llm_api/openai.py +17 -17
letta/llm_api/sample_response_jsons/aws_bedrock.json +38 -0
letta/llm_api/sample_response_jsons/lmstudio_embedding_list.json +15 -0
letta/llm_api/sample_response_jsons/lmstudio_model_list.json +15 -0
letta/local_llm/constants.py +2 -23
letta/local_llm/json_parser.py +11 -1
letta/local_llm/llm_chat_completion_wrappers/airoboros.py +9 -9
letta/local_llm/llm_chat_completion_wrappers/chatml.py +7 -8
letta/local_llm/llm_chat_completion_wrappers/configurable_wrapper.py +6 -6
letta/local_llm/llm_chat_completion_wrappers/dolphin.py +3 -3
letta/local_llm/llm_chat_completion_wrappers/simple_summary_wrapper.py +1 -1
letta/local_llm/ollama/api.py +2 -2
letta/orm/__init__.py +1 -0
letta/orm/agent.py +33 -2
letta/orm/files_agents.py +13 -10
letta/orm/mixins.py +8 -0
letta/orm/prompt.py +13 -0
letta/orm/sqlite_functions.py +61 -17
letta/otel/db_pool_monitoring.py +13 -12
letta/schemas/agent.py +69 -4
letta/schemas/agent_file.py +2 -0
letta/schemas/block.py +11 -0
letta/schemas/embedding_config.py +15 -3
letta/schemas/enums.py +2 -0
letta/schemas/file.py +1 -1
letta/schemas/folder.py +74 -0
letta/schemas/memory.py +12 -6
letta/schemas/prompt.py +9 -0
letta/schemas/providers/__init__.py +47 -0
letta/schemas/providers/anthropic.py +78 -0
letta/schemas/providers/azure.py +80 -0
letta/schemas/providers/base.py +201 -0
letta/schemas/providers/bedrock.py +78 -0
letta/schemas/providers/cerebras.py +79 -0
letta/schemas/providers/cohere.py +18 -0
letta/schemas/providers/deepseek.py +63 -0
letta/schemas/providers/google_gemini.py +102 -0
letta/schemas/providers/google_vertex.py +54 -0
letta/schemas/providers/groq.py +35 -0
letta/schemas/providers/letta.py +39 -0
letta/schemas/providers/lmstudio.py +97 -0
letta/schemas/providers/mistral.py +41 -0
letta/schemas/providers/ollama.py +151 -0
letta/schemas/providers/openai.py +241 -0
letta/schemas/providers/together.py +85 -0
letta/schemas/providers/vllm.py +57 -0
letta/schemas/providers/xai.py +66 -0
letta/server/db.py +0 -5
letta/server/rest_api/app.py +4 -3
letta/server/rest_api/routers/v1/__init__.py +2 -0
letta/server/rest_api/routers/v1/agents.py +152 -4
letta/server/rest_api/routers/v1/folders.py +490 -0
letta/server/rest_api/routers/v1/providers.py +2 -2
letta/server/rest_api/routers/v1/sources.py +21 -26
letta/server/rest_api/routers/v1/tools.py +90 -15
letta/server/server.py +50 -95
letta/services/agent_manager.py +420 -81
letta/services/agent_serialization_manager.py +707 -0
letta/services/block_manager.py +132 -11
letta/services/file_manager.py +104 -29
letta/services/file_processor/embedder/pinecone_embedder.py +8 -2
letta/services/file_processor/file_processor.py +75 -24
letta/services/file_processor/parser/markitdown_parser.py +95 -0
letta/services/files_agents_manager.py +57 -17
letta/services/group_manager.py +7 -0
letta/services/helpers/agent_manager_helper.py +25 -15
letta/services/provider_manager.py +2 -2
letta/services/source_manager.py +35 -16
letta/services/tool_executor/files_tool_executor.py +12 -5
letta/services/tool_manager.py +12 -0
letta/services/tool_sandbox/e2b_sandbox.py +52 -48
letta/settings.py +9 -6
letta/streaming_utils.py +2 -1
letta/utils.py +34 -1
{letta_nightly-0.8.17.dev20250722104501.dist-info → letta_nightly-0.9.0.dev20250724081419.dist-info}/METADATA +9 -8
{letta_nightly-0.8.17.dev20250722104501.dist-info → letta_nightly-0.9.0.dev20250724081419.dist-info}/RECORD +96 -68
{letta_nightly-0.8.17.dev20250722104501.dist-info → letta_nightly-0.9.0.dev20250724081419.dist-info}/LICENSE +0 -0
{letta_nightly-0.8.17.dev20250722104501.dist-info → letta_nightly-0.9.0.dev20250724081419.dist-info}/WHEEL +0 -0
{letta_nightly-0.8.17.dev20250722104501.dist-info → letta_nightly-0.9.0.dev20250724081419.dist-info}/entry_points.txt +0 -0

letta/server/rest_api/routers/v1/tools.py CHANGED Viewed

@@ -1,3 +1,4 @@
+import json
 from typing import Any, Dict, List, Optional, Union
 from composio.client import ComposioClientError, HTTPError, NoItemsFound
@@ -17,10 +18,14 @@ from letta.functions.functions import derive_openai_json_schema
 from letta.functions.mcp_client.exceptions import MCPTimeoutError
 from letta.functions.mcp_client.types import MCPServerType, MCPTool, SSEServerConfig, StdioServerConfig, StreamableHTTPServerConfig
 from letta.helpers.composio_helpers import get_composio_api_key
+from letta.llm_api.llm_client import LLMClient
 from letta.log import get_logger
 from letta.orm.errors import UniqueConstraintViolationError
+from letta.schemas.enums import MessageRole
 from letta.schemas.letta_message import ToolReturnMessage
+from letta.schemas.letta_message_content import TextContent
 from letta.schemas.mcp import UpdateSSEMCPServer, UpdateStdioMCPServer, UpdateStreamableHTTPMCPServer
+from letta.schemas.message import Message
 from letta.schemas.tool import Tool, ToolCreate, ToolRunFromSource, ToolUpdate
 from letta.server.rest_api.utils import get_letta_server
 from letta.server.server import SyncServer
@@ -106,21 +111,6 @@ async def list_tools(
         raise HTTPException(status_code=500, detail=str(e))
-@router.get("/count", response_model=int, operation_id="count_tools")
-def count_tools(
-    server: SyncServer = Depends(get_letta_server),
-    actor_id: Optional[str] = Header(None, alias="user_id"),
-):
-    """
-    Get a count of all tools available to agents belonging to the org of the user
-    """
-    try:
-        return server.tool_manager.size(actor=server.user_manager.get_user_or_default(user_id=actor_id))
-    except Exception as e:
-        print(f"Error occurred: {e}")
-        raise HTTPException(status_code=500, detail=str(e))
 @router.post("/", response_model=Tool, operation_id="create_tool")
 async def create_tool(
     request: ToolCreate = Body(...),
@@ -701,3 +691,88 @@ async def generate_json_schema(
     except Exception as e:
         raise HTTPException(status_code=400, detail=f"Failed to generate schema: {str(e)}")
+class GenerateToolInput(BaseModel):
+    tool_name: str = Field(..., description="Name of the tool to generate code for")
+    prompt: str = Field(..., description="User prompt to generate code")
+    handle: Optional[str] = Field(None, description="Handle of the tool to generate code for")
+    starter_code: Optional[str] = Field(None, description="Python source code to parse for JSON schema")
+    validation_errors: List[str] = Field(..., description="List of validation errors")
+class GenerateToolOutput(BaseModel):
+    tool: Tool = Field(..., description="Generated tool")
+    sample_args: Dict[str, Any] = Field(..., description="Sample arguments for the tool")
+    response: str = Field(..., description="Response from the assistant")
+@router.post("/generate-tool", response_model=GenerateToolOutput, operation_id="generate_tool")
+async def generate_tool_from_prompt(
+    request: GenerateToolInput = Body(...),
+    server: SyncServer = Depends(get_letta_server),
+    actor_id: Optional[str] = Header(None, alias="user_id"),
+):
+    """
+    Generate a tool from the given user prompt.
+    """
+    try:
+        actor = await server.user_manager.get_actor_or_default_async(actor_id=actor_id)
+        llm_config = await server.get_cached_llm_config_async(actor=actor, handle=request.handle or "anthropic/claude-3-5-sonnet-20240620")
+        formatted_prompt = (
+            f"Generate a python function named {request.tool_name} using the instructions below "
+            + (f"based on this starter code: \n\n```\n{request.starter_code}\n```\n\n" if request.starter_code else "\n")
+            + (f"Note the following validation errors: \n{' '.join(request.validation_errors)}\n\n" if request.validation_errors else "\n")
+            + f"Instructions: {request.prompt}"
+        )
+        llm_client = LLMClient.create(
+            provider_type=llm_config.model_endpoint_type,
+            actor=actor,
+        )
+        assert llm_client is not None
+        input_messages = [
+            Message(role=MessageRole.system, content=[TextContent(text="Placeholder system message")]),
+            Message(role=MessageRole.assistant, content=[TextContent(text="Placeholder assistant message")]),
+            Message(role=MessageRole.user, content=[TextContent(text=formatted_prompt)]),
+        ]
+        tool = {
+            "name": "generate_tool",
+            "description": "This method generates the raw source code for a custom tool that can be attached to and agent for llm invocation.",
+            "parameters": {
+                "type": "object",
+                "properties": {
+                    "raw_source_code": {"type": "string", "description": "The raw python source code of the custom tool."},
+                    "sample_args_json": {
+                        "type": "string",
+                        "description": "The JSON dict that contains sample args for a test run of the python function. Key is the name of the function parameter and value is an example argument that is passed in.",
+                    },
+                    "pip_requirements_json": {
+                        "type": "string",
+                        "description": "Optional JSON dict that contains pip packages to be installed if needed by the source code. Key is the name of the pip package and value is the version number.",
+                    },
+                },
+                "required": ["raw_source_code", "sample_args_json", "pip_requirements_json"],
+            },
+        }
+        request_data = llm_client.build_request_data(
+            input_messages,
+            llm_config,
+            tools=[tool],
+        )
+        response_data = await llm_client.request_async(request_data, llm_config)
+        response = llm_client.convert_response_to_chat_completion(response_data, input_messages, llm_config)
+        output = json.loads(response.choices[0].message.tool_calls[0].function.arguments)
+        return GenerateToolOutput(
+            tool=Tool(
+                name=request.tool_name,
+                source_type="python",
+                source_code=output["raw_source_code"],
+            ),
+            sample_args=json.loads(output["sample_args_json"]),
+            response=response.choices[0].message.content,
+        )
+    except Exception as e:
+        logger.error(f"Failed to generate tool: {str(e)}")
+        raise HTTPException(status_code=500, detail=f"Failed to generate tool: {str(e)}")

letta/server/server.py CHANGED Viewed

@@ -42,7 +42,6 @@ from letta.schemas.embedding_config import EmbeddingConfig
 # openai schemas
 from letta.schemas.enums import JobStatus, MessageStreamStatus, ProviderCategory, ProviderType
 from letta.schemas.environment_variables import SandboxEnvironmentVariableCreate
-from letta.schemas.file import FileMetadata
 from letta.schemas.group import GroupCreate, ManagerType, SleeptimeManager, VoiceSleeptimeManager
 from letta.schemas.job import Job, JobUpdate
 from letta.schemas.letta_message import LegacyLettaMessage, LettaMessage, MessageType, ToolReturnMessage
@@ -68,8 +67,6 @@ from letta.schemas.providers import (
     OpenAIProvider,
     Provider,
     TogetherProvider,
-    VLLMChatCompletionsProvider,
-    VLLMCompletionsProvider,
     XAIProvider,
 )
 from letta.schemas.sandbox_config import LocalSandboxConfig, SandboxConfigCreate, SandboxType
@@ -81,9 +78,9 @@ from letta.server.rest_api.chat_completions_interface import ChatCompletionsStre
 from letta.server.rest_api.interface import StreamingServerInterface
 from letta.server.rest_api.utils import sse_async_generator
 from letta.services.agent_manager import AgentManager
+from letta.services.agent_serialization_manager import AgentSerializationManager
 from letta.services.block_manager import BlockManager
 from letta.services.file_manager import FileManager
-from letta.services.file_processor.chunker.line_chunker import LineChunker
 from letta.services.files_agents_manager import FileAgentManager
 from letta.services.group_manager import GroupManager
 from letta.services.helpers.tool_execution_helper import prepare_local_sandbox
@@ -226,6 +223,18 @@ class SyncServer(Server):
         self.file_agent_manager = FileAgentManager()
         self.file_manager = FileManager()
+        self.agent_serialization_manager = AgentSerializationManager(
+            agent_manager=self.agent_manager,
+            tool_manager=self.tool_manager,
+            source_manager=self.source_manager,
+            block_manager=self.block_manager,
+            group_manager=self.group_manager,
+            mcp_manager=self.mcp_manager,
+            file_manager=self.file_manager,
+            file_agent_manager=self.file_agent_manager,
+            message_manager=self.message_manager,
+        )
         # A resusable httpx client
         timeout = httpx.Timeout(connect=10.0, read=20.0, write=10.0, pool=10.0)
         limits = httpx.Limits(max_connections=100, max_keepalive_connections=80, keepalive_expiry=300)
@@ -360,7 +369,7 @@ class SyncServer(Server):
                 )
             )
             # NOTE: to use the /chat/completions endpoint, you need to specify extra flags on vLLM startup
-            # see: https://docs.vllm.ai/en/latest/getting_started/examples/openai_chat_completion_client_with_tools.html
+            # see: https://docs.vllm.ai/en/stable/features/tool_calling.html
             # e.g. "... --enable-auto-tool-choice --tool-call-parser hermes"
             self._enabled_providers.append(
                 VLLMChatCompletionsProvider(
@@ -460,7 +469,7 @@ class SyncServer(Server):
             # Determine whether or not to token stream based on the capability of the interface
             token_streaming = letta_agent.interface.streaming_mode if hasattr(letta_agent.interface, "streaming_mode") else False
-            logger.debug(f"Starting agent step")
+            logger.debug("Starting agent step")
             if interface:
                 metadata = interface.metadata if hasattr(interface, "metadata") else None
             else:
@@ -534,7 +543,7 @@ class SyncServer(Server):
             letta_agent.interface.print_messages_raw(letta_agent.messages)
         elif command.lower() == "memory":
-            ret_str = f"\nDumping memory contents:\n" + f"\n{str(letta_agent.agent_state.memory)}" + f"\n{str(letta_agent.passage_manager)}"
+            ret_str = "\nDumping memory contents:\n" + f"\n{str(letta_agent.agent_state.memory)}" + f"\n{str(letta_agent.passage_manager)}"
             return ret_str
         elif command.lower() == "pop" or command.lower().startswith("pop "):
@@ -554,7 +563,7 @@ class SyncServer(Server):
         elif command.lower() == "retry":
             # TODO this needs to also modify the persistence manager
-            logger.debug(f"Retrying for another answer")
+            logger.debug("Retrying for another answer")
             while len(letta_agent.messages) > 0:
                 if letta_agent.messages[-1].get("role") == "user":
                     # we want to pop up to the last user message and send it again
@@ -770,6 +779,7 @@ class SyncServer(Server):
             self._embedding_config_cache[key] = self.get_embedding_config_from_handle(actor=actor, **kwargs)
         return self._embedding_config_cache[key]
+    # @async_redis_cache(key_func=lambda (actor, **kwargs): actor.id + hash(kwargs))
     @trace_method
     async def get_cached_embedding_config_async(self, actor: User, **kwargs):
         key = make_key(**kwargs)
@@ -782,9 +792,9 @@ class SyncServer(Server):
         self,
         request: CreateAgent,
         actor: User,
-        # interface
-        interface: Union[AgentInterface, None] = None,
+        interface: AgentInterface | None = None,
     ) -> AgentState:
+        warnings.warn("This method is deprecated, use create_agent_async where possible.", DeprecationWarning, stacklevel=2)
         if request.llm_config is None:
             if request.model is None:
                 raise ValueError("Must specify either model or llm_config in request")
@@ -873,7 +883,9 @@ class SyncServer(Server):
         if request.source_ids:
             for source_id in request.source_ids:
                 files = await self.file_manager.list_files(source_id, actor, include_content=True)
-                await self.insert_files_into_context_window(agent_state=main_agent, file_metadata_with_content=files, actor=actor)
+                await self.agent_manager.insert_files_into_context_window(
+                    agent_state=main_agent, file_metadata_with_content=files, actor=actor
+                )
             main_agent = await self.agent_manager.refresh_file_blocks(agent_state=main_agent, actor=actor)
             main_agent = await self.agent_manager.attach_missing_files_tools_async(agent_state=main_agent, actor=actor)
@@ -1320,7 +1332,6 @@ class SyncServer(Server):
         # TODO: delete data from agent passage stores (?)
     async def load_file_to_source(self, source_id: str, file_path: str, job_id: str, actor: User) -> Job:
         # update job
         job = await self.job_manager.get_job_by_id_async(job_id, actor=actor)
         job.status = JobStatus.running
@@ -1397,90 +1408,28 @@ class SyncServer(Server):
         except NoResultFound:
             logger.info(f"File {file_id} already removed from agent {agent_id}, skipping...")
-    async def insert_file_into_context_windows(
-        self, source_id: str, file_metadata_with_content: FileMetadata, actor: User, agent_states: Optional[List[AgentState]] = None
-    ) -> List[AgentState]:
-        """
-        Insert the uploaded document into the context window of all agents
-        attached to the given source.
-        """
-        agent_states = agent_states or await self.source_manager.list_attached_agents(source_id=source_id, actor=actor)
-        # Return early
-        if not agent_states:
-            return []
-        logger.info(f"Inserting document into context window for source: {source_id}")
-        logger.info(f"Attached agents: {[a.id for a in agent_states]}")
-        # Generate visible content for the file
-        line_chunker = LineChunker()
-        content_lines = line_chunker.chunk_text(file_metadata=file_metadata_with_content)
-        visible_content = "\n".join(content_lines)
-        visible_content_map = {file_metadata_with_content.file_name: visible_content}
-        # Attach file to each agent using bulk method (one file per agent, but atomic per agent)
-        all_closed_files = await asyncio.gather(
-            *(
-                self.file_agent_manager.attach_files_bulk(
-                    agent_id=agent_state.id,
-                    files_metadata=[file_metadata_with_content],
-                    visible_content_map=visible_content_map,
-                    actor=actor,
-                )
-                for agent_state in agent_states
-            )
-        )
-        # Flatten and log if any files were closed
-        closed_files = [file for closed_list in all_closed_files for file in closed_list]
-        if closed_files:
-            logger.info(f"LRU eviction closed {len(closed_files)} files during bulk attach: {closed_files}")
-        return agent_states
-    async def insert_files_into_context_window(
-        self, agent_state: AgentState, file_metadata_with_content: List[FileMetadata], actor: User
-    ) -> None:
-        """
-        Insert the uploaded documents into the context window of an agent
-        attached to the given source.
-        """
-        logger.info(f"Inserting {len(file_metadata_with_content)} documents into context window for agent_state: {agent_state.id}")
-        # Generate visible content for each file
-        line_chunker = LineChunker()
-        visible_content_map = {}
-        for file_metadata in file_metadata_with_content:
-            content_lines = line_chunker.chunk_text(file_metadata=file_metadata)
-            visible_content_map[file_metadata.file_name] = "\n".join(content_lines)
-        # Use bulk attach to avoid race conditions and duplicate LRU eviction decisions
-        closed_files = await self.file_agent_manager.attach_files_bulk(
-            agent_id=agent_state.id,
-            files_metadata=file_metadata_with_content,
-            visible_content_map=visible_content_map,
-            actor=actor,
-        )
-        if closed_files:
-            logger.info(f"LRU eviction closed {len(closed_files)} files during bulk insert: {closed_files}")
     async def remove_file_from_context_windows(self, source_id: str, file_id: str, actor: User) -> None:
         """
         Remove the document from the context window of all agents
         attached to the given source.
         """
-        # TODO: We probably do NOT need to get the entire agent state, we can just get the IDs
-        agent_states = await self.source_manager.list_attached_agents(source_id=source_id, actor=actor)
+        # Use the optimized ids_only parameter
+        agent_ids = await self.source_manager.list_attached_agents(source_id=source_id, actor=actor, ids_only=True)
-        # Return early
-        if not agent_states:
+        # Return early if no agents
+        if not agent_ids:
             return
         logger.info(f"Removing file from context window for source: {source_id}")
-        logger.info(f"Attached agents: {[a.id for a in agent_states]}")
+        logger.info(f"Attached agents: {agent_ids}")
+        # Create agent-file pairs for bulk deletion
+        agent_file_pairs = [(agent_id, file_id) for agent_id in agent_ids]
+        # Bulk delete in a single query
+        deleted_count = await self.file_agent_manager.detach_file_bulk(agent_file_pairs=agent_file_pairs, actor=actor)
-        await asyncio.gather(*(self._remove_file_from_agent(agent_state.id, file_id, actor) for agent_state in agent_states))
+        logger.info(f"Removed file {file_id} from {deleted_count} agent context windows")
     async def remove_files_from_context_window(self, agent_state: AgentState, file_ids: List[str], actor: User) -> None:
         """
@@ -1490,7 +1439,13 @@ class SyncServer(Server):
         logger.info(f"Removing files from context window for agent_state: {agent_state.id}")
         logger.info(f"Files to remove: {file_ids}")
-        await asyncio.gather(*(self._remove_file_from_agent(agent_state.id, file_id, actor) for file_id in file_ids))
+        # Create agent-file pairs for bulk deletion
+        agent_file_pairs = [(agent_state.id, file_id) for file_id in file_ids]
+        # Bulk delete in a single query
+        deleted_count = await self.file_agent_manager.detach_file_bulk(agent_file_pairs=agent_file_pairs, actor=actor)
+        logger.info(f"Removed {deleted_count} files from agent {agent_state.id}")
     async def create_document_sleeptime_agent_async(
         self, main_agent: AgentState, source: Source, actor: User, clear_history: bool = False
@@ -1562,7 +1517,6 @@ class SyncServer(Server):
         # Add extra metadata to the sources
         sources_with_metadata = []
         for source in sources:
             # count number of passages
             num_passages = self.agent_manager.passage_size(actor=actor, source_id=source.id)
@@ -1932,7 +1886,9 @@ class SyncServer(Server):
     def get_provider_from_name(self, provider_name: str, actor: User) -> Provider:
         providers = [provider for provider in self.get_enabled_providers(actor) if provider.name == provider_name]
         if not providers:
-            raise ValueError(f"Provider {provider_name} is not supported")
+            raise ValueError(
+                f"Provider {provider_name} is not supported (supported providers: {', '.join([provider.name for provider in self._enabled_providers])})"
+            )
         elif len(providers) > 1:
             raise ValueError(f"Multiple providers with name {provider_name} supported")
         else:
@@ -1944,7 +1900,9 @@ class SyncServer(Server):
         all_providers = await self.get_enabled_providers_async(actor)
         providers = [provider for provider in all_providers if provider.name == provider_name]
         if not providers:
-            raise ValueError(f"Provider {provider_name} is not supported")
+            raise ValueError(
+                f"Provider {provider_name} is not supported (supported providers: {', '.join([provider.name for provider in self._enabled_providers])})"
+            )
         elif len(providers) > 1:
             raise ValueError(f"Multiple providers with name {provider_name} supported")
         else:
@@ -2112,7 +2070,6 @@ class SyncServer(Server):
         mcp_config_path = os.path.join(constants.LETTA_DIR, constants.MCP_CONFIG_NAME)
         if os.path.exists(mcp_config_path):
             with open(mcp_config_path, "r") as f:
                 try:
                     mcp_config = json.load(f)
                 except Exception as e:
@@ -2124,7 +2081,6 @@ class SyncServer(Server):
                 # with the value being the schema from StdioServerParameters
                 if MCP_CONFIG_TOPLEVEL_KEY in mcp_config:
                     for server_name, server_params_raw in mcp_config[MCP_CONFIG_TOPLEVEL_KEY].items():
                         # No support for duplicate server names
                         if server_name in mcp_server_list:
                             logger.error(f"Duplicate MCP server name found (skipping): {server_name}")
@@ -2295,7 +2251,6 @@ class SyncServer(Server):
         # For streaming response
         try:
             # TODO: move this logic into server.py
             # Get the generator object off of the agent's streaming interface
@@ -2435,9 +2390,9 @@ class SyncServer(Server):
         if not stream_steps and stream_tokens:
             raise ValueError("stream_steps must be 'true' if stream_tokens is 'true'")
-        group = self.group_manager.retrieve_group(group_id=group_id, actor=actor)
+        group = await self.group_manager.retrieve_group_async(group_id=group_id, actor=actor)
         agent_state_id = group.manager_agent_id or (group.agent_ids[0] if len(group.agent_ids) > 0 else None)
-        agent_state = self.agent_manager.get_agent_by_id(agent_id=agent_state_id, actor=actor) if agent_state_id else None
+        agent_state = await self.agent_manager.get_agent_by_id_async(agent_id=agent_state_id, actor=actor) if agent_state_id else None
         letta_multi_agent = load_multi_agent(group=group, agent_state=agent_state, actor=actor)
         llm_config = letta_multi_agent.agent_state.llm_config

letta-nightly 0.8.17.dev20250722104501__py3-none-any.whl → 0.9.0.dev20250724081419__py3-none-any.whl

letta-nightly 0.8.17.dev20250722104501py3-none-any.whl → 0.9.0.dev20250724081419py3-none-any.whl