PyPI - letta-nightly - Versions diffs - 0.7.29.dev20250602104315__py3-none-any.whl → 0.8.0.dev20250604104349__py3-none-any.whl - Mend

letta-nightly 0.7.29.dev20250602104315py3-none-any.whl → 0.8.0.dev20250604104349py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (138) hide show

letta/__init__.py +7 -1
letta/agent.py +16 -9
letta/agents/base_agent.py +1 -0
letta/agents/ephemeral_summary_agent.py +104 -0
letta/agents/helpers.py +35 -3
letta/agents/letta_agent.py +492 -176
letta/agents/letta_agent_batch.py +22 -16
letta/agents/prompts/summary_system_prompt.txt +62 -0
letta/agents/voice_agent.py +22 -7
letta/agents/voice_sleeptime_agent.py +13 -8
letta/constants.py +33 -1
letta/data_sources/connectors.py +52 -36
letta/errors.py +4 -0
letta/functions/ast_parsers.py +13 -30
letta/functions/function_sets/base.py +3 -1
letta/functions/functions.py +2 -0
letta/functions/mcp_client/base_client.py +151 -97
letta/functions/mcp_client/sse_client.py +49 -31
letta/functions/mcp_client/stdio_client.py +107 -106
letta/functions/schema_generator.py +22 -22
letta/groups/helpers.py +3 -4
letta/groups/sleeptime_multi_agent.py +4 -4
letta/groups/sleeptime_multi_agent_v2.py +22 -0
letta/helpers/composio_helpers.py +16 -0
letta/helpers/converters.py +20 -0
letta/helpers/datetime_helpers.py +1 -6
letta/helpers/tool_rule_solver.py +2 -1
letta/interfaces/anthropic_streaming_interface.py +17 -2
letta/interfaces/openai_chat_completions_streaming_interface.py +1 -0
letta/interfaces/openai_streaming_interface.py +18 -2
letta/jobs/llm_batch_job_polling.py +1 -1
letta/jobs/scheduler.py +1 -1
letta/llm_api/anthropic_client.py +24 -3
letta/llm_api/google_ai_client.py +0 -15
letta/llm_api/google_vertex_client.py +6 -5
letta/llm_api/llm_client_base.py +15 -0
letta/llm_api/openai.py +2 -2
letta/llm_api/openai_client.py +60 -8
letta/orm/__init__.py +2 -0
letta/orm/agent.py +45 -43
letta/orm/base.py +0 -2
letta/orm/block.py +1 -0
letta/orm/custom_columns.py +13 -0
letta/orm/enums.py +5 -0
letta/orm/file.py +3 -1
letta/orm/files_agents.py +68 -0
letta/orm/mcp_server.py +48 -0
letta/orm/message.py +1 -0
letta/orm/organization.py +11 -2
letta/orm/passage.py +25 -10
letta/orm/sandbox_config.py +5 -2
letta/orm/sqlalchemy_base.py +171 -110
letta/prompts/system/memgpt_base.txt +6 -1
letta/prompts/system/memgpt_v2_chat.txt +57 -0
letta/prompts/system/sleeptime.txt +2 -0
letta/prompts/system/sleeptime_v2.txt +28 -0
letta/schemas/agent.py +87 -20
letta/schemas/block.py +7 -1
letta/schemas/file.py +57 -0
letta/schemas/mcp.py +74 -0
letta/schemas/memory.py +5 -2
letta/schemas/message.py +9 -0
letta/schemas/openai/openai.py +0 -6
letta/schemas/providers.py +33 -4
letta/schemas/tool.py +26 -21
letta/schemas/tool_execution_result.py +5 -0
letta/server/db.py +23 -8
letta/server/rest_api/app.py +73 -56
letta/server/rest_api/interface.py +4 -4
letta/server/rest_api/routers/v1/agents.py +132 -47
letta/server/rest_api/routers/v1/blocks.py +3 -2
letta/server/rest_api/routers/v1/embeddings.py +3 -3
letta/server/rest_api/routers/v1/groups.py +3 -3
letta/server/rest_api/routers/v1/jobs.py +14 -17
letta/server/rest_api/routers/v1/organizations.py +10 -10
letta/server/rest_api/routers/v1/providers.py +12 -10
letta/server/rest_api/routers/v1/runs.py +3 -3
letta/server/rest_api/routers/v1/sandbox_configs.py +12 -12
letta/server/rest_api/routers/v1/sources.py +108 -43
letta/server/rest_api/routers/v1/steps.py +8 -6
letta/server/rest_api/routers/v1/tools.py +134 -95
letta/server/rest_api/utils.py +12 -1
letta/server/server.py +272 -73
letta/services/agent_manager.py +246 -313
letta/services/block_manager.py +30 -9
letta/services/context_window_calculator/__init__.py +0 -0
letta/services/context_window_calculator/context_window_calculator.py +150 -0
letta/services/context_window_calculator/token_counter.py +82 -0
letta/services/file_processor/__init__.py +0 -0
letta/services/file_processor/chunker/__init__.py +0 -0
letta/services/file_processor/chunker/llama_index_chunker.py +29 -0
letta/services/file_processor/embedder/__init__.py +0 -0
letta/services/file_processor/embedder/openai_embedder.py +84 -0
letta/services/file_processor/file_processor.py +123 -0
letta/services/file_processor/parser/__init__.py +0 -0
letta/services/file_processor/parser/base_parser.py +9 -0
letta/services/file_processor/parser/mistral_parser.py +54 -0
letta/services/file_processor/types.py +0 -0
letta/services/files_agents_manager.py +184 -0
letta/services/group_manager.py +118 -0
letta/services/helpers/agent_manager_helper.py +76 -21
letta/services/helpers/tool_execution_helper.py +3 -0
letta/services/helpers/tool_parser_helper.py +100 -0
letta/services/identity_manager.py +44 -42
letta/services/job_manager.py +21 -10
letta/services/mcp/base_client.py +5 -2
letta/services/mcp/sse_client.py +3 -5
letta/services/mcp/stdio_client.py +3 -5
letta/services/mcp_manager.py +281 -0
letta/services/message_manager.py +40 -26
letta/services/organization_manager.py +55 -19
letta/services/passage_manager.py +211 -13
letta/services/provider_manager.py +48 -2
letta/services/sandbox_config_manager.py +105 -0
letta/services/source_manager.py +4 -5
letta/services/step_manager.py +9 -6
letta/services/summarizer/summarizer.py +50 -23
letta/services/telemetry_manager.py +7 -0
letta/services/tool_executor/tool_execution_manager.py +11 -52
letta/services/tool_executor/tool_execution_sandbox.py +4 -34
letta/services/tool_executor/tool_executor.py +107 -105
letta/services/tool_manager.py +56 -17
letta/services/tool_sandbox/base.py +39 -92
letta/services/tool_sandbox/e2b_sandbox.py +16 -11
letta/services/tool_sandbox/local_sandbox.py +51 -23
letta/services/user_manager.py +36 -3
letta/settings.py +10 -3
letta/templates/__init__.py +0 -0
letta/templates/sandbox_code_file.py.j2 +47 -0
letta/templates/template_helper.py +16 -0
letta/tracing.py +30 -1
letta/types/__init__.py +7 -0
letta/utils.py +25 -1
{letta_nightly-0.7.29.dev20250602104315.dist-info → letta_nightly-0.8.0.dev20250604104349.dist-info}/METADATA +7 -2
{letta_nightly-0.7.29.dev20250602104315.dist-info → letta_nightly-0.8.0.dev20250604104349.dist-info}/RECORD +138 -112
{letta_nightly-0.7.29.dev20250602104315.dist-info → letta_nightly-0.8.0.dev20250604104349.dist-info}/LICENSE +0 -0
{letta_nightly-0.7.29.dev20250602104315.dist-info → letta_nightly-0.8.0.dev20250604104349.dist-info}/WHEEL +0 -0
{letta_nightly-0.7.29.dev20250602104315.dist-info → letta_nightly-0.8.0.dev20250604104349.dist-info}/entry_points.txt +0 -0

letta/functions/mcp_client/stdio_client.py CHANGED Viewed

@@ -1,108 +1,109 @@
-import asyncio
-import sys
-from contextlib import asynccontextmanager
+# import asyncio
+# import sys
+# from contextlib import asynccontextmanager
+#
+# import anyio
+# import anyio.lowlevel
+# import mcp.types as types
+# from anyio.streams.text import TextReceiveStream
+# from mcp import ClientSession, StdioServerParameters
+# from mcp.client.stdio import get_default_environment
+#
+# from letta.functions.mcp_client.base_client import BaseMCPClient
+# from letta.functions.mcp_client.types import StdioServerConfig
+# from letta.log import get_logger
+#
+# logger = get_logger(__name__)
-import anyio
-import anyio.lowlevel
-import mcp.types as types
-from anyio.streams.text import TextReceiveStream
-from mcp import ClientSession, StdioServerParameters
-from mcp.client.stdio import get_default_environment
-from letta.functions.mcp_client.base_client import BaseMCPClient
-from letta.functions.mcp_client.types import StdioServerConfig
-from letta.log import get_logger
-logger = get_logger(__name__)
-class StdioMCPClient(BaseMCPClient):
-    def _initialize_connection(self, server_config: StdioServerConfig, timeout: float) -> bool:
-        try:
-            server_params = StdioServerParameters(command=server_config.command, args=server_config.args, env=server_config.env)
-            stdio_cm = forked_stdio_client(server_params)
-            stdio_transport = self.loop.run_until_complete(asyncio.wait_for(stdio_cm.__aenter__(), timeout=timeout))
-            self.stdio, self.write = stdio_transport
-            self.cleanup_funcs.append(lambda: self.loop.run_until_complete(stdio_cm.__aexit__(None, None, None)))
-            session_cm = ClientSession(self.stdio, self.write)
-            self.session = self.loop.run_until_complete(asyncio.wait_for(session_cm.__aenter__(), timeout=timeout))
-            self.cleanup_funcs.append(lambda: self.loop.run_until_complete(session_cm.__aexit__(None, None, None)))
-            return True
-        except asyncio.TimeoutError:
-            logger.error(f"Timed out while establishing stdio connection (timeout={timeout}s).")
-            return False
-        except Exception:
-            logger.exception("Exception occurred while initializing stdio client session.")
-            return False
-@asynccontextmanager
-async def forked_stdio_client(server: StdioServerParameters):
-    """
-    Client transport for stdio: this will connect to a server by spawning a
-    process and communicating with it over stdin/stdout.
-    """
-    read_stream_writer, read_stream = anyio.create_memory_object_stream(0)
-    write_stream, write_stream_reader = anyio.create_memory_object_stream(0)
-    try:
-        process = await anyio.open_process(
-            [server.command, *server.args],
-            env=server.env or get_default_environment(),
-            stderr=sys.stderr,  # Consider logging stderr somewhere instead of silencing it
-        )
-    except OSError as exc:
-        raise RuntimeError(f"Failed to spawn process: {server.command} {server.args}") from exc
-    async def stdout_reader():
-        assert process.stdout, "Opened process is missing stdout"
-        buffer = ""
-        try:
-            async with read_stream_writer:
-                async for chunk in TextReceiveStream(
-                    process.stdout,
-                    encoding=server.encoding,
-                    errors=server.encoding_error_handler,
-                ):
-                    lines = (buffer + chunk).split("\n")
-                    buffer = lines.pop()
-                    for line in lines:
-                        try:
-                            message = types.JSONRPCMessage.model_validate_json(line)
-                        except Exception as exc:
-                            await read_stream_writer.send(exc)
-                            continue
-                        await read_stream_writer.send(message)
-        except anyio.ClosedResourceError:
-            await anyio.lowlevel.checkpoint()
-    async def stdin_writer():
-        assert process.stdin, "Opened process is missing stdin"
-        try:
-            async with write_stream_reader:
-                async for message in write_stream_reader:
-                    json = message.model_dump_json(by_alias=True, exclude_none=True)
-                    await process.stdin.send(
-                        (json + "\n").encode(
-                            encoding=server.encoding,
-                            errors=server.encoding_error_handler,
-                        )
-                    )
-        except anyio.ClosedResourceError:
-            await anyio.lowlevel.checkpoint()
-    async def watch_process_exit():
-        returncode = await process.wait()
-        if returncode != 0:
-            raise RuntimeError(f"Subprocess exited with code {returncode}. Command: {server.command} {server.args}")
-    async with anyio.create_task_group() as tg, process:
-        tg.start_soon(stdout_reader)
-        tg.start_soon(stdin_writer)
-        tg.start_soon(watch_process_exit)
-        with anyio.move_on_after(0.2):
-            await anyio.sleep_forever()
-        yield read_stream, write_stream
+# class StdioMCPClient(BaseMCPClient):
+#    def _initialize_connection(self, server_config: StdioServerConfig, timeout: float) -> bool:
+#        try:
+#            server_params = StdioServerParameters(command=server_config.command, args=server_config.args, env=server_config.env)
+#            stdio_cm = forked_stdio_client(server_params)
+#            stdio_transport = self.loop.run_until_complete(asyncio.wait_for(stdio_cm.__aenter__(), timeout=timeout))
+#            self.stdio, self.write = stdio_transport
+#            self.cleanup_funcs.append(lambda: self.loop.run_until_complete(stdio_cm.__aexit__(None, None, None)))
+#
+#            session_cm = ClientSession(self.stdio, self.write)
+#            self.session = self.loop.run_until_complete(asyncio.wait_for(session_cm.__aenter__(), timeout=timeout))
+#            self.cleanup_funcs.append(lambda: self.loop.run_until_complete(session_cm.__aexit__(None, None, None)))
+#            return True
+#        except asyncio.TimeoutError:
+#            logger.error(f"Timed out while establishing stdio connection (timeout={timeout}s).")
+#            return False
+#        except Exception:
+#            logger.exception("Exception occurred while initializing stdio client session.")
+#            return False
+#
+#
+# @asynccontextmanager
+# async def forked_stdio_client(server: StdioServerParameters):
+#    """
+#    Client transport for stdio: this will connect to a server by spawning a
+#    process and communicating with it over stdin/stdout.
+#    """
+#    read_stream_writer, read_stream = anyio.create_memory_object_stream(0)
+#    write_stream, write_stream_reader = anyio.create_memory_object_stream(0)
+#
+#    try:
+#        process = await anyio.open_process(
+#            [server.command, *server.args],
+#            env=server.env or get_default_environment(),
+#            stderr=sys.stderr,  # Consider logging stderr somewhere instead of silencing it
+#        )
+#    except OSError as exc:
+#        raise RuntimeError(f"Failed to spawn process: {server.command} {server.args}") from exc
+#
+#    async def stdout_reader():
+#        assert process.stdout, "Opened process is missing stdout"
+#        buffer = ""
+#        try:
+#            async with read_stream_writer:
+#                async for chunk in TextReceiveStream(
+#                    process.stdout,
+#                    encoding=server.encoding,
+#                    errors=server.encoding_error_handler,
+#                ):
+#                    lines = (buffer + chunk).split("\n")
+#                    buffer = lines.pop()
+#                    for line in lines:
+#                        try:
+#                            message = types.JSONRPCMessage.model_validate_json(line)
+#                        except Exception as exc:
+#                            await read_stream_writer.send(exc)
+#                            continue
+#                        await read_stream_writer.send(message)
+#        except anyio.ClosedResourceError:
+#            await anyio.lowlevel.checkpoint()
+#
+#    async def stdin_writer():
+#        assert process.stdin, "Opened process is missing stdin"
+#        try:
+#            async with write_stream_reader:
+#                async for message in write_stream_reader:
+#                    json = message.model_dump_json(by_alias=True, exclude_none=True)
+#                    await process.stdin.send(
+#                        (json + "\n").encode(
+#                            encoding=server.encoding,
+#                            errors=server.encoding_error_handler,
+#                        )
+#                    )
+#        except anyio.ClosedResourceError:
+#            await anyio.lowlevel.checkpoint()
+#
+#    async def watch_process_exit():
+#        returncode = await process.wait()
+#        if returncode != 0:
+#            raise RuntimeError(f"Subprocess exited with code {returncode}. Command: {server.command} {server.args}")
+#
+#    async with anyio.create_task_group() as tg, process:
+#        tg.start_soon(stdout_reader)
+#        tg.start_soon(stdin_writer)
+#        tg.start_soon(watch_process_exit)
+#
+#        with anyio.move_on_after(0.2):
+#            await anyio.sleep_forever()
+#
+#        yield read_stream, write_stream
+#

letta/functions/schema_generator.py CHANGED Viewed

@@ -7,6 +7,7 @@ from docstring_parser import parse
 from pydantic import BaseModel
 from typing_extensions import Literal
+from letta.constants import REQUEST_HEARTBEAT_DESCRIPTION, REQUEST_HEARTBEAT_PARAM
 from letta.functions.mcp_client.types import MCPTool
@@ -143,7 +144,10 @@ def pydantic_model_to_open_ai(model: Type[BaseModel]) -> dict:
     parameters["required"] = sorted(k for k, v in parameters["properties"].items() if "default" not in v)
     if "description" not in schema:
-        if docstring.short_description:
+        # Support multiline docstrings for complex functions, TODO (cliandy): consider having this as a setting
+        if docstring.long_description:
+            schema["description"] = docstring.long_description
+        elif docstring.short_description:
             schema["description"] = docstring.short_description
         else:
             raise ValueError(f"No description found in docstring or description field (model: {model}, docstring: {docstring})")
@@ -330,10 +334,17 @@ def generate_schema(function, name: Optional[str] = None, description: Optional[
     # Parse the docstring
     docstring = parse(function.__doc__)
+    if not description:
+        # Support multiline docstrings for complex functions, TODO (cliandy): consider having this as a setting
+        if docstring.long_description:
+            description = docstring.long_description
+        else:
+            description = docstring.short_description
     # Prepare the schema dictionary
     schema = {
         "name": function.__name__ if name is None else name,
-        "description": docstring.short_description if description is None else description,
+        "description": description,
         "parameters": {"type": "object", "properties": {}, "required": []},
     }
@@ -412,17 +423,6 @@ def generate_schema(function, name: Optional[str] = None, description: Optional[
         # TODO is this not duplicating the other append directly above?
         if param.annotation == inspect.Parameter.empty:
             schema["parameters"]["required"].append(param.name)
-    # append the heartbeat
-    # TODO: don't hard-code
-    # TODO: if terminal, don't include this
-    # if function.__name__ not in ["send_message"]:
-    schema["parameters"]["properties"]["request_heartbeat"] = {
-        "type": "boolean",
-        "description": "Request an immediate heartbeat after function execution. Set to `True` if you want to send a follow-up message or run a follow-up function.",
-    }
-    schema["parameters"]["required"].append("request_heartbeat")
     return schema
@@ -445,11 +445,11 @@ def generate_schema_from_args_schema_v2(
     }
     if append_heartbeat:
-        function_call_json["parameters"]["properties"]["request_heartbeat"] = {
+        function_call_json["parameters"]["properties"][REQUEST_HEARTBEAT_PARAM] = {
             "type": "boolean",
-            "description": "Request an immediate heartbeat after function execution. Set to `True` if you want to send a follow-up message or run a follow-up function.",
+            "description": REQUEST_HEARTBEAT_DESCRIPTION,
         }
-        function_call_json["parameters"]["required"].append("request_heartbeat")
+        function_call_json["parameters"]["required"].append(REQUEST_HEARTBEAT_PARAM)
     return function_call_json
@@ -476,11 +476,11 @@ def generate_tool_schema_for_mcp(
     # Add the optional heartbeat parameter
     if append_heartbeat:
-        parameters_schema["properties"]["request_heartbeat"] = {
+        parameters_schema["properties"][REQUEST_HEARTBEAT_PARAM] = {
             "type": "boolean",
-            "description": "Request an immediate heartbeat after function execution. Set to `True` if you want to send a follow-up message or run a follow-up function.",
+            "description": REQUEST_HEARTBEAT_DESCRIPTION,
         }
-        parameters_schema["required"].append("request_heartbeat")
+        parameters_schema["required"].append(REQUEST_HEARTBEAT_PARAM)
     # Return the final schema
     if strict:
@@ -538,11 +538,11 @@ def generate_tool_schema_for_composio(
     # Add the optional heartbeat parameter
     if append_heartbeat:
-        properties_json["request_heartbeat"] = {
+        properties_json[REQUEST_HEARTBEAT_PARAM] = {
             "type": "boolean",
-            "description": "Request an immediate heartbeat after function execution. Set to `True` if you want to send a follow-up message or run a follow-up function.",
+            "description": REQUEST_HEARTBEAT_DESCRIPTION,
         }
-        required_fields.append("request_heartbeat")
+        required_fields.append(REQUEST_HEARTBEAT_PARAM)
     # Return the final schema
     if strict:

letta/groups/helpers.py CHANGED Viewed

@@ -2,13 +2,13 @@ import json
 from typing import Dict, Optional, Union
 from letta.agent import Agent
-from letta.functions.mcp_client.base_client import BaseMCPClient
 from letta.interface import AgentInterface
 from letta.orm.group import Group
 from letta.orm.user import User
 from letta.schemas.agent import AgentState
 from letta.schemas.group import ManagerType
 from letta.schemas.message import Message
+from letta.services.mcp.base_client import AsyncBaseMCPClient
 def load_multi_agent(
@@ -16,7 +16,7 @@ def load_multi_agent(
     agent_state: Optional[AgentState],
     actor: User,
     interface: Union[AgentInterface, None] = None,
-    mcp_clients: Optional[Dict[str, BaseMCPClient]] = None,
+    mcp_clients: Optional[Dict[str, AsyncBaseMCPClient]] = None,
 ) -> Agent:
     if len(group.agent_ids) == 0:
         raise ValueError("Empty group: group must have at least one agent")
@@ -76,7 +76,6 @@ def load_multi_agent(
                 agent_state=agent_state,
                 interface=interface,
                 user=actor,
-                mcp_clients=mcp_clients,
                 group_id=group.id,
                 agent_ids=group.agent_ids,
                 description=group.description,
@@ -108,7 +107,7 @@ def stringify_message(message: Message, use_assistant_name: bool = False) -> str
     elif message.role == "tool":
         if message.content:
             content = json.loads(message.content[0].text)
-            if content["message"] != "None" and content["message"] != None:
+            if str(content["message"]) != "None":
                 return f"{assistant_name}: Tool call returned {content['message']}"
         return None
     elif message.role == "system":

letta/groups/sleeptime_multi_agent.py CHANGED Viewed

@@ -1,10 +1,9 @@
 import asyncio
 import threading
 from datetime import datetime, timezone
-from typing import Dict, List, Optional
+from typing import List, Optional
 from letta.agent import Agent, AgentState
-from letta.functions.mcp_client.base_client import BaseMCPClient
 from letta.groups.helpers import stringify_message
 from letta.interface import AgentInterface
 from letta.orm import User
@@ -27,7 +26,7 @@ class SleeptimeMultiAgent(Agent):
         interface: AgentInterface,
         agent_state: AgentState,
         user: User,
-        mcp_clients: Optional[Dict[str, BaseMCPClient]] = None,
+        # mcp_clients: Optional[Dict[str, BaseMCPClient]] = None,
         # custom
         group_id: str = "",
         agent_ids: List[str] = [],
@@ -42,7 +41,8 @@ class SleeptimeMultiAgent(Agent):
         self.group_manager = GroupManager()
         self.message_manager = MessageManager()
         self.job_manager = JobManager()
-        self.mcp_clients = mcp_clients
+        # TODO: add back MCP support with new agent loop
+        self.mcp_clients = {}
     def _run_async_in_new_thread(self, coro):
         """Run an async coroutine in a new thread with its own event loop"""

letta/groups/sleeptime_multi_agent_v2.py CHANGED Viewed

@@ -21,6 +21,7 @@ from letta.services.message_manager import MessageManager
 from letta.services.passage_manager import PassageManager
 from letta.services.step_manager import NoopStepManager, StepManager
 from letta.services.telemetry_manager import NoopTelemetryManager, TelemetryManager
+from letta.tracing import trace_method
 class SleeptimeMultiAgentV2(BaseAgent):
@@ -55,11 +56,13 @@ class SleeptimeMultiAgentV2(BaseAgent):
         assert group.manager_type == ManagerType.sleeptime, f"Expected group manager type to be 'sleeptime', got {group.manager_type}"
         self.group = group
+    @trace_method
     async def step(
         self,
         input_messages: List[MessageCreate],
         max_steps: int = 10,
         use_assistant_message: bool = True,
+        request_start_timestamp_ns: Optional[int] = None,
     ) -> LettaResponse:
         run_ids = []
@@ -119,6 +122,22 @@ class SleeptimeMultiAgentV2(BaseAgent):
         response.usage.run_ids = run_ids
         return response
+    @trace_method
+    async def step_stream_no_tokens(
+        self,
+        input_messages: List[MessageCreate],
+        max_steps: int = 10,
+        use_assistant_message: bool = True,
+        request_start_timestamp_ns: Optional[int] = None,
+    ):
+        response = await self.step(input_messages, max_steps, use_assistant_message)
+        for message in response.messages:
+            yield f"data: {message.model_dump_json()}\n\n"
+        yield f"data: {response.usage.model_dump_json()}\n\n"
+    @trace_method
     async def step_stream(
         self,
         input_messages: List[MessageCreate],
@@ -256,6 +275,9 @@ class SleeptimeMultiAgentV2(BaseAgent):
                 actor=self.actor,
                 step_manager=self.step_manager,
                 telemetry_manager=self.telemetry_manager,
+                message_buffer_limit=20,  # TODO: Make this configurable
+                message_buffer_min=8,  # TODO: Make this configurable
+                enable_summarization=False,  # TODO: Make this configurable
             )
             # Perform sleeptime agent step

letta/helpers/composio_helpers.py CHANGED Viewed

@@ -20,3 +20,19 @@ def get_composio_api_key(actor: User, logger: Optional[Logger] = None) -> Option
         # Ideally, not tied to a specific sandbox, but for now we just get the first one
         # Theoretically possible for someone to have different composio api keys per sandbox
         return api_keys[0].value
+async def get_composio_api_key_async(actor: User, logger: Optional[Logger] = None) -> Optional[str]:
+    api_keys = await SandboxConfigManager().list_sandbox_env_vars_by_key_async(key="COMPOSIO_API_KEY", actor=actor)
+    if not api_keys:
+        if logger:
+            logger.debug(f"No API keys found for Composio. Defaulting to the environment variable...")
+        if tool_settings.composio_api_key:
+            return tool_settings.composio_api_key
+        else:
+            return None
+    else:
+        # TODO: Add more protections around this
+        # Ideally, not tied to a specific sandbox, but for now we just get the first one
+        # Theoretically possible for someone to have different composio api keys per sandbox
+        return api_keys[0].value

letta/helpers/converters.py CHANGED Viewed

@@ -7,6 +7,7 @@ from openai.types.chat.chat_completion_message_tool_call import ChatCompletionMe
 from openai.types.chat.chat_completion_message_tool_call import Function as OpenAIFunction
 from sqlalchemy import Dialect
+from letta.functions.mcp_client.types import StdioServerConfig
 from letta.schemas.agent import AgentStepState
 from letta.schemas.embedding_config import EmbeddingConfig
 from letta.schemas.enums import ProviderType, ToolRuleType
@@ -400,3 +401,22 @@ def deserialize_response_format(data: Optional[Dict]) -> Optional[ResponseFormat
         return JsonSchemaResponseFormat(**data)
     if data["type"] == ResponseFormatType.json_object:
         return JsonObjectResponseFormat(**data)
+# --------------------------
+# MCP Stdio Server Config Serialization
+# --------------------------
+def serialize_mcp_stdio_config(config: Union[Optional[StdioServerConfig], Dict]) -> Optional[Dict]:
+    """Convert an StdioServerConfig object into a JSON-serializable dictionary."""
+    if config and isinstance(config, StdioServerConfig):
+        return config.to_dict()
+    return config
+def deserialize_mcp_stdio_config(data: Optional[Dict]) -> Optional[StdioServerConfig]:
+    """Convert a dictionary back into an StdioServerConfig object."""
+    if not data:
+        return None
+    return StdioServerConfig(**data)

letta/helpers/datetime_helpers.py CHANGED Viewed

@@ -16,11 +16,6 @@ def datetime_to_timestamp(dt):
     return int(dt.timestamp())
-def timestamp_to_datetime(ts):
-    # convert integer timestamp to datetime object
-    return datetime.fromtimestamp(ts)
 def get_local_time_military():
     # Get the current time in UTC
     current_time_utc = datetime.now(pytz.utc)
@@ -36,7 +31,7 @@ def get_local_time_military():
 def get_local_time_fast():
-    formatted_time = strftime("%Y-%m-%d %H:%M:%S")
+    formatted_time = strftime("%Y-%m-%d %I:%M:%S %p %Z%z")
     return formatted_time

letta/helpers/tool_rule_solver.py CHANGED Viewed

@@ -141,7 +141,8 @@ class ToolRulesSolver(BaseModel):
         """Check if the tool is defined as a continue tool in the tool rules."""
         return any(rule.tool_name == tool_name for rule in self.continue_tool_rules)
-    def validate_conditional_tool(self, rule: ConditionalToolRule):
+    @staticmethod
+    def validate_conditional_tool(rule: ConditionalToolRule):
         """
         Validate a conditional tool rule

letta/interfaces/anthropic_streaming_interface.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import json
 from datetime import datetime, timezone
 from enum import Enum
-from typing import AsyncGenerator, List, Union
+from typing import AsyncGenerator, List, Optional, Union
 from anthropic import AsyncStream
 from anthropic.types.beta import (
@@ -23,6 +23,7 @@ from anthropic.types.beta import (
 )
 from letta.constants import DEFAULT_MESSAGE_TOOL, DEFAULT_MESSAGE_TOOL_KWARG
+from letta.helpers.datetime_helpers import get_utc_timestamp_ns
 from letta.local_llm.constants import INNER_THOUGHTS_KWARG
 from letta.log import get_logger
 from letta.schemas.letta_message import (
@@ -115,12 +116,26 @@ class AnthropicStreamingInterface:
             logger.error("Error checking inner thoughts: %s", e)
             raise
-    async def process(self, stream: AsyncStream[BetaRawMessageStreamEvent]) -> AsyncGenerator[LettaMessage, None]:
+    async def process(
+        self,
+        stream: AsyncStream[BetaRawMessageStreamEvent],
+        ttft_span: Optional["Span"] = None,
+        provider_request_start_timestamp_ns: Optional[int] = None,
+    ) -> AsyncGenerator[LettaMessage, None]:
         prev_message_type = None
         message_index = 0
+        first_chunk = True
         try:
             async with stream:
                 async for event in stream:
+                    if first_chunk and ttft_span is not None and provider_request_start_timestamp_ns is not None:
+                        now = get_utc_timestamp_ns()
+                        ttft_ns = now - provider_request_start_timestamp_ns
+                        ttft_span.add_event(
+                            name="anthropic_time_to_first_token_ms", attributes={"anthropic_time_to_first_token_ms": ttft_ns // 1_000_000}
+                        )
+                        first_chunk = False
                     # TODO: Support BetaThinkingBlock, BetaRedactedThinkingBlock
                     if isinstance(event, BetaRawContentBlockStartEvent):
                         content = event.content_block

letta/interfaces/openai_chat_completions_streaming_interface.py CHANGED Viewed

@@ -16,6 +16,7 @@ class OpenAIChatCompletionsStreamingInterface:
     """
     def __init__(self, stream_pre_execution_message: bool = True):
+        print("CHAT COMPLETITION INTERFACE")
         self.optimistic_json_parser: OptimisticJSONParser = OptimisticJSONParser()
         self.stream_pre_execution_message: bool = stream_pre_execution_message

letta/interfaces/openai_streaming_interface.py CHANGED Viewed

@@ -5,6 +5,7 @@ from openai import AsyncStream
 from openai.types.chat.chat_completion_chunk import ChatCompletionChunk
 from letta.constants import DEFAULT_MESSAGE_TOOL, DEFAULT_MESSAGE_TOOL_KWARG
+from letta.helpers.datetime_helpers import get_utc_timestamp_ns
 from letta.schemas.letta_message import AssistantMessage, LettaMessage, ReasoningMessage, ToolCallDelta, ToolCallMessage
 from letta.schemas.letta_message_content import TextContent
 from letta.schemas.message import Message
@@ -26,7 +27,7 @@ class OpenAIStreamingInterface:
         self.assistant_message_tool_kwarg = DEFAULT_MESSAGE_TOOL_KWARG
         self.optimistic_json_parser: OptimisticJSONParser = OptimisticJSONParser()
-        self.function_args_reader = JSONInnerThoughtsExtractor(wait_for_first_key=True)  # TODO: pass in kward
+        self.function_args_reader = JSONInnerThoughtsExtractor(wait_for_first_key=True)  # TODO: pass in kwarg
         self.function_name_buffer = None
         self.function_args_buffer = None
         self.function_id_buffer = None
@@ -64,15 +65,30 @@ class OpenAIStreamingInterface:
             function=FunctionCall(arguments=self.current_function_arguments, name=function_name),
         )
-    async def process(self, stream: AsyncStream[ChatCompletionChunk]) -> AsyncGenerator[LettaMessage, None]:
+    async def process(
+        self,
+        stream: AsyncStream[ChatCompletionChunk],
+        ttft_span: Optional["Span"] = None,
+        provider_request_start_timestamp_ns: Optional[int] = None,
+    ) -> AsyncGenerator[LettaMessage, None]:
         """
         Iterates over the OpenAI stream, yielding SSE events.
         It also collects tokens and detects if a tool call is triggered.
         """
+        first_chunk = True
         async with stream:
             prev_message_type = None
             message_index = 0
             async for chunk in stream:
+                if first_chunk and ttft_span is not None and provider_request_start_timestamp_ns is not None:
+                    now = get_utc_timestamp_ns()
+                    ttft_ns = now - provider_request_start_timestamp_ns
+                    ttft_span.add_event(
+                        name="openai_time_to_first_token_ms", attributes={"openai_time_to_first_token_ms": ttft_ns // 1_000_000}
+                    )
+                    first_chunk = False
                 if not self.model or not self.message_id:
                     self.model = chunk.model
                     self.message_id = chunk.id

letta/jobs/llm_batch_job_polling.py CHANGED Viewed

@@ -238,4 +238,4 @@ async def poll_running_llm_batches(server: "SyncServer") -> List[LettaBatchRespo
         logger.exception("[Poll BatchJob] Unhandled error in poll_running_llm_batches", exc_info=e)
     finally:
         # 7. Log metrics summary
-        metrics.log_summary()
+        metrics.log_summary()

letta/jobs/scheduler.py CHANGED Viewed

@@ -252,4 +252,4 @@ async def shutdown_scheduler_and_release_lock():
         try:
             scheduler.shutdown(wait=False)
         except:
-            pass
+            pass

letta-nightly 0.7.29.dev20250602104315__py3-none-any.whl → 0.8.0.dev20250604104349__py3-none-any.whl

letta-nightly 0.7.29.dev20250602104315py3-none-any.whl → 0.8.0.dev20250604104349py3-none-any.whl