PyPI - letta-nightly - Versions diffs - 0.12.1.dev20251023104211__py3-none-any.whl → 0.13.0.dev20251024223017__py3-none-any.whl - Mend

letta-nightly 0.12.1.dev20251023104211py3-none-any.whl → 0.13.0.dev20251024223017py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of letta-nightly might be problematic. Click here for more details.

Files changed (159) hide show

letta/__init__.py +2 -3
letta/adapters/letta_llm_adapter.py +1 -0
letta/adapters/simple_llm_request_adapter.py +8 -5
letta/adapters/simple_llm_stream_adapter.py +22 -6
letta/agents/agent_loop.py +10 -3
letta/agents/base_agent.py +4 -1
letta/agents/helpers.py +41 -9
letta/agents/letta_agent.py +11 -10
letta/agents/letta_agent_v2.py +47 -37
letta/agents/letta_agent_v3.py +395 -300
letta/agents/voice_agent.py +8 -6
letta/agents/voice_sleeptime_agent.py +3 -3
letta/constants.py +30 -7
letta/errors.py +20 -0
letta/functions/function_sets/base.py +55 -3
letta/functions/mcp_client/types.py +33 -57
letta/functions/schema_generator.py +135 -23
letta/groups/sleeptime_multi_agent_v3.py +6 -11
letta/groups/sleeptime_multi_agent_v4.py +227 -0
letta/helpers/converters.py +78 -4
letta/helpers/crypto_utils.py +6 -2
letta/interfaces/anthropic_parallel_tool_call_streaming_interface.py +9 -11
letta/interfaces/anthropic_streaming_interface.py +3 -4
letta/interfaces/gemini_streaming_interface.py +4 -6
letta/interfaces/openai_streaming_interface.py +63 -28
letta/llm_api/anthropic_client.py +7 -4
letta/llm_api/deepseek_client.py +6 -4
letta/llm_api/google_ai_client.py +3 -12
letta/llm_api/google_vertex_client.py +1 -1
letta/llm_api/helpers.py +90 -61
letta/llm_api/llm_api_tools.py +4 -1
letta/llm_api/openai.py +12 -12
letta/llm_api/openai_client.py +53 -16
letta/local_llm/constants.py +4 -3
letta/local_llm/json_parser.py +5 -2
letta/local_llm/utils.py +2 -3
letta/log.py +171 -7
letta/orm/agent.py +43 -9
letta/orm/archive.py +4 -0
letta/orm/custom_columns.py +15 -0
letta/orm/identity.py +11 -11
letta/orm/mcp_server.py +9 -0
letta/orm/message.py +6 -1
letta/orm/run_metrics.py +7 -2
letta/orm/sqlalchemy_base.py +2 -2
letta/orm/tool.py +3 -0
letta/otel/tracing.py +2 -0
letta/prompts/prompt_generator.py +7 -2
letta/schemas/agent.py +41 -10
letta/schemas/agent_file.py +3 -0
letta/schemas/archive.py +4 -2
letta/schemas/block.py +2 -1
letta/schemas/enums.py +36 -3
letta/schemas/file.py +3 -3
letta/schemas/folder.py +2 -1
letta/schemas/group.py +2 -1
letta/schemas/identity.py +18 -9
letta/schemas/job.py +3 -1
letta/schemas/letta_message.py +71 -12
letta/schemas/letta_request.py +7 -3
letta/schemas/letta_stop_reason.py +0 -25
letta/schemas/llm_config.py +8 -2
letta/schemas/mcp.py +80 -83
letta/schemas/mcp_server.py +349 -0
letta/schemas/memory.py +20 -8
letta/schemas/message.py +212 -67
letta/schemas/providers/anthropic.py +13 -6
letta/schemas/providers/azure.py +6 -4
letta/schemas/providers/base.py +8 -4
letta/schemas/providers/bedrock.py +6 -2
letta/schemas/providers/cerebras.py +7 -3
letta/schemas/providers/deepseek.py +2 -1
letta/schemas/providers/google_gemini.py +15 -6
letta/schemas/providers/groq.py +2 -1
letta/schemas/providers/lmstudio.py +9 -6
letta/schemas/providers/mistral.py +2 -1
letta/schemas/providers/openai.py +7 -2
letta/schemas/providers/together.py +9 -3
letta/schemas/providers/xai.py +7 -3
letta/schemas/run.py +7 -2
letta/schemas/run_metrics.py +2 -1
letta/schemas/sandbox_config.py +2 -2
letta/schemas/secret.py +3 -158
letta/schemas/source.py +2 -2
letta/schemas/step.py +2 -2
letta/schemas/tool.py +24 -1
letta/schemas/usage.py +0 -1
letta/server/rest_api/app.py +123 -7
letta/server/rest_api/dependencies.py +3 -0
letta/server/rest_api/interface.py +7 -4
letta/server/rest_api/redis_stream_manager.py +16 -1
letta/server/rest_api/routers/v1/__init__.py +7 -0
letta/server/rest_api/routers/v1/agents.py +332 -322
letta/server/rest_api/routers/v1/archives.py +127 -40
letta/server/rest_api/routers/v1/blocks.py +54 -6
letta/server/rest_api/routers/v1/chat_completions.py +146 -0
letta/server/rest_api/routers/v1/folders.py +27 -35
letta/server/rest_api/routers/v1/groups.py +23 -35
letta/server/rest_api/routers/v1/identities.py +24 -10
letta/server/rest_api/routers/v1/internal_runs.py +107 -0
letta/server/rest_api/routers/v1/internal_templates.py +162 -179
letta/server/rest_api/routers/v1/jobs.py +15 -27
letta/server/rest_api/routers/v1/mcp_servers.py +309 -0
letta/server/rest_api/routers/v1/messages.py +23 -34
letta/server/rest_api/routers/v1/organizations.py +6 -27
letta/server/rest_api/routers/v1/providers.py +35 -62
letta/server/rest_api/routers/v1/runs.py +30 -43
letta/server/rest_api/routers/v1/sandbox_configs.py +6 -4
letta/server/rest_api/routers/v1/sources.py +26 -42
letta/server/rest_api/routers/v1/steps.py +16 -29
letta/server/rest_api/routers/v1/tools.py +17 -13
letta/server/rest_api/routers/v1/users.py +5 -17
letta/server/rest_api/routers/v1/voice.py +18 -27
letta/server/rest_api/streaming_response.py +5 -2
letta/server/rest_api/utils.py +187 -25
letta/server/server.py +27 -22
letta/server/ws_api/server.py +5 -4
letta/services/agent_manager.py +148 -26
letta/services/agent_serialization_manager.py +6 -1
letta/services/archive_manager.py +168 -15
letta/services/block_manager.py +14 -4
letta/services/file_manager.py +33 -29
letta/services/group_manager.py +10 -0
letta/services/helpers/agent_manager_helper.py +65 -11
letta/services/identity_manager.py +105 -4
letta/services/job_manager.py +11 -1
letta/services/mcp/base_client.py +2 -2
letta/services/mcp/oauth_utils.py +33 -8
letta/services/mcp_manager.py +174 -78
letta/services/mcp_server_manager.py +1331 -0
letta/services/message_manager.py +109 -4
letta/services/organization_manager.py +4 -4
letta/services/passage_manager.py +9 -25
letta/services/provider_manager.py +91 -15
letta/services/run_manager.py +72 -15
letta/services/sandbox_config_manager.py +45 -3
letta/services/source_manager.py +15 -8
letta/services/step_manager.py +24 -1
letta/services/streaming_service.py +581 -0
letta/services/summarizer/summarizer.py +1 -1
letta/services/tool_executor/core_tool_executor.py +111 -0
letta/services/tool_executor/files_tool_executor.py +5 -3
letta/services/tool_executor/sandbox_tool_executor.py +2 -2
letta/services/tool_executor/tool_execution_manager.py +1 -1
letta/services/tool_manager.py +10 -3
letta/services/tool_sandbox/base.py +61 -1
letta/services/tool_sandbox/local_sandbox.py +1 -3
letta/services/user_manager.py +2 -2
letta/settings.py +49 -5
letta/system.py +14 -5
letta/utils.py +73 -1
letta/validators.py +105 -0
{letta_nightly-0.12.1.dev20251023104211.dist-info → letta_nightly-0.13.0.dev20251024223017.dist-info}/METADATA +4 -2
{letta_nightly-0.12.1.dev20251023104211.dist-info → letta_nightly-0.13.0.dev20251024223017.dist-info}/RECORD +157 -151
letta/schemas/letta_ping.py +0 -28
letta/server/rest_api/routers/openai/chat_completions/__init__.py +0 -0
{letta_nightly-0.12.1.dev20251023104211.dist-info → letta_nightly-0.13.0.dev20251024223017.dist-info}/WHEEL +0 -0
{letta_nightly-0.12.1.dev20251023104211.dist-info → letta_nightly-0.13.0.dev20251024223017.dist-info}/entry_points.txt +0 -0
{letta_nightly-0.12.1.dev20251023104211.dist-info → letta_nightly-0.13.0.dev20251024223017.dist-info}/licenses/LICENSE +0 -0

letta/schemas/message.py CHANGED Viewed

@@ -1,15 +1,19 @@
 from __future__ import annotations
+from letta.log import get_logger
+logger = get_logger(__name__)
 import copy
 import json
 import re
 import uuid
-import warnings
 from collections import OrderedDict
 from datetime import datetime, timezone
 from enum import Enum
 from typing import Annotated, Any, Dict, List, Literal, Optional, Union
+from letta_client import LettaMessageUnion
 from openai.types.chat.chat_completion_message_tool_call import ChatCompletionMessageToolCall as OpenAIToolCall, Function as OpenAIFunction
 from openai.types.responses import ResponseReasoningItem
 from pydantic import BaseModel, Field, field_validator, model_validator
@@ -18,19 +22,22 @@ from letta.constants import DEFAULT_MESSAGE_TOOL, DEFAULT_MESSAGE_TOOL_KWARG, RE
 from letta.helpers.datetime_helpers import get_utc_time, is_utc_datetime
 from letta.helpers.json_helpers import json_dumps
 from letta.local_llm.constants import INNER_THOUGHTS_KWARG, INNER_THOUGHTS_KWARG_VERTEX
-from letta.schemas.enums import MessageRole
+from letta.schemas.enums import MessageRole, PrimitiveType
 from letta.schemas.letta_base import OrmMetadataBase
 from letta.schemas.letta_message import (
     ApprovalRequestMessage,
     ApprovalResponseMessage,
+    ApprovalReturn,
     AssistantMessage,
     HiddenReasoningMessage,
     LettaMessage,
+    LettaMessageReturnUnion,
     MessageType,
     ReasoningMessage,
     SystemMessage,
     ToolCall,
     ToolCallMessage,
+    ToolReturn as LettaToolReturn,
     ToolReturnMessage,
     UserMessage,
 )
@@ -68,7 +75,7 @@ def add_inner_thoughts_to_tool_call(
         updated_tool_call.function.arguments = json_dumps(ordered_args)
         return updated_tool_call
     except json.JSONDecodeError as e:
-        warnings.warn(f"Failed to put inner thoughts in kwargs: {e}")
+        logger.warning(f"Failed to put inner thoughts in kwargs: {e}")
         raise e
@@ -116,9 +123,22 @@ class ApprovalCreate(MessageCreateBase):
     """Input to approve or deny a tool call request"""
     type: Literal[MessageCreateType.approval] = Field(default=MessageCreateType.approval, description="The message type to be created.")
-    approve: bool = Field(..., description="Whether the tool has been approved")
-    approval_request_id: str = Field(..., description="The message ID of the approval request")
-    reason: Optional[str] = Field(None, description="An optional explanation for the provided approval status")
+    approvals: Optional[List[LettaMessageReturnUnion]] = Field(default=None, description="The list of approval responses")
+    approve: Optional[bool] = Field(None, description="Whether the tool has been approved", deprecated=True)
+    approval_request_id: Optional[str] = Field(None, description="The message ID of the approval request", deprecated=True)
+    reason: Optional[str] = Field(None, description="An optional explanation for the provided approval status", deprecated=True)
+    @model_validator(mode="after")
+    def migrate_deprecated_fields(self):
+        if not self.approvals and self.approve is not None and self.approval_request_id is not None:
+            self.approvals = [
+                ApprovalReturn(
+                    tool_call_id=self.approval_request_id,
+                    approve=self.approve,
+                    reason=self.reason,
+                )
+            ]
+        return self
 MessageCreateUnion = Union[MessageCreate, ApprovalCreate]
@@ -153,7 +173,7 @@ class MessageUpdate(BaseModel):
 class BaseMessage(OrmMetadataBase):
-    __id_prefix__ = "message"
+    __id_prefix__ = PrimitiveType.MESSAGE.value
 class Message(BaseMessage):
@@ -210,6 +230,7 @@ class Message(BaseMessage):
     )
     approve: Optional[bool] = Field(default=None, description="Whether tool call is approved.")
     denial_reason: Optional[str] = Field(default=None, description="The reason the tool call request was denied.")
+    approvals: Optional[List[ApprovalReturn | ToolReturn]] = Field(default=None, description="The list of approvals for this message.")
     # This overrides the optional base orm schema, created_at MUST exist on all messages objects
     created_at: datetime = Field(default_factory=get_utc_time, description="The timestamp when the object was created.")
@@ -313,7 +334,7 @@ class Message(BaseMessage):
                     ),
                 )
         elif self.role == MessageRole.tool:
-            messages.extend(self._convert_tool_return_message())
+            messages.append(self._convert_tool_return_message())
         elif self.role == MessageRole.user:
             messages.append(self._convert_user_message())
         elif self.role == MessageRole.system:
@@ -322,20 +343,52 @@ class Message(BaseMessage):
             if self.content:
                 messages.extend(self._convert_reasoning_messages(text_is_assistant_message=text_is_assistant_message))
             if self.tool_calls is not None:
-                tool_calls = self._convert_tool_call_messages()
-                assert len(tool_calls) == 1
-                approval_request_message = ApprovalRequestMessage(**tool_calls[0].model_dump(exclude={"message_type"}))
-                messages.append(approval_request_message)
+                messages.append(self._convert_approval_request_message())
             else:
-                approval_response_message = ApprovalResponseMessage(
-                    id=self.id,
-                    date=self.created_at,
-                    otid=self.otid,
-                    approve=self.approve,
-                    approval_request_id=self.approval_request_id,
-                    reason=self.denial_reason,
-                    run_id=self.run_id,
-                )
+                if self.approvals:
+                    first_approval = [a for a in self.approvals if isinstance(a, ApprovalReturn)]
+                    def maybe_convert_tool_return_message(maybe_tool_return):
+                        if isinstance(maybe_tool_return, ToolReturn):
+                            parsed_data = self._parse_tool_response(maybe_tool_return.func_response)
+                            return LettaToolReturn(
+                                tool_call_id=maybe_tool_return.tool_call_id,
+                                status=maybe_tool_return.status,
+                                tool_return=parsed_data["message"],
+                                stdout=maybe_tool_return.stdout,
+                                stderr=maybe_tool_return.stderr,
+                            )
+                        return maybe_tool_return
+                    approval_response_message = ApprovalResponseMessage(
+                        id=self.id,
+                        date=self.created_at,
+                        otid=self.otid,
+                        approvals=[maybe_convert_tool_return_message(approval) for approval in self.approvals],
+                        run_id=self.run_id,
+                        # TODO: temporary populate these fields for backwards compatibility
+                        approve=first_approval[0].approve if first_approval else None,
+                        approval_request_id=first_approval[0].tool_call_id if first_approval else None,
+                        reason=first_approval[0].reason if first_approval else None,
+                    )
+                else:
+                    approval_response_message = ApprovalResponseMessage(
+                        id=self.id,
+                        date=self.created_at,
+                        otid=self.otid,
+                        approve=self.approve,
+                        approval_request_id=self.approval_request_id,
+                        reason=self.denial_reason,
+                        approvals=[
+                            # TODO: temporary workaround to populate from legacy fields
+                            ApprovalReturn(
+                                tool_call_id=self.approval_request_id,
+                                approve=self.approve,
+                                reason=self.denial_reason,
+                            )
+                        ],
+                        run_id=self.run_id,
+                    )
                 messages.append(approval_response_message)
         else:
             raise ValueError(f"Unknown role: {self.role}")
@@ -460,7 +513,7 @@ class Message(BaseMessage):
                 )
             else:
-                warnings.warn(f"Unrecognized content part in assistant message: {content_part}")
+                logger.warning(f"Unrecognized content part in assistant message: {content_part}")
         return messages
@@ -592,7 +645,7 @@ class Message(BaseMessage):
         return messages
-    def _convert_tool_return_message(self) -> List[ToolReturnMessage]:
+    def _convert_tool_return_message(self) -> ToolReturnMessage:
         """Convert tool role message to ToolReturnMessage.
         The tool return is packaged as follows:
@@ -603,7 +656,7 @@ class Message(BaseMessage):
             }
         Returns:
-            List[ToolReturnMessage]: Converted tool return messages
+            ToolReturnMessage: Converted tool return message
         Raises:
             ValueError: If message role is not 'tool', parsing fails, or no valid content exists
@@ -623,27 +676,47 @@ class Message(BaseMessage):
         return self._convert_legacy_tool_return()
-    def _convert_explicit_tool_returns(self) -> List[ToolReturnMessage]:
-        """Convert explicit tool returns to ToolReturnMessage list."""
-        tool_returns = []
-        for index, tool_return in enumerate(self.tool_returns):
+    def _convert_explicit_tool_returns(self) -> ToolReturnMessage:
+        """Convert explicit tool returns to a single ToolReturnMessage."""
+        # build list of all tool return objects
+        all_tool_returns = []
+        for tool_return in self.tool_returns:
             parsed_data = self._parse_tool_response(tool_return.func_response)
-            tool_returns.append(
-                self._create_tool_return_message(
-                    message_text=parsed_data["message"],
-                    status=parsed_data["status"],
-                    tool_call_id=tool_return.tool_call_id,
-                    stdout=tool_return.stdout,
-                    stderr=tool_return.stderr,
-                    otid_index=index,
-                )
+            tool_return_obj = LettaToolReturn(
+                tool_return=parsed_data["message"],
+                status=parsed_data["status"],
+                tool_call_id=tool_return.tool_call_id,
+                stdout=tool_return.stdout,
+                stderr=tool_return.stderr,
             )
+            all_tool_returns.append(tool_return_obj)
+        if not all_tool_returns:
+            # this should not happen if tool_returns is non-empty, but handle gracefully
+            raise ValueError("No tool returns to convert")
+        first_tool_return = all_tool_returns[0]
-        return tool_returns
+        return ToolReturnMessage(
+            id=self.id,
+            date=self.created_at,
+            # deprecated top-level fields populated from first tool return
+            tool_return=first_tool_return.tool_return,
+            status=first_tool_return.status,
+            tool_call_id=first_tool_return.tool_call_id,
+            stdout=first_tool_return.stdout,
+            stderr=first_tool_return.stderr,
+            tool_returns=all_tool_returns,
+            name=self.name,
+            otid=Message.generate_otid_from_id(self.id, 0),
+            sender_id=self.sender_id,
+            step_id=self.step_id,
+            is_err=self.is_err,
+            run_id=self.run_id,
+        )
-    def _convert_legacy_tool_return(self) -> List[ToolReturnMessage]:
+    def _convert_legacy_tool_return(self) -> ToolReturnMessage:
         """Convert legacy single text content to ToolReturnMessage."""
         if not self._has_single_text_content():
             raise ValueError(f"No valid tool returns to convert: {self}")
@@ -651,16 +724,14 @@ class Message(BaseMessage):
         text_content = self.content[0].text
         parsed_data = self._parse_tool_response(text_content)
-        return [
-            self._create_tool_return_message(
-                message_text=parsed_data["message"],
-                status=parsed_data["status"],
-                tool_call_id=self.tool_call_id,
-                stdout=None,
-                stderr=None,
-                otid_index=0,
-            )
-        ]
+        return self._create_tool_return_message(
+            message_text=parsed_data["message"],
+            status=parsed_data["status"],
+            tool_call_id=self.tool_call_id,
+            stdout=None,
+            stderr=None,
+            otid_index=0,
+        )
     def _has_single_text_content(self) -> bool:
         """Check if message has exactly one text content item."""
@@ -709,9 +780,7 @@ class Message(BaseMessage):
         Returns:
             Configured ToolReturnMessage instance
         """
-        from letta.schemas.letta_message import ToolReturn as ToolReturnSchema
-        tool_return_obj = ToolReturnSchema(
+        tool_return_obj = LettaToolReturn(
             tool_return=message_text,
             status=status,
             tool_call_id=tool_call_id,
@@ -746,6 +815,28 @@ class Message(BaseMessage):
         else:
             raise ValueError(f"Invalid status: {status}")
+    def _convert_approval_request_message(self) -> ApprovalRequestMessage:
+        """Convert approval request message to ApprovalRequestMessage"""
+        def _convert_tool_call(tool_call):
+            return ToolCall(
+                name=tool_call.function.name,
+                arguments=tool_call.function.arguments,
+                tool_call_id=tool_call.id,
+            )
+        return ApprovalRequestMessage(
+            id=self.id,
+            date=self.created_at,
+            otid=self.otid,
+            sender_id=self.sender_id,
+            step_id=self.step_id,
+            run_id=self.run_id,
+            tool_call=_convert_tool_call(self.tool_calls[0]),  # backwards compatibility
+            tool_calls=[_convert_tool_call(tc) for tc in self.tool_calls],
+            name=self.name,
+        )
     def _convert_user_message(self) -> UserMessage:
         """Convert user role message to UserMessage"""
         # Extract text content
@@ -816,6 +907,12 @@ class Message(BaseMessage):
             [TextContent(text=openai_message_dict["content"])] if openai_message_dict["content"] else []
         )
+        # This is really hacky and this interface is poorly designed, we should auto derive tool_returns instead of passing it in
+        if not tool_returns:
+            tool_returns = []
+            if "tool_returns" in openai_message_dict:
+                tool_returns = [ToolReturn(**tr) for tr in openai_message_dict["tool_returns"]]
         # TODO(caren) bad assumption here that "reasoning_content" always comes before "redacted_reasoning_content"
         if "reasoning_content" in openai_message_dict and openai_message_dict["reasoning_content"]:
             content.append(
@@ -1099,7 +1196,7 @@ class Message(BaseMessage):
             if bool(re.match(r"^[^\s<|\\/>]+$", self.name)):
                 openai_message["name"] = self.name
             else:
-                warnings.warn(f"Using OpenAI with invalid 'name' field (name={self.name} role={self.role}).")
+                logger.warning(f"Using OpenAI with invalid 'name' field (name={self.name} role={self.role}).")
         if parse_content_parts and self.content is not None:
             for content in self.content:
@@ -1166,7 +1263,7 @@ class Message(BaseMessage):
                 if bool(re.match(r"^[^\s<|\\/>]+$", self.name)):
                     user_dict["name"] = self.name
                 else:
-                    warnings.warn(f"Using OpenAI with invalid 'name' field (name={self.name} role={self.role}).")
+                    logger.warning(f"Using OpenAI with invalid 'name' field (name={self.name} role={self.role}).")
             message_dicts.append(user_dict)
@@ -1414,18 +1511,38 @@ class Message(BaseMessage):
         elif self.role == "tool":
             # NOTE: Anthropic uses role "user" for "tool" responses
-            assert self.tool_call_id is not None, vars(self)
-            anthropic_message = {
-                "role": "user",  # NOTE: diff
-                "content": [
-                    # TODO support error types etc
+            content = []
+            for tool_return in self.tool_returns:
+                if not tool_return.tool_call_id:
+                    raise TypeError("Anthropic API requires tool_use_id to be set.")
+                content.append(
                     {
                         "type": "tool_result",
-                        "tool_use_id": self.tool_call_id,
-                        "content": text_content,
+                        "tool_use_id": tool_return.tool_call_id,
+                        "content": tool_return.func_response,
                     }
-                ],
-            }
+                )
+            if content:
+                anthropic_message = {
+                    "role": "user",
+                    "content": content,
+                }
+            else:
+                if not self.tool_call_id:
+                    raise TypeError("Anthropic API requires tool_use_id to be set.")
+                # This is for legacy reasons
+                anthropic_message = {
+                    "role": "user",  # NOTE: diff
+                    "content": [
+                        # TODO support error types etc
+                        {
+                            "type": "tool_result",
+                            "tool_use_id": self.tool_call_id,
+                            "content": text_content,
+                        }
+                    ],
+                }
         else:
             raise ValueError(self.role)
@@ -1483,7 +1600,7 @@ class Message(BaseMessage):
             text_content = None
         if self.role != "tool" and self.name is not None:
-            warnings.warn(f"Using Google AI with non-null 'name' field (name={self.name} role={self.role}), not yet supported.")
+            logger.warning(f"Using Google AI with non-null 'name' field (name={self.name} role={self.role}), not yet supported.")
         if self.role == "system":
             # NOTE: Gemini API doesn't have a 'system' role, use 'user' instead
@@ -1603,7 +1720,7 @@ class Message(BaseMessage):
             assert self.tool_call_id is not None, vars(self)
             if self.name is None:
-                warnings.warn("Couldn't find function name on tool call, defaulting to tool ID instead.")
+                logger.warning("Couldn't find function name on tool call, defaulting to tool ID instead.")
                 function_name = self.tool_call_id
             else:
                 function_name = self.name
@@ -1636,7 +1753,7 @@ class Message(BaseMessage):
         if "parts" not in google_ai_message or not google_ai_message["parts"]:
             # If parts is empty, add a default text part
             google_ai_message["parts"] = [{"text": "empty message"}]
-            warnings.warn(
+            logger.warning(
                 f"Empty 'parts' detected in message with role '{self.role}'. Added default empty text part. Full message:\n{vars(self)}"
             )
@@ -1697,6 +1814,9 @@ class Message(BaseMessage):
         # Filter last message if it is a lone approval request without a response - this only occurs for token counting
         if messages[-1].role == "approval" and messages[-1].tool_calls is not None and len(messages[-1].tool_calls) > 0:
             messages.remove(messages[-1])
+            # Also filter pending tool call message if this turn invoked parallel tool calling
+            if messages and messages[-1].role == "assistant" and messages[-1].tool_calls is not None and len(messages[-1].tool_calls) > 0:
+                messages.remove(messages[-1])
         # Filter last message if it is a lone reasoning message without assistant message or tool call
         if (
@@ -1706,6 +1826,28 @@ class Message(BaseMessage):
         ):
             messages.remove(messages[-1])
+        # Collapse adjacent tool call and approval messages
+        messages = Message.collapse_tool_call_messages_for_llm_api(messages)
+        return messages
+    @staticmethod
+    def collapse_tool_call_messages_for_llm_api(
+        messages: List[Message],
+    ) -> List[Message]:
+        adjacent_tool_call_approval_messages = []
+        for i in range(len(messages) - 1):
+            if (
+                messages[i].role == MessageRole.assistant
+                and messages[i].tool_calls is not None
+                and messages[i + 1].role == MessageRole.approval
+                and messages[i + 1].tool_calls is not None
+            ):
+                adjacent_tool_call_approval_messages.append(i)
+        for i in reversed(adjacent_tool_call_approval_messages):
+            messages[i].content = messages[i].content + messages[i + 1].content
+            messages[i].tool_calls = messages[i].tool_calls + messages[i + 1].tool_calls
+            messages.remove(messages[i + 1])
         return messages
     @staticmethod
@@ -1713,6 +1855,9 @@ class Message(BaseMessage):
         """
         Convert message id to bits and change the list bit to the index
         """
+        if index == -1:
+            return message_id
         if not 0 <= index < 128:
             raise ValueError("Index must be between 0 and 127")

letta/schemas/providers/anthropic.py CHANGED Viewed

@@ -1,12 +1,17 @@
-import warnings
 from typing import Literal
+from letta.log import get_logger
+logger = get_logger(__name__)
 import anthropic
 from pydantic import Field
+from letta.errors import ErrorCode, LLMAuthenticationError, LLMError
 from letta.schemas.enums import ProviderCategory, ProviderType
 from letta.schemas.llm_config import LLMConfig
 from letta.schemas.providers.base import Provider
+from letta.settings import model_settings
 # https://docs.anthropic.com/claude/docs/models-overview
 # Sadly hardcoded
@@ -98,8 +103,9 @@ class AnthropicProvider(Provider):
     base_url: str = "https://api.anthropic.com/v1"
     async def check_api_key(self):
-        if self.api_key:
-            anthropic_client = anthropic.Anthropic(api_key=self.api_key)
+        api_key = self.get_api_key_secret().get_plaintext()
+        if api_key:
+            anthropic_client = anthropic.Anthropic(api_key=api_key)
             try:
                 # just use a cheap model to count some tokens - as of 5/7/2025 this is faster than fetching the list of models
                 anthropic_client.messages.count_tokens(model=MODEL_LIST[-1]["name"], messages=[{"role": "user", "content": "a"}])
@@ -116,8 +122,9 @@ class AnthropicProvider(Provider):
         NOTE: currently there is no GET /models, so we need to hardcode
         """
-        if self.api_key:
-            anthropic_client = anthropic.AsyncAnthropic(api_key=self.api_key)
+        api_key = self.get_api_key_secret().get_plaintext()
+        if api_key:
+            anthropic_client = anthropic.AsyncAnthropic(api_key=api_key)
         elif model_settings.anthropic_api_key:
             anthropic_client = anthropic.AsyncAnthropic()
         else:
@@ -145,7 +152,7 @@ class AnthropicProvider(Provider):
                     model["context_window"] = model_library[model["id"]]
                 else:
                     # On fallback, we can set 200k (generally safe), but we should warn the user
-                    warnings.warn(f"Couldn't find context window size for model {model['id']}, defaulting to 200,000")
+                    logger.warning(f"Couldn't find context window size for model {model['id']}, defaulting to 200,000")
                     model["context_window"] = 200000
             # Optional override: enable 1M context for Sonnet 4/4.5 when flag is set

letta/schemas/providers/azure.py CHANGED Viewed

@@ -60,7 +60,8 @@ class AzureProvider(Provider):
     def azure_openai_get_deployed_model_list(self) -> list:
         """https://learn.microsoft.com/en-us/rest/api/azureopenai/models/list?view=rest-azureopenai-2023-05-15&tabs=HTTP"""
-        client = AzureOpenAI(api_key=self.api_key, api_version=self.api_version, azure_endpoint=self.base_url)
+        api_key = self.get_api_key_secret().get_plaintext()
+        client = AzureOpenAI(api_key=api_key, api_version=self.api_version, azure_endpoint=self.base_url)
         try:
             models_list = client.models.list()
@@ -71,8 +72,8 @@ class AzureProvider(Provider):
         # https://xxx.openai.azure.com/openai/models?api-version=xxx
         headers = {"Content-Type": "application/json"}
-        if self.api_key is not None:
-            headers["api-key"] = f"{self.api_key}"
+        if api_key is not None:
+            headers["api-key"] = f"{api_key}"
         # 2. Get all the deployed models
         url = self.get_azure_deployment_list_endpoint()
@@ -165,7 +166,8 @@ class AzureProvider(Provider):
         return AZURE_MODEL_TO_CONTEXT_LENGTH.get(model_name, llm_default)
     async def check_api_key(self):
-        if not self.api_key:
+        api_key = self.get_api_key_secret().get_plaintext()
+        if not api_key:
             raise ValueError("No API key provided")
         try:

letta/schemas/providers/base.py CHANGED Viewed

@@ -1,10 +1,14 @@
 from datetime import datetime
+from letta.log import get_logger
+logger = get_logger(__name__)
 from pydantic import BaseModel, Field, model_validator
 from letta.schemas.embedding_config import EmbeddingConfig
 from letta.schemas.embedding_config_overrides import EMBEDDING_HANDLE_OVERRIDES
-from letta.schemas.enums import ProviderCategory, ProviderType
+from letta.schemas.enums import PrimitiveType, ProviderCategory, ProviderType
 from letta.schemas.letta_base import LettaBase
 from letta.schemas.llm_config import LLMConfig
 from letta.schemas.llm_config_overrides import LLM_HANDLE_OVERRIDES
@@ -13,7 +17,7 @@ from letta.settings import model_settings
 class ProviderBase(LettaBase):
-    __id_prefix__ = "provider"
+    __id_prefix__ = PrimitiveType.PROVIDER.value
 class Provider(ProviderBase):
@@ -90,7 +94,7 @@ class Provider(ProviderBase):
         import asyncio
         import warnings
-        warnings.warn("list_llm_models is deprecated, use list_llm_models_async instead", DeprecationWarning, stacklevel=2)
+        logger.warning("list_llm_models is deprecated, use list_llm_models_async instead", stacklevel=2)
         # Simplified asyncio handling - just use asyncio.run()
         # This works in most contexts and avoids complex event loop detection
@@ -115,7 +119,7 @@ class Provider(ProviderBase):
         import asyncio
         import warnings
-        warnings.warn("list_embedding_models is deprecated, use list_embedding_models_async instead", DeprecationWarning, stacklevel=2)
+        logger.warning("list_embedding_models is deprecated, use list_embedding_models_async instead", stacklevel=2)
         # Simplified asyncio handling - just use asyncio.run()
         # This works in most contexts and avoids complex event loop detection

letta/schemas/providers/bedrock.py CHANGED Viewed

@@ -25,11 +25,15 @@ class BedrockProvider(Provider):
         from aioboto3.session import Session
         try:
+            # Decrypt credentials before using
+            access_key = self.get_access_key_secret().get_plaintext()
+            secret_key = self.get_api_key_secret().get_plaintext()
             session = Session()
             async with session.client(
                 "bedrock",
-                aws_access_key_id=self.access_key,
-                aws_secret_access_key=self.api_key,
+                aws_access_key_id=access_key,
+                aws_secret_access_key=secret_key,
                 region_name=self.region,
             ) as bedrock:
                 response = await bedrock.list_inference_profiles()

letta/schemas/providers/cerebras.py CHANGED Viewed

@@ -1,6 +1,9 @@
-import warnings
 from typing import Literal
+from letta.log import get_logger
+logger = get_logger(__name__)
 from pydantic import Field
 from letta.schemas.enums import ProviderCategory, ProviderType
@@ -38,7 +41,8 @@ class CerebrasProvider(OpenAIProvider):
     async def list_llm_models_async(self) -> list[LLMConfig]:
         from letta.llm_api.openai import openai_get_model_list_async
-        response = await openai_get_model_list_async(self.base_url, api_key=self.api_key)
+        api_key = self.get_api_key_secret().get_plaintext()
+        response = await openai_get_model_list_async(self.base_url, api_key=api_key)
         if "data" in response:
             data = response["data"]
@@ -57,7 +61,7 @@ class CerebrasProvider(OpenAIProvider):
                 context_window_size = self.get_model_context_window_size(model_name)
             if not context_window_size:
-                warnings.warn(f"Couldn't find context window size for model {model_name}")
+                logger.warning(f"Couldn't find context window size for model {model_name}")
                 continue
             # Cerebras supports function calling

letta/schemas/providers/deepseek.py CHANGED Viewed

@@ -34,7 +34,8 @@ class DeepSeekProvider(OpenAIProvider):
     async def list_llm_models_async(self) -> list[LLMConfig]:
         from letta.llm_api.openai import openai_get_model_list_async
-        response = await openai_get_model_list_async(self.base_url, api_key=self.api_key)
+        api_key = self.get_api_key_secret().get_plaintext()
+        response = await openai_get_model_list_async(self.base_url, api_key=api_key)
         data = response.get("data", response)
         configs = []

letta-nightly 0.12.1.dev20251023104211__py3-none-any.whl → 0.13.0.dev20251024223017__py3-none-any.whl

Potentially problematic release.

letta-nightly 0.12.1.dev20251023104211py3-none-any.whl → 0.13.0.dev20251024223017py3-none-any.whl