PyPI - letta-nightly - Versions diffs - 0.11.7.dev20251006104136__py3-none-any.whl → 0.11.7.dev20251008104128__py3-none-any.whl - Mend

letta-nightly 0.11.7.dev20251006104136py3-none-any.whl → 0.11.7.dev20251008104128py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (145) hide show

letta/adapters/letta_llm_adapter.py +1 -0
letta/adapters/letta_llm_request_adapter.py +0 -1
letta/adapters/letta_llm_stream_adapter.py +7 -2
letta/adapters/simple_llm_request_adapter.py +88 -0
letta/adapters/simple_llm_stream_adapter.py +192 -0
letta/agents/agent_loop.py +6 -0
letta/agents/ephemeral_summary_agent.py +2 -1
letta/agents/helpers.py +142 -6
letta/agents/letta_agent.py +13 -33
letta/agents/letta_agent_batch.py +2 -4
letta/agents/letta_agent_v2.py +87 -77
letta/agents/letta_agent_v3.py +899 -0
letta/agents/voice_agent.py +2 -6
letta/constants.py +8 -4
letta/errors.py +40 -0
letta/functions/function_sets/base.py +84 -4
letta/functions/function_sets/multi_agent.py +0 -3
letta/functions/schema_generator.py +113 -71
letta/groups/dynamic_multi_agent.py +3 -2
letta/groups/helpers.py +1 -2
letta/groups/round_robin_multi_agent.py +3 -2
letta/groups/sleeptime_multi_agent.py +3 -2
letta/groups/sleeptime_multi_agent_v2.py +1 -1
letta/groups/sleeptime_multi_agent_v3.py +17 -17
letta/groups/supervisor_multi_agent.py +84 -80
letta/helpers/converters.py +3 -0
letta/helpers/message_helper.py +4 -0
letta/helpers/tool_rule_solver.py +92 -5
letta/interfaces/anthropic_streaming_interface.py +409 -0
letta/interfaces/gemini_streaming_interface.py +296 -0
letta/interfaces/openai_streaming_interface.py +752 -1
letta/llm_api/anthropic_client.py +126 -16
letta/llm_api/bedrock_client.py +4 -2
letta/llm_api/deepseek_client.py +4 -1
letta/llm_api/google_vertex_client.py +123 -42
letta/llm_api/groq_client.py +4 -1
letta/llm_api/llm_api_tools.py +11 -4
letta/llm_api/llm_client_base.py +6 -2
letta/llm_api/openai.py +32 -2
letta/llm_api/openai_client.py +423 -18
letta/llm_api/xai_client.py +4 -1
letta/main.py +9 -5
letta/memory.py +1 -0
letta/orm/__init__.py +1 -1
letta/orm/agent.py +10 -0
letta/orm/block.py +7 -16
letta/orm/blocks_agents.py +8 -2
letta/orm/files_agents.py +2 -0
letta/orm/job.py +7 -5
letta/orm/mcp_oauth.py +1 -0
letta/orm/message.py +21 -6
letta/orm/organization.py +2 -0
letta/orm/provider.py +6 -2
letta/orm/run.py +71 -0
letta/orm/sandbox_config.py +7 -1
letta/orm/sqlalchemy_base.py +0 -306
letta/orm/step.py +6 -5
letta/orm/step_metrics.py +5 -5
letta/otel/tracing.py +28 -3
letta/plugins/defaults.py +4 -4
letta/prompts/system_prompts/__init__.py +2 -0
letta/prompts/system_prompts/letta_v1.py +25 -0
letta/schemas/agent.py +3 -2
letta/schemas/agent_file.py +9 -3
letta/schemas/block.py +23 -10
letta/schemas/enums.py +21 -2
letta/schemas/job.py +17 -4
letta/schemas/letta_message_content.py +71 -2
letta/schemas/letta_stop_reason.py +5 -5
letta/schemas/llm_config.py +53 -3
letta/schemas/memory.py +1 -1
letta/schemas/message.py +504 -117
letta/schemas/openai/responses_request.py +64 -0
letta/schemas/providers/__init__.py +2 -0
letta/schemas/providers/anthropic.py +16 -0
letta/schemas/providers/ollama.py +115 -33
letta/schemas/providers/openrouter.py +52 -0
letta/schemas/providers/vllm.py +2 -1
letta/schemas/run.py +48 -42
letta/schemas/step.py +2 -2
letta/schemas/step_metrics.py +1 -1
letta/schemas/tool.py +15 -107
letta/schemas/tool_rule.py +88 -5
letta/serialize_schemas/marshmallow_agent.py +1 -0
letta/server/db.py +86 -408
letta/server/rest_api/app.py +61 -10
letta/server/rest_api/dependencies.py +14 -0
letta/server/rest_api/redis_stream_manager.py +19 -8
letta/server/rest_api/routers/v1/agents.py +364 -292
letta/server/rest_api/routers/v1/blocks.py +14 -20
letta/server/rest_api/routers/v1/identities.py +45 -110
letta/server/rest_api/routers/v1/internal_templates.py +21 -0
letta/server/rest_api/routers/v1/jobs.py +23 -6
letta/server/rest_api/routers/v1/messages.py +1 -1
letta/server/rest_api/routers/v1/runs.py +126 -85
letta/server/rest_api/routers/v1/sandbox_configs.py +10 -19
letta/server/rest_api/routers/v1/tools.py +281 -594
letta/server/rest_api/routers/v1/voice.py +1 -1
letta/server/rest_api/streaming_response.py +29 -29
letta/server/rest_api/utils.py +122 -64
letta/server/server.py +160 -887
letta/services/agent_manager.py +236 -919
letta/services/agent_serialization_manager.py +16 -0
letta/services/archive_manager.py +0 -100
letta/services/block_manager.py +211 -168
letta/services/file_manager.py +1 -1
letta/services/files_agents_manager.py +24 -33
letta/services/group_manager.py +0 -142
letta/services/helpers/agent_manager_helper.py +7 -2
letta/services/helpers/run_manager_helper.py +85 -0
letta/services/job_manager.py +96 -411
letta/services/lettuce/__init__.py +6 -0
letta/services/lettuce/lettuce_client_base.py +86 -0
letta/services/mcp_manager.py +38 -6
letta/services/message_manager.py +165 -362
letta/services/organization_manager.py +0 -36
letta/services/passage_manager.py +0 -345
letta/services/provider_manager.py +0 -80
letta/services/run_manager.py +301 -0
letta/services/sandbox_config_manager.py +0 -234
letta/services/step_manager.py +62 -39
letta/services/summarizer/summarizer.py +9 -7
letta/services/telemetry_manager.py +0 -16
letta/services/tool_executor/builtin_tool_executor.py +35 -0
letta/services/tool_executor/core_tool_executor.py +397 -2
letta/services/tool_executor/files_tool_executor.py +3 -3
letta/services/tool_executor/multi_agent_tool_executor.py +30 -15
letta/services/tool_executor/tool_execution_manager.py +6 -8
letta/services/tool_executor/tool_executor_base.py +3 -3
letta/services/tool_manager.py +85 -339
letta/services/tool_sandbox/base.py +24 -13
letta/services/tool_sandbox/e2b_sandbox.py +16 -1
letta/services/tool_schema_generator.py +123 -0
letta/services/user_manager.py +0 -99
letta/settings.py +20 -4
{letta_nightly-0.11.7.dev20251006104136.dist-info → letta_nightly-0.11.7.dev20251008104128.dist-info}/METADATA +3 -5
{letta_nightly-0.11.7.dev20251006104136.dist-info → letta_nightly-0.11.7.dev20251008104128.dist-info}/RECORD +140 -132
letta/agents/temporal/activities/__init__.py +0 -4
letta/agents/temporal/activities/example_activity.py +0 -7
letta/agents/temporal/activities/prepare_messages.py +0 -10
letta/agents/temporal/temporal_agent_workflow.py +0 -56
letta/agents/temporal/types.py +0 -25
{letta_nightly-0.11.7.dev20251006104136.dist-info → letta_nightly-0.11.7.dev20251008104128.dist-info}/WHEEL +0 -0
{letta_nightly-0.11.7.dev20251006104136.dist-info → letta_nightly-0.11.7.dev20251008104128.dist-info}/entry_points.txt +0 -0
{letta_nightly-0.11.7.dev20251006104136.dist-info → letta_nightly-0.11.7.dev20251008104128.dist-info}/licenses/LICENSE +0 -0

letta/agents/letta_agent.py CHANGED Viewed

@@ -1,4 +1,3 @@
-import json
 import uuid
 from collections.abc import AsyncGenerator
 from datetime import datetime
@@ -13,6 +12,7 @@ from letta.agents.ephemeral_summary_agent import EphemeralSummaryAgent
 from letta.agents.helpers import (
     _build_rule_violation_result,
     _create_letta_response,
+    _load_last_function_response,
     _pop_heartbeat,
     _prepare_in_context_messages_no_persist_async,
     _safe_load_tool_call_str,
@@ -34,7 +34,7 @@ from letta.otel.context import get_ctx_attributes
 from letta.otel.metric_registry import MetricRegistry
 from letta.otel.tracing import log_event, trace_method, tracer
 from letta.schemas.agent import AgentState, UpdateAgent
-from letta.schemas.enums import JobStatus, MessageRole, ProviderType, StepStatus, ToolType
+from letta.schemas.enums import JobStatus, ProviderType, StepStatus, ToolType
 from letta.schemas.letta_message import MessageType
 from letta.schemas.letta_message_content import OmittedReasoningContent, ReasoningContent, RedactedReasoningContent, TextContent
 from letta.schemas.letta_response import LettaResponse
@@ -48,7 +48,10 @@ from letta.schemas.step_metrics import StepMetrics
 from letta.schemas.tool_execution_result import ToolExecutionResult
 from letta.schemas.usage import LettaUsageStatistics
 from letta.schemas.user import User
-from letta.server.rest_api.utils import create_approval_request_message_from_llm_response, create_letta_messages_from_llm_response
+from letta.server.rest_api.utils import (
+    create_approval_request_message_from_llm_response,
+    create_letta_messages_from_llm_response,
+)
 from letta.services.agent_manager import AgentManager
 from letta.services.block_manager import BlockManager
 from letta.services.helpers.tool_parser_helper import runtime_override_tool_json_schema
@@ -297,7 +300,7 @@ class LettaAgent(BaseAgent):
                     context_window_limit=agent_state.llm_config.context_window,
                     usage=UsageStatistics(completion_tokens=0, prompt_tokens=0, total_tokens=0),
                     provider_id=None,
-                    job_id=self.current_run_id if self.current_run_id else None,
+                    run_id=self.current_run_id if self.current_run_id else None,
                     step_id=step_id,
                     project_id=agent_state.project_id,
                     status=StepStatus.PENDING,
@@ -641,7 +644,7 @@ class LettaAgent(BaseAgent):
                     context_window_limit=agent_state.llm_config.context_window,
                     usage=UsageStatistics(completion_tokens=0, prompt_tokens=0, total_tokens=0),
                     provider_id=None,
-                    job_id=run_id if run_id else self.current_run_id,
+                    run_id=run_id if run_id else self.current_run_id,
                     step_id=step_id,
                     project_id=agent_state.project_id,
                     status=StepStatus.PENDING,
@@ -765,7 +768,7 @@ class LettaAgent(BaseAgent):
                             step_id=step_id,
                             agent_state=agent_state,
                             step_metrics=step_metrics,
-                            job_id=run_id if run_id else self.current_run_id,
+                            run_id=run_id if run_id else self.current_run_id,
                         )
                 except Exception as e:
@@ -986,7 +989,7 @@ class LettaAgent(BaseAgent):
                     context_window_limit=agent_state.llm_config.context_window,
                     usage=UsageStatistics(completion_tokens=0, prompt_tokens=0, total_tokens=0),
                     provider_id=None,
-                    job_id=self.current_run_id if self.current_run_id else None,
+                    run_id=self.current_run_id if self.current_run_id else None,
                     step_id=step_id,
                     project_id=agent_state.project_id,
                     status=StepStatus.PENDING,
@@ -1592,7 +1595,6 @@ class LettaAgent(BaseAgent):
                 ToolType.LETTA_VOICE_SLEEPTIME_CORE,
                 ToolType.LETTA_BUILTIN,
                 ToolType.LETTA_FILES_CORE,
-                ToolType.EXTERNAL_COMPOSIO,
                 ToolType.EXTERNAL_MCP,
             }
         ]
@@ -1619,6 +1621,7 @@ class LettaAgent(BaseAgent):
         return (
             llm_client.build_request_data(
+                agent_state.agent_type,
                 in_context_messages,
                 agent_state.llm_config,
                 allowed_tools,
@@ -1663,15 +1666,14 @@ class LettaAgent(BaseAgent):
                 function_arguments={},
                 tool_execution_result=ToolExecutionResult(status="error"),
                 tool_call_id=tool_call_id,
-                function_call_success=False,
                 function_response=f"Error: request to call tool denied. User reason: {denial_reason}",
                 timezone=agent_state.timezone,
-                actor=self.actor,
                 continue_stepping=continue_stepping,
                 heartbeat_reason=f"{NON_USER_MSG_PREFIX}Continuing: user denied request to call tool.",
                 reasoning_content=None,
                 pre_computed_assistant_message_id=None,
                 step_id=step_id,
+                run_id=self.current_run_id,
                 is_approval_response=True,
             )
             messages_to_persist = (initial_messages or []) + tool_call_messages
@@ -1773,15 +1775,14 @@ class LettaAgent(BaseAgent):
                 function_arguments=tool_args,
                 tool_execution_result=tool_execution_result,
                 tool_call_id=tool_call_id,
-                function_call_success=tool_execution_result.success_flag,
                 function_response=function_response_string,
                 timezone=agent_state.timezone,
-                actor=self.actor,
                 continue_stepping=continue_stepping,
                 heartbeat_reason=heartbeat_reason,
                 reasoning_content=reasoning_content,
                 pre_computed_assistant_message_id=pre_computed_assistant_message_id,
                 step_id=step_id,
+                run_id=self.current_run_id,
                 is_approval_response=is_approval or is_denial,
             )
             messages_to_persist = (initial_messages or []) + tool_call_messages
@@ -1790,13 +1791,6 @@ class LettaAgent(BaseAgent):
             messages_to_persist, actor=self.actor, project_id=agent_state.project_id, template_id=agent_state.template_id
         )
-        if run_id:
-            await self.job_manager.add_messages_to_job_async(
-                job_id=run_id,
-                message_ids=[m.id for m in persisted_messages if m.role != "user"],
-                actor=self.actor,
-            )
         return persisted_messages, continue_stepping, stop_reason
     def _decide_continuation(
@@ -1907,17 +1901,3 @@ class LettaAgent(BaseAgent):
             )
         log_event(name=f"finish_{tool_name}_execution", attributes=tool_execution_result.model_dump())
         return tool_execution_result
-    @trace_method
-    def _load_last_function_response(self, in_context_messages: list[Message]):
-        """Load the last function response from message history"""
-        for msg in reversed(in_context_messages):
-            if msg.role == MessageRole.tool and msg.content and len(msg.content) == 1 and isinstance(msg.content[0], TextContent):
-                text_content = msg.content[0].text
-                try:
-                    response_json = json.loads(text_content)
-                    if response_json.get("message"):
-                        return response_json["message"]
-                except (json.JSONDecodeError, KeyError):
-                    raise ValueError(f"Invalid JSON format in message: {text_content}")
-        return None

letta/agents/letta_agent_batch.py CHANGED Viewed

@@ -192,6 +192,7 @@ class LettaAgentBatch(BaseAgent):
         log_event(name="send_llm_batch_request")
         batch_response = await llm_client.send_llm_batch_request_async(
+            agent_type=agent_states[0].agent_type,
             agent_messages_mapping=agent_messages_mapping,
             agent_tools_mapping=agent_tools_mapping,
             agent_llm_config_mapping=agent_llm_config_mapping,
@@ -501,7 +502,6 @@ class LettaAgentBatch(BaseAgent):
                 model=ctx.agent_state_map[agent_id].llm_config.model,
                 function_call_success=success_flag_map[agent_id],
                 timezone=ctx.agent_state_map[agent_id].timezone,
-                actor=self.actor,
             )
             batch_reqs.append(
                 LettaBatchRequest(
@@ -545,11 +545,9 @@ class LettaAgentBatch(BaseAgent):
             function_name=tool_call_name,
             function_arguments=tool_call_args,
             tool_call_id=tool_call_id,
-            function_call_success=success_flag,
             function_response=tool_exec_result,
             tool_execution_result=tool_exec_result_obj,
             timezone=agent_state.timezone,
-            actor=self.actor,
             continue_stepping=False,
             reasoning_content=reasoning_content,
             pre_computed_assistant_message_id=None,
@@ -615,7 +613,7 @@ class LettaAgentBatch(BaseAgent):
         self, agent_state: AgentState, input_messages: List[MessageCreate]
     ) -> List[Message]:
         current_in_context_messages, new_in_context_messages = await _prepare_in_context_messages_async(
-            input_messages, agent_state, self.message_manager, self.actor
+            input_messages, agent_state, self.message_manager, self.actor, run_id=None
         )
         in_context_messages = await self._rebuild_memory_async(current_in_context_messages + new_in_context_messages, agent_state)

letta/agents/letta_agent_v2.py CHANGED Viewed

@@ -1,8 +1,7 @@
 import asyncio
-import json
 import uuid
 from datetime import datetime
-from typing import AsyncGenerator, Tuple
+from typing import AsyncGenerator, Optional, Tuple
 from opentelemetry.trace import Span
@@ -13,6 +12,8 @@ from letta.agents.base_agent_v2 import BaseAgentV2
 from letta.agents.ephemeral_summary_agent import EphemeralSummaryAgent
 from letta.agents.helpers import (
     _build_rule_violation_result,
+    _load_last_function_response,
+    _maybe_get_approval_messages,
     _pop_heartbeat,
     _prepare_in_context_messages_no_persist_async,
     _safe_load_tool_call_str,
@@ -30,7 +31,7 @@ from letta.log import get_logger
 from letta.otel.tracing import log_event, trace_method, tracer
 from letta.prompts.prompt_generator import PromptGenerator
 from letta.schemas.agent import AgentState, UpdateAgent
-from letta.schemas.enums import AgentType, JobStatus, MessageRole, MessageStreamStatus, StepStatus
+from letta.schemas.enums import AgentType, MessageStreamStatus, RunStatus, StepStatus
 from letta.schemas.letta_message import LettaMessage, MessageType
 from letta.schemas.letta_message_content import OmittedReasoningContent, ReasoningContent, RedactedReasoningContent, TextContent
 from letta.schemas.letta_response import LettaResponse
@@ -42,14 +43,17 @@ from letta.schemas.step_metrics import StepMetrics
 from letta.schemas.tool_execution_result import ToolExecutionResult
 from letta.schemas.usage import LettaUsageStatistics
 from letta.schemas.user import User
-from letta.server.rest_api.utils import create_approval_request_message_from_llm_response, create_letta_messages_from_llm_response
+from letta.server.rest_api.utils import (
+    create_approval_request_message_from_llm_response,
+    create_letta_messages_from_llm_response,
+)
 from letta.services.agent_manager import AgentManager
 from letta.services.archive_manager import ArchiveManager
 from letta.services.block_manager import BlockManager
 from letta.services.helpers.tool_parser_helper import runtime_override_tool_json_schema
-from letta.services.job_manager import JobManager
 from letta.services.message_manager import MessageManager
 from letta.services.passage_manager import PassageManager
+from letta.services.run_manager import RunManager
 from letta.services.step_manager import StepManager
 from letta.services.summarizer.enums import SummarizationMode
 from letta.services.summarizer.summarizer import Summarizer
@@ -89,7 +93,7 @@ class LettaAgentV2(BaseAgentV2):
         self.agent_manager = AgentManager()
         self.archive_manager = ArchiveManager()
         self.block_manager = BlockManager()
-        self.job_manager = JobManager()
+        self.run_manager = RunManager()
         self.message_manager = MessageManager()
         self.passage_manager = PassageManager()
         self.step_manager = StepManager()
@@ -138,12 +142,14 @@ class LettaAgentV2(BaseAgentV2):
         """
         request = {}
         in_context_messages, input_messages_to_persist = await _prepare_in_context_messages_no_persist_async(
-            input_messages, self.agent_state, self.message_manager, self.actor
+            input_messages, self.agent_state, self.message_manager, self.actor, None
         )
         response = self._step(
+            run_id=None,
             messages=in_context_messages + input_messages_to_persist,
             llm_adapter=LettaLLMRequestAdapter(llm_client=self.llm_client, llm_config=self.agent_state.llm_config),
             dry_run=True,
+            enforce_run_id_set=False,
         )
         async for chunk in response:
             request = chunk  # First chunk contains request data
@@ -179,11 +185,13 @@ class LettaAgentV2(BaseAgentV2):
         request_span = self._request_checkpoint_start(request_start_timestamp_ns=request_start_timestamp_ns)
         in_context_messages, input_messages_to_persist = await _prepare_in_context_messages_no_persist_async(
-            input_messages, self.agent_state, self.message_manager, self.actor
+            input_messages, self.agent_state, self.message_manager, self.actor, run_id
         )
         in_context_messages = in_context_messages + input_messages_to_persist
         response_letta_messages = []
         for i in range(max_steps):
+            remaining_turns = max_steps - i - 1
             response = self._step(
                 messages=in_context_messages + self.response_messages,
                 input_messages_to_persist=input_messages_to_persist,
@@ -192,6 +200,7 @@ class LettaAgentV2(BaseAgentV2):
                 use_assistant_message=use_assistant_message,
                 include_return_message_types=include_return_message_types,
                 request_start_timestamp_ns=request_start_timestamp_ns,
+                remaining_turns=remaining_turns,
             )
             async for chunk in response:
@@ -264,6 +273,7 @@ class LettaAgentV2(BaseAgentV2):
             llm_adapter = LettaLLMStreamAdapter(
                 llm_client=self.llm_client,
                 llm_config=self.agent_state.llm_config,
+                run_id=run_id,
             )
         else:
             llm_adapter = LettaLLMRequestAdapter(
@@ -273,7 +283,7 @@ class LettaAgentV2(BaseAgentV2):
         try:
             in_context_messages, input_messages_to_persist = await _prepare_in_context_messages_no_persist_async(
-                input_messages, self.agent_state, self.message_manager, self.actor
+                input_messages, self.agent_state, self.message_manager, self.actor, run_id
             )
             in_context_messages = in_context_messages + input_messages_to_persist
             for i in range(max_steps):
@@ -332,13 +342,14 @@ class LettaAgentV2(BaseAgentV2):
         self,
         messages: list[Message],
         llm_adapter: LettaLLMAdapter,
+        run_id: Optional[str],
         input_messages_to_persist: list[Message] | None = None,
-        run_id: str | None = None,
         use_assistant_message: bool = True,
         include_return_message_types: list[MessageType] | None = None,
         request_start_timestamp_ns: int | None = None,
         remaining_turns: int = -1,
         dry_run: bool = False,
+        enforce_run_id_set: bool = True,
     ) -> AsyncGenerator[LettaMessage | dict, None]:
         """
         Execute a single agent step (one LLM call and tool execution).
@@ -361,6 +372,9 @@ class LettaAgentV2(BaseAgentV2):
         Yields:
             LettaMessage or dict: Chunks for streaming mode, or request data for dry_run
         """
+        if enforce_run_id_set and run_id is None:
+            raise AssertionError("run_id is required when enforce_run_id_set is True")
         step_progression = StepProgression.START
         # TODO(@caren): clean this up
         tool_call, reasoning_content, agent_step_span, first_chunk, step_id, logged_step, step_start_ns, step_metrics = (
@@ -374,9 +388,9 @@ class LettaAgentV2(BaseAgentV2):
             None,
         )
         try:
-            self.last_function_response = self._load_last_function_response(messages)
+            self.last_function_response = _load_last_function_response(messages)
             valid_tools = await self._get_valid_tools()
-            approval_request, approval_response = await self._maybe_get_approval_messages(messages)
+            approval_request, approval_response = _maybe_get_approval_messages(messages)
             if approval_request and approval_response:
                 tool_call = approval_request.tool_calls[0]
                 reasoning_content = approval_request.content
@@ -399,6 +413,7 @@ class LettaAgentV2(BaseAgentV2):
                 for llm_request_attempt in range(summarizer_settings.max_summarizer_retries + 1):
                     try:
                         request_data = self.llm_client.build_request_data(
+                            agent_type=self.agent_state.agent_type,
                             messages=messages,
                             llm_config=self.agent_state.llm_config,
                             tools=valid_tools,
@@ -457,6 +472,13 @@ class LettaAgentV2(BaseAgentV2):
                 self.stop_reason = LettaStopReason(stop_reason=StopReasonType.no_tool_call.value)
                 raise ValueError("No tool calls found in response, model must make a tool call")
+            # TODO: how should be associate input messages with runs?
+            ## Set run_id on input messages before persisting
+            # if input_messages_to_persist and run_id:
+            #    for message in input_messages_to_persist:
+            #        if message.run_id is None:
+            #            message.run_id = run_id
             persisted_messages, self.should_continue, self.stop_reason = await self._handle_ai_response(
                 tool_call or llm_adapter.tool_call,
                 [tool["name"] for tool in valid_tools],
@@ -558,6 +580,7 @@ class LettaAgentV2(BaseAgentV2):
                         for message in input_messages_to_persist:
                             message.is_err = True
                             message.step_id = step_id
+                            message.run_id = run_id
                         await self.message_manager.create_many_messages_async(
                             input_messages_to_persist,
                             actor=self.actor,
@@ -598,18 +621,11 @@ class LettaAgentV2(BaseAgentV2):
         self.last_function_response = None
         self.response_messages = []
-    async def _maybe_get_approval_messages(self, messages: list[Message]) -> Tuple[Message | None, Message | None]:
-        if len(messages) >= 2:
-            maybe_approval_request, maybe_approval_response = messages[-2], messages[-1]
-            if maybe_approval_request.role == "approval" and maybe_approval_response.role == "approval":
-                return maybe_approval_request, maybe_approval_response
-        return None, None
     @trace_method
     async def _check_run_cancellation(self, run_id) -> bool:
         try:
-            job = await self.job_manager.get_job_by_id_async(job_id=run_id, actor=self.actor)
-            return job.status == JobStatus.cancelled
+            run = await self.run_manager.get_run_by_id(run_id=run_id, actor=self.actor)
+            return run.status == RunStatus.cancelled
         except Exception as e:
             # Log the error but don't fail the execution
             self.logger.warning(f"Failed to check job cancellation status for job {run_id}: {e}")
@@ -678,6 +694,9 @@ class LettaAgentV2(BaseAgentV2):
         curr_dynamic_section = extract_dynamic_section(curr_system_message_text)
+        # refresh files
+        agent_state = await self.agent_manager.refresh_file_blocks(agent_state=agent_state, actor=self.actor)
         # generate just the memory string with current state for comparison
         curr_memory_str = agent_state.memory.compile(
             tool_usage_rules=tool_constraint_block, sources=agent_state.sources, max_files_open=agent_state.max_files_open
@@ -740,20 +759,6 @@ class LettaAgentV2(BaseAgentV2):
         )
         return allowed_tools
-    @trace_method
-    def _load_last_function_response(self, in_context_messages: list[Message]):
-        """Load the last function response from message history"""
-        for msg in reversed(in_context_messages):
-            if msg.role == MessageRole.tool and msg.content and len(msg.content) == 1 and isinstance(msg.content[0], TextContent):
-                text_content = msg.content[0].text
-                try:
-                    response_json = json.loads(text_content)
-                    if response_json.get("message"):
-                        return response_json["message"]
-                except (json.JSONDecodeError, KeyError):
-                    raise ValueError(f"Invalid JSON format in message: {text_content}")
-        return None
     @trace_method
     def _request_checkpoint_start(self, request_start_timestamp_ns: int | None) -> Span | None:
         if request_start_timestamp_ns is not None:
@@ -796,7 +801,7 @@ class LettaAgentV2(BaseAgentV2):
             context_window_limit=self.agent_state.llm_config.context_window,
             usage=UsageStatistics(completion_tokens=0, prompt_tokens=0, total_tokens=0),
             provider_id=None,
-            job_id=run_id,
+            run_id=run_id,
             step_id=step_id,
             project_id=self.agent_state.project_id,
             status=StepStatus.PENDING,
@@ -890,21 +895,22 @@ class LettaAgentV2(BaseAgentV2):
                 function_arguments={},
                 tool_execution_result=ToolExecutionResult(status="error"),
                 tool_call_id=tool_call_id,
-                function_call_success=False,
                 function_response=f"Error: request to call tool denied. User reason: {denial_reason}",
                 timezone=agent_state.timezone,
-                actor=self.actor,
                 continue_stepping=continue_stepping,
                 heartbeat_reason=f"{NON_USER_MSG_PREFIX}Continuing: user denied request to call tool.",
                 reasoning_content=None,
                 pre_computed_assistant_message_id=None,
                 step_id=step_id,
                 is_approval_response=True,
+                run_id=run_id,
             )
             messages_to_persist = (initial_messages or []) + tool_call_messages
             persisted_messages = await self.message_manager.create_many_messages_async(
                 messages_to_persist,
                 actor=self.actor,
+                run_id=run_id,
                 project_id=agent_state.project_id,
                 template_id=agent_state.template_id,
             )
@@ -938,6 +944,7 @@ class LettaAgentV2(BaseAgentV2):
                 reasoning_content=reasoning_content,
                 pre_computed_assistant_message_id=pre_computed_assistant_message_id,
                 step_id=step_id,
+                run_id=run_id,
             )
             messages_to_persist = (initial_messages or []) + [approval_message]
             continue_stepping = False
@@ -1004,30 +1011,22 @@ class LettaAgentV2(BaseAgentV2):
                 function_arguments=tool_args,
                 tool_execution_result=tool_execution_result,
                 tool_call_id=tool_call_id,
-                function_call_success=tool_execution_result.success_flag,
                 function_response=function_response_string,
                 timezone=agent_state.timezone,
-                actor=self.actor,
                 continue_stepping=continue_stepping,
                 heartbeat_reason=heartbeat_reason,
                 reasoning_content=reasoning_content,
                 pre_computed_assistant_message_id=pre_computed_assistant_message_id,
                 step_id=step_id,
+                run_id=run_id,
                 is_approval_response=is_approval or is_denial,
             )
             messages_to_persist = (initial_messages or []) + tool_call_messages
         persisted_messages = await self.message_manager.create_many_messages_async(
-            messages_to_persist, actor=self.actor, project_id=agent_state.project_id, template_id=agent_state.template_id
+            messages_to_persist, actor=self.actor, run_id=run_id, project_id=agent_state.project_id, template_id=agent_state.template_id
         )
-        if run_id:
-            await self.job_manager.add_messages_to_job_async(
-                job_id=run_id,
-                message_ids=[m.id for m in persisted_messages if m.role != "user"],
-                actor=self.actor,
-            )
         return persisted_messages, continue_stepping, stop_reason
     @trace_method
@@ -1085,6 +1084,7 @@ class LettaAgentV2(BaseAgentV2):
         agent_state: AgentState,
         agent_step_span: Span | None = None,
         step_id: str | None = None,
+        run_id: str = None,
     ) -> "ToolExecutionResult":
         """
         Executes a tool and returns the ToolExecutionResult.
@@ -1110,9 +1110,9 @@ class LettaAgentV2(BaseAgentV2):
         tool_execution_manager = ToolExecutionManager(
             agent_state=agent_state,
             message_manager=self.message_manager,
+            run_manager=self.run_manager,
             agent_manager=self.agent_manager,
             block_manager=self.block_manager,
-            job_manager=self.job_manager,
             passage_manager=self.passage_manager,
             sandbox_env_vars=sandbox_env_vars,
             actor=self.actor,
@@ -1148,28 +1148,38 @@ class LettaAgentV2(BaseAgentV2):
         total_tokens: int | None = None,
         force: bool = False,
     ) -> list[Message]:
+        # always skip summarization if last message is an approval request message
+        skip_summarization = False
+        latest_messages = in_context_messages + new_letta_messages
+        if latest_messages[-1].role == "approval" and len(latest_messages[-1].tool_calls) > 0:
+            skip_summarization = True
         # If total tokens is reached, we truncate down
         # TODO: This can be broken by bad configs, e.g. lower bound too high, initial messages too fat, etc.
         # TODO: `force` and `clear` seem to no longer be used, we should remove
-        if force or (total_tokens and total_tokens > self.agent_state.llm_config.context_window):
-            self.logger.warning(
-                f"Total tokens {total_tokens} exceeds configured max tokens {self.agent_state.llm_config.context_window}, forcefully clearing message history."
-            )
-            new_in_context_messages, updated = await self.summarizer.summarize(
-                in_context_messages=in_context_messages,
-                new_letta_messages=new_letta_messages,
-                force=True,
-                clear=True,
-            )
+        if not skip_summarization:
+            if force or (total_tokens and total_tokens > self.agent_state.llm_config.context_window):
+                self.logger.warning(
+                    f"Total tokens {total_tokens} exceeds configured max tokens {self.agent_state.llm_config.context_window}, forcefully clearing message history."
+                )
+                new_in_context_messages, updated = await self.summarizer.summarize(
+                    in_context_messages=in_context_messages,
+                    new_letta_messages=new_letta_messages,
+                    force=True,
+                    clear=True,
+                )
+            else:
+                # NOTE (Sarah): Seems like this is doing nothing?
+                self.logger.info(
+                    f"Total tokens {total_tokens} does not exceed configured max tokens {self.agent_state.llm_config.context_window}, passing summarizing w/o force."
+                )
+                new_in_context_messages, updated = await self.summarizer.summarize(
+                    in_context_messages=in_context_messages,
+                    new_letta_messages=new_letta_messages,
+                )
         else:
-            # NOTE (Sarah): Seems like this is doing nothing?
-            self.logger.info(
-                f"Total tokens {total_tokens} does not exceed configured max tokens {self.agent_state.llm_config.context_window}, passing summarizing w/o force."
-            )
-            new_in_context_messages, updated = await self.summarizer.summarize(
-                in_context_messages=in_context_messages,
-                new_letta_messages=new_letta_messages,
-            )
+            new_in_context_messages = in_context_messages + new_letta_messages
         message_ids = [m.id for m in new_in_context_messages]
         await self.agent_manager.update_message_ids_async(
             agent_id=self.agent_state.id,
@@ -1195,7 +1205,7 @@ class LettaAgentV2(BaseAgentV2):
                 tool_execution_ns=step_metrics.tool_execution_ns,
                 step_ns=step_metrics.step_ns,
                 agent_id=self.agent_state.id,
-                job_id=run_id,
+                run_id=run_id,
                 project_id=self.agent_state.project_id,
                 template_id=self.agent_state.template_id,
                 base_template_id=self.agent_state.base_template_id,
@@ -1219,15 +1229,15 @@ class LettaAgentV2(BaseAgentV2):
             if request_span:
                 request_span.add_event(name="letta_request_ms", attributes={"duration_ms": ns_to_ms(duration_ns)})
             await self._update_agent_last_run_metrics(now, ns_to_ms(duration_ns))
-            if settings.track_agent_run and run_id:
-                await self.job_manager.record_response_duration(run_id, duration_ns, self.actor)
-                await self.job_manager.safe_update_job_status_async(
-                    job_id=run_id,
-                    new_status=JobStatus.failed if is_error else JobStatus.completed,
-                    actor=self.actor,
-                    metadata=job_update_metadata,
-                    stop_reason=self.stop_reason.stop_reason if self.stop_reason else StopReasonType.error,
-                )
+            # if settings.track_agent_run and run_id:
+            #    await self.job_manager.record_response_duration(run_id, duration_ns, self.actor)
+            #    await self.job_manager.safe_update_job_status_async(
+            #        job_id=run_id,
+            #        new_status=JobStatus.failed if is_error else JobStatus.completed,
+            #        actor=self.actor,
+            #        stop_reason=self.stop_reason.stop_reason if self.stop_reason else StopReasonType.error,
+            #        metadata=job_update_metadata,
+            #    )
         if request_span:
             request_span.end()

letta-nightly 0.11.7.dev20251006104136__py3-none-any.whl → 0.11.7.dev20251008104128__py3-none-any.whl

letta-nightly 0.11.7.dev20251006104136py3-none-any.whl → 0.11.7.dev20251008104128py3-none-any.whl