PyPI - letta-nightly - Versions diffs - 0.13.0.dev20251030104218__py3-none-any.whl → 0.13.1.dev20251031234110__py3-none-any.whl - Mend

letta-nightly 0.13.0.dev20251030104218py3-none-any.whl → 0.13.1.dev20251031234110py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of letta-nightly might be problematic. Click here for more details.

Files changed (101) hide show

letta/__init__.py +1 -1
letta/adapters/simple_llm_stream_adapter.py +1 -0
letta/agents/letta_agent_v2.py +8 -0
letta/agents/letta_agent_v3.py +120 -27
letta/agents/temporal/activities/__init__.py +25 -0
letta/agents/temporal/activities/create_messages.py +26 -0
letta/agents/temporal/activities/create_step.py +57 -0
letta/agents/temporal/activities/example_activity.py +9 -0
letta/agents/temporal/activities/execute_tool.py +130 -0
letta/agents/temporal/activities/llm_request.py +114 -0
letta/agents/temporal/activities/prepare_messages.py +27 -0
letta/agents/temporal/activities/refresh_context.py +160 -0
letta/agents/temporal/activities/summarize_conversation_history.py +77 -0
letta/agents/temporal/activities/update_message_ids.py +25 -0
letta/agents/temporal/activities/update_run.py +43 -0
letta/agents/temporal/constants.py +59 -0
letta/agents/temporal/temporal_agent_workflow.py +704 -0
letta/agents/temporal/types.py +275 -0
letta/constants.py +8 -0
letta/errors.py +4 -0
letta/functions/function_sets/base.py +0 -11
letta/groups/helpers.py +7 -1
letta/groups/sleeptime_multi_agent_v4.py +4 -3
letta/interfaces/anthropic_streaming_interface.py +0 -1
letta/interfaces/openai_streaming_interface.py +103 -100
letta/llm_api/anthropic_client.py +57 -12
letta/llm_api/bedrock_client.py +1 -0
letta/llm_api/deepseek_client.py +3 -2
letta/llm_api/google_vertex_client.py +1 -0
letta/llm_api/groq_client.py +1 -0
letta/llm_api/llm_client_base.py +15 -1
letta/llm_api/openai.py +2 -2
letta/llm_api/openai_client.py +17 -3
letta/llm_api/xai_client.py +1 -0
letta/orm/organization.py +4 -0
letta/orm/sqlalchemy_base.py +7 -0
letta/otel/tracing.py +131 -4
letta/schemas/agent_file.py +10 -10
letta/schemas/block.py +22 -3
letta/schemas/enums.py +21 -0
letta/schemas/environment_variables.py +3 -2
letta/schemas/group.py +3 -3
letta/schemas/letta_response.py +36 -4
letta/schemas/llm_batch_job.py +3 -3
letta/schemas/llm_config.py +27 -3
letta/schemas/mcp.py +3 -2
letta/schemas/mcp_server.py +3 -2
letta/schemas/message.py +167 -49
letta/schemas/organization.py +2 -1
letta/schemas/passage.py +2 -1
letta/schemas/provider_trace.py +2 -1
letta/schemas/providers/openrouter.py +1 -2
letta/schemas/run_metrics.py +2 -1
letta/schemas/sandbox_config.py +3 -1
letta/schemas/step_metrics.py +2 -1
letta/schemas/tool_rule.py +2 -2
letta/schemas/user.py +2 -1
letta/server/rest_api/app.py +5 -1
letta/server/rest_api/routers/v1/__init__.py +4 -0
letta/server/rest_api/routers/v1/agents.py +71 -9
letta/server/rest_api/routers/v1/blocks.py +7 -7
letta/server/rest_api/routers/v1/groups.py +40 -0
letta/server/rest_api/routers/v1/identities.py +2 -2
letta/server/rest_api/routers/v1/internal_agents.py +31 -0
letta/server/rest_api/routers/v1/internal_blocks.py +177 -0
letta/server/rest_api/routers/v1/internal_runs.py +25 -1
letta/server/rest_api/routers/v1/runs.py +2 -22
letta/server/rest_api/routers/v1/tools.py +10 -0
letta/server/server.py +5 -2
letta/services/agent_manager.py +4 -4
letta/services/archive_manager.py +16 -0
letta/services/group_manager.py +44 -0
letta/services/helpers/run_manager_helper.py +2 -2
letta/services/lettuce/lettuce_client.py +148 -0
letta/services/mcp/base_client.py +9 -3
letta/services/run_manager.py +148 -37
letta/services/source_manager.py +91 -3
letta/services/step_manager.py +2 -3
letta/services/streaming_service.py +52 -13
letta/services/summarizer/summarizer.py +28 -2
letta/services/tool_executor/builtin_tool_executor.py +1 -1
letta/services/tool_executor/core_tool_executor.py +2 -117
letta/services/tool_schema_generator.py +2 -2
letta/validators.py +21 -0
{letta_nightly-0.13.0.dev20251030104218.dist-info → letta_nightly-0.13.1.dev20251031234110.dist-info}/METADATA +1 -1
{letta_nightly-0.13.0.dev20251030104218.dist-info → letta_nightly-0.13.1.dev20251031234110.dist-info}/RECORD +89 -84
letta/agent.py +0 -1758
letta/cli/cli_load.py +0 -16
letta/client/__init__.py +0 -0
letta/client/streaming.py +0 -95
letta/client/utils.py +0 -78
letta/functions/async_composio_toolset.py +0 -109
letta/functions/composio_helpers.py +0 -96
letta/helpers/composio_helpers.py +0 -38
letta/orm/job_messages.py +0 -33
letta/schemas/providers.py +0 -1617
letta/server/rest_api/routers/openai/chat_completions/chat_completions.py +0 -132
letta/services/tool_executor/composio_tool_executor.py +0 -57
{letta_nightly-0.13.0.dev20251030104218.dist-info → letta_nightly-0.13.1.dev20251031234110.dist-info}/WHEEL +0 -0
{letta_nightly-0.13.0.dev20251030104218.dist-info → letta_nightly-0.13.1.dev20251031234110.dist-info}/entry_points.txt +0 -0
{letta_nightly-0.13.0.dev20251030104218.dist-info → letta_nightly-0.13.1.dev20251031234110.dist-info}/licenses/LICENSE +0 -0

letta/agents/temporal/temporal_agent_workflow.py ADDED Viewed

@@ -0,0 +1,704 @@
+import json
+import uuid
+from temporalio import workflow
+from temporalio.exceptions import ActivityError, ApplicationError
+from letta.agents.helpers import _load_last_function_response, _maybe_get_approval_messages, generate_step_id
+from letta.agents.temporal.activities.execute_tool import deserialize_func_return, is_serialized_exception
+from letta.agents.temporal.constants import (
+    CREATE_MESSAGES_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+    CREATE_MESSAGES_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+    CREATE_STEP_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+    CREATE_STEP_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+    LLM_ACTIVITY_RETRY_POLICY,
+    LLM_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+    LLM_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+    PREPARE_MESSAGES_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+    PREPARE_MESSAGES_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+    REFRESH_CONTEXT_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+    REFRESH_CONTEXT_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+    SUMMARIZE_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+    SUMMARIZE_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+    TOOL_EXECUTION_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+    TOOL_EXECUTION_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+    UPDATE_RUN_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+    UPDATE_RUN_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+)
+from letta.constants import REQUEST_HEARTBEAT_PARAM
+from letta.helpers import ToolRulesSolver
+from letta.helpers.tool_execution_helper import enable_strict_mode
+from letta.schemas.agent import AgentState
+from letta.schemas.enums import RunStatus
+from letta.schemas.letta_message import MessageType
+from letta.schemas.letta_message_content import (
+    OmittedReasoningContent,
+    ReasoningContent,
+    RedactedReasoningContent,
+    TextContent,
+)
+from letta.schemas.letta_stop_reason import LettaStopReason, StopReasonType
+from letta.schemas.message import Message
+from letta.schemas.openai.chat_completion_response import FunctionCall, ToolCall, UsageStatistics
+from letta.schemas.tool_execution_result import ToolExecutionResult
+from letta.schemas.usage import LettaUsageStatistics
+from letta.schemas.user import User
+from letta.server.rest_api.utils import create_letta_messages_from_llm_response
+from letta.services.helpers.tool_parser_helper import runtime_override_tool_json_schema
+# Import activity, passing it through the sandbox without reloading the module
+with workflow.unsafe.imports_passed_through():
+    from letta.agents.helpers import _build_rule_violation_result, _load_last_function_response, _pop_heartbeat, _safe_load_tool_call_str
+    from letta.agents.temporal.activities import (
+        create_messages,
+        create_step,
+        execute_tool,
+        llm_request,
+        prepare_messages,
+        refresh_context_and_system_message,
+        summarize_conversation_history,
+        update_message_ids,
+        update_run,
+    )
+    from letta.agents.temporal.types import (
+        CreateMessagesParams,
+        CreateStepParams,
+        ExecuteToolParams,
+        ExecuteToolResult,
+        FinalResult,
+        InnerStepResult,
+        LLMCallResult,
+        LLMRequestParams,
+        PreparedMessages,
+        RefreshContextParams,
+        RefreshContextResult,
+        SummarizeParams,
+        UpdateMessageIdsParams,
+        UpdateMessageIdsResult,
+        UpdateRunParams,
+        WorkflowInputParams,
+    )
+    from letta.constants import NON_USER_MSG_PREFIX
+    from letta.local_llm.constants import INNER_THOUGHTS_KWARG
+    from letta.log import get_logger
+    from letta.server.rest_api.utils import create_approval_request_message_from_llm_response
+    from letta.settings import summarizer_settings
+    from letta.system import package_function_response
+    from letta.utils import validate_function_response
+logger = get_logger(__name__)
+def get_workflow_time_ns() -> int:
+    """Get current workflow time in nanoseconds for deterministic timing."""
+    return int(workflow.now().timestamp() * 1e9)
+@workflow.defn
+class TemporalAgentWorkflow:
+    @workflow.run
+    async def run(self, params: WorkflowInputParams) -> FinalResult:
+        # Capture workflow start time for duration tracking
+        workflow_start_ns = get_workflow_time_ns()
+        # Initialize workflow state
+        agent_state = params.agent_state  # track mutable agent state throughout workflow
+        tool_rules_solver = ToolRulesSolver(tool_rules=agent_state.tool_rules)
+        # Initialize tracking variables
+        usage = LettaUsageStatistics()
+        stop_reason = StopReasonType.end_turn
+        response_messages = []
+        try:
+            # Prepare messages (context + new input), no persistence
+            prepared: PreparedMessages = await workflow.execute_activity(
+                prepare_messages,
+                params,
+                start_to_close_timeout=PREPARE_MESSAGES_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+                schedule_to_close_timeout=PREPARE_MESSAGES_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+            )
+            combined_messages = prepared.in_context_messages + prepared.input_messages_to_persist
+            input_messages = prepared.input_messages_to_persist
+            # Main agent loop - execute steps until max_steps or stop condition
+            for step_index in range(params.max_steps):
+                remaining_turns = params.max_steps - step_index - 1
+                # Execute single step
+                step_result = await self.inner_step(
+                    agent_state=agent_state,
+                    tool_rules_solver=tool_rules_solver,
+                    messages=combined_messages,
+                    input_messages_to_persist=input_messages,
+                    use_assistant_message=params.use_assistant_message,
+                    include_return_message_types=params.include_return_message_types,
+                    actor=params.actor,
+                    remaining_turns=remaining_turns,
+                    run_id=params.run_id,
+                )
+                # Update agent state from the step result
+                agent_state = step_result.agent_state
+                # Update aggregate usage
+                usage.step_count += step_result.usage.step_count
+                usage.completion_tokens += step_result.usage.completion_tokens
+                usage.prompt_tokens += step_result.usage.prompt_tokens
+                usage.total_tokens += step_result.usage.total_tokens
+                # Update stop reason from step result
+                if step_result.stop_reason is not None:
+                    stop_reason = step_result.stop_reason
+                response_messages.extend(step_result.response_messages)
+                combined_messages.extend(step_result.response_messages)
+                # Check if we should continue
+                if not step_result.should_continue:
+                    break
+                input_messages = []  # Only need to persist the input messages for the first step
+            # convert to letta messages from Message objs
+            letta_messages = Message.to_letta_messages_from_list(
+                response_messages,
+                use_assistant_message=params.use_assistant_message,
+                reverse=False,
+            )
+            # Finalize run with all messages to avoid partial metadata overwrites
+            # Determine final stop reason and run status
+            try:
+                if isinstance(stop_reason, StopReasonType):
+                    final_stop_reason_type = stop_reason
+                elif isinstance(stop_reason, LettaStopReason):
+                    final_stop_reason_type = stop_reason.stop_reason
+                elif isinstance(stop_reason, str):
+                    final_stop_reason_type = StopReasonType(stop_reason)
+                else:
+                    final_stop_reason_type = StopReasonType.end_turn
+            except Exception:
+                final_stop_reason_type = StopReasonType.end_turn
+            # Calculate total duration
+            workflow_end_ns = get_workflow_time_ns()
+            total_duration_ns = workflow_end_ns - workflow_start_ns
+            await workflow.execute_activity(
+                update_run,
+                UpdateRunParams(
+                    run_id=params.run_id,
+                    actor=params.actor,
+                    run_status=final_stop_reason_type.run_status,
+                    stop_reason=LettaStopReason(stop_reason=final_stop_reason_type),
+                    # Pass all messages accumulated across the workflow
+                    persisted_messages=response_messages,
+                    usage=usage,
+                    total_duration_ns=total_duration_ns,
+                ),
+                start_to_close_timeout=UPDATE_RUN_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+                schedule_to_close_timeout=UPDATE_RUN_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+            )
+            return FinalResult(
+                stop_reason=stop_reason.value if isinstance(stop_reason, StopReasonType) else str(stop_reason),
+                usage=usage,
+                messages=letta_messages,
+            )
+        except Exception as e:
+            final_stop_reason_type = self._map_exception_to_stop_reason(e)
+            try:
+                # Calculate total duration on exception path
+                workflow_end_ns = get_workflow_time_ns()
+                total_duration_ns = workflow_end_ns - workflow_start_ns
+                await workflow.execute_activity(
+                    update_run,
+                    UpdateRunParams(
+                        run_id=params.run_id,
+                        actor=params.actor,
+                        run_status=final_stop_reason_type.run_status,
+                        stop_reason=LettaStopReason(stop_reason=final_stop_reason_type),
+                        persisted_messages=response_messages,
+                        usage=usage,
+                        total_duration_ns=total_duration_ns,
+                    ),
+                    start_to_close_timeout=UPDATE_RUN_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+                    schedule_to_close_timeout=UPDATE_RUN_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+                )
+            except Exception as update_err:
+                logger.error(f"Failed to update run {params.run_id} after workflow error: {update_err}")
+            raise
+    async def inner_step(
+        self,
+        agent_state: AgentState,
+        tool_rules_solver: ToolRulesSolver,
+        messages: list[Message],
+        actor: User,
+        input_messages_to_persist: list[Message] | None = None,
+        use_assistant_message: bool = True,
+        include_return_message_types: list[MessageType] | None = None,
+        request_start_timestamp_ns: int | None = None,
+        remaining_turns: int = -1,
+        run_id: str | None = None,
+    ) -> InnerStepResult:
+        # Initialize step state
+        usage = LettaUsageStatistics()
+        stop_reason = StopReasonType.end_turn
+        tool_call = None
+        reasoning_content = None
+        step_id = None
+        # Track step start time using workflow.now() for deterministic time
+        step_start_time_ns = get_workflow_time_ns()
+        last_function_response = _load_last_function_response(messages)
+        allowed_tools = await self._get_valid_tools(
+            agent_state=agent_state, tool_rules_solver=tool_rules_solver, last_function_response=last_function_response
+        )
+        approval_request, approval_response = _maybe_get_approval_messages(messages)
+        # TODO: Need to check approval functionality
+        if approval_request and approval_response:
+            tool_call = approval_request.tool_calls[0]
+            reasoning_content = approval_request.content
+            step_id = approval_request.step_id
+        else:
+            # TODO: check for run cancellation if run_id provided
+            # Generate new step ID
+            step_id = generate_step_id(workflow.uuid4())
+            # TODO: step checkpoint start (logging/telemetry)
+            refresh_result: RefreshContextResult = await workflow.execute_activity(
+                refresh_context_and_system_message,
+                RefreshContextParams(
+                    agent_state=agent_state,
+                    in_context_messages=messages,
+                    tool_rules_solver=tool_rules_solver,
+                    actor=actor,
+                ),
+                start_to_close_timeout=REFRESH_CONTEXT_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+                schedule_to_close_timeout=REFRESH_CONTEXT_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+            )
+            refreshed_messages = refresh_result.messages
+            agent_state = refresh_result.agent_state
+            force_tool_call = allowed_tools[0]["name"] if len(allowed_tools) == 1 else None
+            requires_approval_tools = (
+                tool_rules_solver.get_requires_approval_tools(set([t["name"] for t in allowed_tools])) if allowed_tools else None
+            )
+            # LLM request with Temporal native retries; on context window overflow,
+            # perform workflow-level summarization before retrying with updated input.
+            call_result: LLMCallResult | None = None
+            for summarize_attempt in range(summarizer_settings.max_summarizer_retries + 1):
+                try:
+                    # TODO: step checkpoint for LLM request start
+                    call_result = await workflow.execute_activity(
+                        llm_request,
+                        LLMRequestParams(
+                            agent_state=agent_state,
+                            messages=refreshed_messages,
+                            allowed_tools=allowed_tools,
+                            force_tool_call=force_tool_call,
+                            requires_approval_tools=requires_approval_tools,
+                            actor=actor,
+                            step_id=step_id,
+                            use_assistant_message=use_assistant_message,
+                        ),
+                        start_to_close_timeout=LLM_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+                        schedule_to_close_timeout=LLM_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+                        retry_policy=LLM_ACTIVITY_RETRY_POLICY,
+                    )
+                    # Capture LLM timing from the result
+                    llm_request_ns = call_result.llm_request_ns
+                    # If successful, break out of summarization retry loop
+                    break
+                except (ApplicationError, ActivityError) as e:
+                    app_err = e.cause if isinstance(e, ActivityError) else e
+                    error_type = getattr(app_err, "type", None)
+                    # If context window exceeded, summarize then retry (up to max)
+                    if (
+                        error_type
+                        and "ContextWindowExceededError" in error_type
+                        and summarize_attempt < summarizer_settings.max_summarizer_retries
+                    ):
+                        refreshed_messages = await workflow.execute_activity(
+                            summarize_conversation_history,
+                            SummarizeParams(
+                                agent_state=agent_state,
+                                in_context_messages=refreshed_messages,
+                                new_letta_messages=[],
+                                actor=actor,
+                                force=True,
+                            ),
+                            start_to_close_timeout=SUMMARIZE_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+                            schedule_to_close_timeout=SUMMARIZE_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+                        )
+                        continue
+                    # Map error to stop reasons similar to non‑Temporal implementation
+                    if error_type in ("ValueError", "LLMJSONParsingError"):
+                        stop_reason = StopReasonType.invalid_llm_response
+                    else:
+                        stop_reason = StopReasonType.llm_api_error
+                    # Exit summarization loop and finish step with stop_reason
+                    break
+            # If LLM call ultimately failed, finish step early with mapped stop_reason
+            if call_result is None:
+                response_messages = []
+                should_continue = False
+                return InnerStepResult(
+                    stop_reason=stop_reason,
+                    usage=usage,
+                    should_continue=should_continue,
+                    response_messages=response_messages,
+                    agent_state=agent_state,
+                )
+            # TODO: step checkpoint for LLM request finish
+            # Update usage stats (pure)
+            usage.step_count += 1
+            usage.completion_tokens += call_result.usage.completion_tokens
+            usage.prompt_tokens += call_result.usage.prompt_tokens
+            usage.total_tokens += call_result.usage.total_tokens
+            # Validate tool call exists
+            tool_call = call_result.tool_call
+            if tool_call is None:
+                stop_reason = StopReasonType.no_tool_call.value
+                should_continue = False
+                response_messages = []
+                return InnerStepResult(
+                    stop_reason=stop_reason,
+                    usage=usage,
+                    should_continue=should_continue,
+                    response_messages=response_messages,
+                    agent_state=agent_state,
+                )
+            # Handle the AI response (execute tool, create messages, determine continuation)
+            persisted_messages, should_continue, stop_reason, recent_last_function_response = await self._handle_ai_response(
+                tool_call=tool_call,
+                valid_tool_names=[t["name"] for t in allowed_tools],
+                agent_state=agent_state,
+                tool_rules_solver=tool_rules_solver,
+                actor=actor,
+                step_id=step_id,
+                reasoning_content=call_result.reasoning_content,
+                pre_computed_assistant_message_id=call_result.assistant_message_id,
+                initial_messages=input_messages_to_persist,
+                is_approval=approval_response.approve if approval_response is not None else False,
+                is_denial=(approval_response.approve == False) if approval_response is not None else False,
+                denial_reason=approval_response.denial_reason if approval_response is not None else None,
+                is_final_step=(remaining_turns == 0),
+                usage=usage,
+                run_id=run_id,
+                step_start_time_ns=step_start_time_ns,
+                llm_request_ns=llm_request_ns,
+            )
+            if recent_last_function_response:
+                # TODO: This doesn't get used, so we can skip parsing this in the above function
+                last_function_response = recent_last_function_response
+            # persist approval responses immediately to prevent agent from getting into a bad state
+            if (
+                len(input_messages_to_persist) == 1
+                and input_messages_to_persist[0].role == "approval"
+                and persisted_messages[0].role == "approval"
+                and persisted_messages[1].role == "tool"
+            ):
+                # update message ids immediately for approval persistence
+                message_ids = agent_state.message_ids + [m.id for m in persisted_messages[:2]]
+                # call activity to persist the updated message ids
+                update_result: UpdateMessageIdsResult = await workflow.execute_activity(
+                    update_message_ids,
+                    UpdateMessageIdsParams(
+                        agent_id=agent_state.id,
+                        message_ids=message_ids,
+                        actor=actor,
+                    ),
+                    start_to_close_timeout=CREATE_MESSAGES_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+                    schedule_to_close_timeout=CREATE_MESSAGES_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+                )
+                # update agent state from the activity result
+                agent_state = update_result.agent_state
+            # TODO: process response messages for streaming/non-streaming
+            # - yield appropriate messages based on include_return_message_types
+            # TODO: step checkpoint finish
+            # Update response messages with the persisted messages
+            response_messages = persisted_messages
+        return InnerStepResult(
+            stop_reason=stop_reason,
+            usage=usage,
+            should_continue=should_continue,
+            response_messages=response_messages,
+            agent_state=agent_state,
+        )
+    async def _handle_ai_response(
+        self,
+        tool_call: ToolCall,
+        valid_tool_names: list[str],
+        agent_state: AgentState,
+        tool_rules_solver: ToolRulesSolver,
+        actor: User,
+        step_id: str | None = None,
+        reasoning_content: list[TextContent | ReasoningContent | RedactedReasoningContent | OmittedReasoningContent] | None = None,
+        pre_computed_assistant_message_id: str | None = None,
+        initial_messages: list[Message] | None = None,
+        is_approval: bool = False,
+        is_denial: bool = False,
+        denial_reason: str | None = None,
+        is_final_step: bool = False,
+        usage: UsageStatistics | None = None,
+        run_id: str | None = None,
+        step_start_time_ns: int | None = None,
+        llm_request_ns: int | None = None,
+    ) -> tuple[list[Message], bool, LettaStopReason | None, str | None]:
+        """
+        Handle the AI response by executing the tool call, creating messages,
+        and determining whether to continue stepping.
+        Returns:
+            tuple[list[Message], bool, LettaStopReason | None]: (persisted_messages, should_continue, stop_reason)
+        """
+        # Initialize default
+        initial_messages = initial_messages or []
+        # Parse and validate the tool-call envelope
+        tool_call_id = tool_call.id or f"call_{uuid.uuid4().hex[:8]}"
+        tool_call_name = tool_call.function.name
+        tool_args = _safe_load_tool_call_str(tool_call.function.arguments)
+        request_heartbeat = _pop_heartbeat(tool_args)
+        tool_args.pop(INNER_THOUGHTS_KWARG, None)
+        # Handle denial flow
+        if is_denial:
+            continue_stepping = True
+            stop_reason = None
+            tool_call_messages = create_letta_messages_from_llm_response(
+                agent_id=agent_state.id,
+                model=agent_state.llm_config.model,
+                function_name=tool_call.function.name,
+                function_arguments={},
+                tool_execution_result=ToolExecutionResult(status="error"),
+                tool_call_id=tool_call_id,
+                function_response=f"Error: request to call tool denied. User reason: {denial_reason}",
+                timezone=agent_state.timezone,
+                continue_stepping=continue_stepping,
+                heartbeat_reason=f"{NON_USER_MSG_PREFIX}Continuing: user denied request to call tool.",
+                reasoning_content=reasoning_content,
+                pre_computed_assistant_message_id=pre_computed_assistant_message_id,
+                is_approval_response=True,
+                step_id=step_id,
+                run_id=run_id,
+            )
+            messages_to_persist = initial_messages + tool_call_messages
+            return messages_to_persist, continue_stepping, stop_reason, None
+        # Handle approval request flow
+        if not is_approval and tool_rules_solver.is_requires_approval_tool(tool_call_name):
+            tool_args[REQUEST_HEARTBEAT_PARAM] = request_heartbeat
+            approval_messages = create_approval_request_message_from_llm_response(
+                agent_id=agent_state.id,
+                model=agent_state.llm_config.model,
+                requested_tool_calls=[
+                    ToolCall(id=tool_call_id, function=FunctionCall(name=tool_call_name, arguments=json.dumps(tool_args)))
+                ],
+                reasoning_content=reasoning_content,
+                pre_computed_assistant_message_id=pre_computed_assistant_message_id,
+                step_id=step_id,
+                run_id=run_id,
+            )
+            messages_to_persist = initial_messages + approval_messages
+            continue_stepping = False
+            stop_reason = LettaStopReason(stop_reason=StopReasonType.requires_approval.value)
+            return messages_to_persist, continue_stepping, stop_reason, None
+        # Execute tool if tool rules allow
+        tool_execution_ns = None
+        tool_rule_violated = tool_call_name not in valid_tool_names and not is_approval
+        if tool_rule_violated:
+            tool_result = _build_rule_violation_result(tool_call_name, valid_tool_names, tool_rules_solver)
+        else:
+            execution: ExecuteToolResult = await workflow.execute_activity(
+                execute_tool,
+                ExecuteToolParams(
+                    tool_name=tool_call_name,
+                    tool_args=tool_args,
+                    agent_state=agent_state,
+                    actor=actor,
+                    step_id=step_id,
+                ),
+                start_to_close_timeout=TOOL_EXECUTION_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+                schedule_to_close_timeout=TOOL_EXECUTION_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+            )
+            # Capture tool execution timing
+            tool_execution_ns = execution.execution_time_ns
+            # Deserialize any serialized exceptions for post processing
+            if is_serialized_exception(execution.tool_execution_result.func_return):
+                execution.tool_execution_result.func_return = deserialize_func_return(execution.tool_execution_result.func_return)
+            tool_result = execution.tool_execution_result
+        # Prepare the function-response payload
+        truncate = tool_call_name not in {"conversation_search", "conversation_search_date", "archival_memory_search"}
+        return_char_limit = next(
+            (t.return_char_limit for t in agent_state.tools if t.name == tool_call_name),
+            None,
+        )
+        function_response_string = validate_function_response(
+            tool_result.func_return,
+            return_char_limit=return_char_limit,
+            truncate=truncate,
+        )
+        # Package the function response (for last_function_response tracking)
+        last_function_response = package_function_response(
+            was_success=tool_result.success_flag,
+            response_string=function_response_string,
+            timezone=agent_state.timezone,
+        )
+        # Decide whether to continue stepping
+        continue_stepping = request_heartbeat
+        heartbeat_reason = None
+        stop_reason = None
+        if tool_rule_violated:
+            continue_stepping = True
+            heartbeat_reason = f"{NON_USER_MSG_PREFIX}Continuing: tool rule violation."
+        else:
+            tool_rules_solver.register_tool_call(tool_call_name)
+            if tool_rules_solver.is_terminal_tool(tool_call_name):
+                if continue_stepping:
+                    stop_reason = LettaStopReason(stop_reason=StopReasonType.tool_rule.value)
+                continue_stepping = False
+            elif tool_rules_solver.has_children_tools(tool_call_name):
+                continue_stepping = True
+                heartbeat_reason = f"{NON_USER_MSG_PREFIX}Continuing: child tool rule."
+            elif tool_rules_solver.is_continue_tool(tool_call_name):
+                continue_stepping = True
+                heartbeat_reason = f"{NON_USER_MSG_PREFIX}Continuing: continue tool rule."
+        # Check if we're at max steps
+        if is_final_step and continue_stepping:
+            continue_stepping = False
+            stop_reason = LettaStopReason(stop_reason=StopReasonType.max_steps.value)
+        else:
+            uncalled = tool_rules_solver.get_uncalled_required_tools(available_tools=set([t.name for t in agent_state.tools]))
+            if not continue_stepping and uncalled:
+                continue_stepping = True
+                heartbeat_reason = f"{NON_USER_MSG_PREFIX}Continuing, user expects these tools: [{', '.join(uncalled)}] to be called still."
+                stop_reason = None
+        # Create Letta messages from the tool response
+        tool_call_messages = create_letta_messages_from_llm_response(
+            agent_id=agent_state.id,
+            model=agent_state.llm_config.model,
+            function_name=tool_call_name,
+            function_arguments=tool_args,
+            tool_execution_result=tool_result,
+            tool_call_id=tool_call_id,
+            function_response=function_response_string,
+            timezone=agent_state.timezone,
+            continue_stepping=continue_stepping,
+            heartbeat_reason=heartbeat_reason,
+            reasoning_content=reasoning_content,
+            pre_computed_assistant_message_id=pre_computed_assistant_message_id,
+            is_approval_response=is_approval or is_denial,
+            step_id=step_id,
+            run_id=run_id,
+        )
+        # Log step
+        step_ns = get_workflow_time_ns() - step_start_time_ns
+        await workflow.execute_activity(
+            create_step,
+            CreateStepParams(
+                agent_state=agent_state,
+                messages=tool_call_messages,
+                actor=actor,
+                run_id=run_id,
+                step_id=step_id,
+                usage=usage,
+                step_ns=step_ns,
+                llm_request_ns=llm_request_ns,
+                tool_execution_ns=tool_execution_ns,
+                stop_reason=stop_reason.stop_reason.value if stop_reason else None,
+            ),
+            start_to_close_timeout=CREATE_STEP_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+            schedule_to_close_timeout=CREATE_STEP_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+        )
+        messages_to_persist = initial_messages + tool_call_messages
+        # Persist messages to database
+        persisted_messages_result = await workflow.execute_activity(
+            create_messages,
+            CreateMessagesParams(
+                messages=messages_to_persist,
+                actor=actor,
+                project_id=agent_state.project_id,
+                template_id=agent_state.template_id,
+            ),
+            start_to_close_timeout=CREATE_MESSAGES_ACTIVITY_START_TO_CLOSE_TIMEOUT,
+            schedule_to_close_timeout=CREATE_MESSAGES_ACTIVITY_SCHEDULE_TO_CLOSE_TIMEOUT,
+        )
+        return persisted_messages_result.messages, continue_stepping, stop_reason, last_function_response
+    async def _get_valid_tools(self, agent_state: AgentState, tool_rules_solver: ToolRulesSolver, last_function_response: str):
+        tools = agent_state.tools
+        valid_tool_names = tool_rules_solver.get_allowed_tool_names(
+            available_tools=set([t.name for t in tools]),
+            last_function_response=last_function_response,
+            error_on_empty=False,  # Return empty list instead of raising error
+        ) or list(set(t.name for t in tools))
+        allowed_tools = [enable_strict_mode(t.json_schema) for t in tools if t.name in set(valid_tool_names)]
+        terminal_tool_names = {rule.tool_name for rule in tool_rules_solver.terminal_tool_rules}
+        allowed_tools = runtime_override_tool_json_schema(
+            tool_list=allowed_tools,
+            response_format=agent_state.response_format,
+            request_heartbeat=True,
+            terminal_tools=terminal_tool_names,
+        )
+        return allowed_tools
+    def _map_exception_to_stop_reason(self, exc: Exception) -> StopReasonType:
+        """Map activity/workflow exceptions to a StopReasonType for run updates."""
+        try:
+            if isinstance(exc, ActivityError) and getattr(exc, "cause", None) is not None:
+                return self._map_exception_to_stop_reason(exc.cause)  # type: ignore[arg-type]
+            if isinstance(exc, ApplicationError):
+                err_type = (exc.type or "").strip()
+                if err_type in ("ValueError", "LLMJSONParsingError"):
+                    return StopReasonType.invalid_llm_response
+                if err_type == "ContextWindowExceededError":
+                    return StopReasonType.invalid_llm_response
+                if err_type.startswith("LLM") or err_type.endswith("Error"):
+                    return StopReasonType.llm_api_error
+                return StopReasonType.error
+        except Exception:
+            return StopReasonType.error
+        return StopReasonType.error

letta-nightly 0.13.0.dev20251030104218__py3-none-any.whl → 0.13.1.dev20251031234110__py3-none-any.whl

Potentially problematic release.

letta-nightly 0.13.0.dev20251030104218py3-none-any.whl → 0.13.1.dev20251031234110py3-none-any.whl