PyPI - klaude-code - Versions diffs - 2.4.1__py3-none-any.whl → 2.5.0__py3-none-any.whl - Mend

klaude-code 2.4.1py3-none-any.whl → 2.5.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (58) hide show

klaude_code/app/runtime.py +2 -6
klaude_code/cli/main.py +0 -1
klaude_code/config/assets/builtin_config.yaml +7 -0
klaude_code/const.py +7 -4
klaude_code/core/agent.py +10 -1
klaude_code/core/agent_profile.py +47 -35
klaude_code/core/executor.py +6 -21
klaude_code/core/manager/sub_agent_manager.py +17 -1
klaude_code/core/prompts/prompt-sub-agent-web.md +4 -4
klaude_code/core/task.py +65 -4
klaude_code/core/tool/__init__.py +0 -5
klaude_code/core/tool/context.py +12 -1
klaude_code/core/tool/offload.py +311 -0
klaude_code/core/tool/shell/bash_tool.md +1 -43
klaude_code/core/tool/sub_agent_tool.py +1 -0
klaude_code/core/tool/todo/todo_write_tool.md +0 -23
klaude_code/core/tool/tool_runner.py +14 -9
klaude_code/core/tool/web/web_fetch_tool.md +1 -1
klaude_code/core/tool/web/web_fetch_tool.py +14 -39
klaude_code/core/turn.py +128 -138
klaude_code/llm/anthropic/client.py +176 -82
klaude_code/llm/bedrock/client.py +8 -12
klaude_code/llm/claude/client.py +11 -15
klaude_code/llm/client.py +31 -4
klaude_code/llm/codex/client.py +7 -11
klaude_code/llm/google/client.py +150 -69
klaude_code/llm/openai_compatible/client.py +10 -15
klaude_code/llm/openai_compatible/stream.py +68 -6
klaude_code/llm/openrouter/client.py +9 -15
klaude_code/llm/partial_message.py +35 -0
klaude_code/llm/responses/client.py +134 -68
klaude_code/llm/usage.py +30 -0
klaude_code/protocol/commands.py +0 -4
klaude_code/protocol/events/metadata.py +1 -0
klaude_code/protocol/events/streaming.py +1 -0
klaude_code/protocol/events/system.py +0 -4
klaude_code/protocol/model.py +2 -15
klaude_code/protocol/sub_agent/explore.py +0 -10
klaude_code/protocol/sub_agent/image_gen.py +0 -7
klaude_code/protocol/sub_agent/task.py +0 -10
klaude_code/protocol/sub_agent/web.py +4 -12
klaude_code/session/templates/export_session.html +4 -4
klaude_code/skill/manager.py +2 -1
klaude_code/tui/components/metadata.py +41 -49
klaude_code/tui/components/rich/markdown.py +1 -3
klaude_code/tui/components/rich/theme.py +2 -2
klaude_code/tui/components/sub_agent.py +9 -1
klaude_code/tui/components/tools.py +0 -31
klaude_code/tui/components/welcome.py +1 -32
klaude_code/tui/input/prompt_toolkit.py +25 -9
klaude_code/tui/machine.py +40 -8
klaude_code/tui/renderer.py +1 -0
{klaude_code-2.4.1.dist-info → klaude_code-2.5.0.dist-info}/METADATA +2 -2
{klaude_code-2.4.1.dist-info → klaude_code-2.5.0.dist-info}/RECORD +56 -56
klaude_code/core/prompts/prompt-nano-banana.md +0 -1
klaude_code/core/tool/truncation.py +0 -203
{klaude_code-2.4.1.dist-info → klaude_code-2.5.0.dist-info}/WHEEL +0 -0
{klaude_code-2.4.1.dist-info → klaude_code-2.5.0.dist-info}/entry_points.txt +0 -0

klaude_code/core/turn.py CHANGED Viewed

@@ -4,7 +4,7 @@ from collections.abc import AsyncGenerator
 from dataclasses import dataclass, field
 from typing import TYPE_CHECKING
-from klaude_code.const import INTERRUPT_MARKER, SUPPORTED_IMAGE_SIZES
+from klaude_code.const import SUPPORTED_IMAGE_SIZES
 from klaude_code.core.tool import ToolABC
 from klaude_code.core.tool.context import SubAgentResumeClaims, ToolContext
@@ -20,6 +20,7 @@ from klaude_code.core.tool.tool_runner import (
     ToolExecutorEvent,
 )
 from klaude_code.llm import LLMClientABC
+from klaude_code.llm.client import LLMStreamABC
 from klaude_code.log import DebugType, log_debug
 from klaude_code.protocol import events, llm_param, message, model, tools
@@ -104,8 +105,7 @@ class TurnExecutor:
         self._context = context
         self._tool_executor: ToolExecutor | None = None
         self._turn_result: TurnResult | None = None
-        self._assistant_delta_buffer: list[str] = []
-        self._assistant_response_id: str | None = None
+        self._llm_stream: LLMStreamABC | None = None
     @property
     def report_back_result(self) -> str | None:
@@ -147,7 +147,7 @@ class TurnExecutor:
     def cancel(self) -> list[events.Event]:
         """Cancel running tools and return any resulting events."""
         ui_events: list[events.Event] = []
-        self._persist_partial_assistant_on_cancel()
+        self._persist_partial_message_on_cancel()
         if self._tool_executor is not None:
             for exec_event in self._tool_executor.cancel():
                 for ui_event in build_events_from_tool_executor_event(self._context.session_ctx.session_id, exec_event):
@@ -237,146 +237,144 @@ class TurnExecutor:
             if image_config.model_dump(exclude_none=True):
                 call_param.image_config = image_config
-        async for delta in ctx.llm_client.call(call_param):
-            log_debug(
-                f"[{delta.__class__.__name__}]",
-                delta.model_dump_json(exclude_none=True),
-                style="green",
-                debug_type=DebugType.RESPONSE,
-            )
-            match delta:
-                case message.ThinkingTextDelta() as delta:
-                    if not thinking_active:
-                        thinking_active = True
-                        yield events.ThinkingStartEvent(
-                            response_id=delta.response_id,
-                            session_id=session_ctx.session_id,
-                        )
-                    yield events.ThinkingDeltaEvent(
-                        content=delta.content,
-                        response_id=delta.response_id,
-                        session_id=session_ctx.session_id,
-                    )
-                case message.AssistantTextDelta() as delta:
-                    if thinking_active:
-                        thinking_active = False
-                        yield events.ThinkingEndEvent(
+        self._llm_stream = await ctx.llm_client.call(call_param)
+        try:
+            async for delta in self._llm_stream:
+                log_debug(
+                    f"[{delta.__class__.__name__}]",
+                    delta.model_dump_json(exclude_none=True),
+                    style="green",
+                    debug_type=DebugType.RESPONSE,
+                )
+                match delta:
+                    case message.ThinkingTextDelta() as delta:
+                        if not thinking_active:
+                            thinking_active = True
+                            yield events.ThinkingStartEvent(
+                                response_id=delta.response_id,
+                                session_id=session_ctx.session_id,
+                            )
+                        yield events.ThinkingDeltaEvent(
+                            content=delta.content,
                             response_id=delta.response_id,
                             session_id=session_ctx.session_id,
                         )
-                    if not assistant_text_active:
-                        assistant_text_active = True
-                        yield events.AssistantTextStartEvent(
+                    case message.AssistantTextDelta() as delta:
+                        if thinking_active:
+                            thinking_active = False
+                            yield events.ThinkingEndEvent(
+                                response_id=delta.response_id,
+                                session_id=session_ctx.session_id,
+                            )
+                        if not assistant_text_active:
+                            assistant_text_active = True
+                            yield events.AssistantTextStartEvent(
+                                response_id=delta.response_id,
+                                session_id=session_ctx.session_id,
+                            )
+                        yield events.AssistantTextDeltaEvent(
+                            content=delta.content,
                             response_id=delta.response_id,
                             session_id=session_ctx.session_id,
                         )
-                    if delta.response_id:
-                        self._assistant_response_id = delta.response_id
-                    self._assistant_delta_buffer.append(delta.content)
-                    yield events.AssistantTextDeltaEvent(
-                        content=delta.content,
-                        response_id=delta.response_id,
-                        session_id=session_ctx.session_id,
-                    )
-                case message.AssistantImageDelta() as delta:
-                    if thinking_active:
-                        thinking_active = False
-                        yield events.ThinkingEndEvent(
+                    case message.AssistantImageDelta() as delta:
+                        if thinking_active:
+                            thinking_active = False
+                            yield events.ThinkingEndEvent(
+                                response_id=delta.response_id,
+                                session_id=session_ctx.session_id,
+                            )
+                        yield events.AssistantImageDeltaEvent(
+                            file_path=delta.file_path,
                             response_id=delta.response_id,
                             session_id=session_ctx.session_id,
                         )
-                    yield events.AssistantImageDeltaEvent(
-                        file_path=delta.file_path,
-                        response_id=delta.response_id,
-                        session_id=session_ctx.session_id,
-                    )
-                case message.AssistantMessage() as msg:
-                    if msg.response_id is None and self._assistant_response_id:
-                        msg.response_id = self._assistant_response_id
-                    if thinking_active:
-                        thinking_active = False
-                        yield events.ThinkingEndEvent(
-                            response_id=msg.response_id,
-                            session_id=session_ctx.session_id,
-                        )
-                    if assistant_text_active:
-                        assistant_text_active = False
-                        yield events.AssistantTextEndEvent(
-                            response_id=msg.response_id,
-                            session_id=session_ctx.session_id,
-                        )
-                    turn_result.assistant_message = msg
-                    for part in msg.parts:
-                        if isinstance(part, message.ToolCallPart):
-                            turn_result.tool_calls.append(
-                                ToolCallRequest(
-                                    response_id=msg.response_id,
-                                    call_id=part.call_id,
-                                    tool_name=part.tool_name,
-                                    arguments_json=part.arguments_json,
+                    case message.AssistantMessage() as msg:
+                        if thinking_active:
+                            thinking_active = False
+                            yield events.ThinkingEndEvent(
+                                response_id=msg.response_id,
+                                session_id=session_ctx.session_id,
+                            )
+                        if assistant_text_active:
+                            assistant_text_active = False
+                            yield events.AssistantTextEndEvent(
+                                response_id=msg.response_id,
+                                session_id=session_ctx.session_id,
+                            )
+                        turn_result.assistant_message = msg
+                        for part in msg.parts:
+                            if isinstance(part, message.ToolCallPart):
+                                turn_result.tool_calls.append(
+                                    ToolCallRequest(
+                                        response_id=msg.response_id,
+                                        call_id=part.call_id,
+                                        tool_name=part.tool_name,
+                                        arguments_json=part.arguments_json,
+                                    )
                                 )
+                        if msg.stop_reason != "aborted":
+                            thinking_text = "".join(
+                                part.text for part in msg.parts if isinstance(part, message.ThinkingTextPart)
                             )
-                    if msg.stop_reason != "aborted":
-                        thinking_text = "".join(
-                            part.text for part in msg.parts if isinstance(part, message.ThinkingTextPart)
-                        )
-                        yield events.ResponseCompleteEvent(
-                            content=message.join_text_parts(msg.parts),
-                            response_id=msg.response_id,
-                            session_id=session_ctx.session_id,
-                            thinking_text=thinking_text or None,
-                        )
-                    if msg.stop_reason == "aborted":
-                        yield events.InterruptEvent(session_id=session_ctx.session_id)
-                    if msg.usage:
-                        metadata = msg.usage
-                        if metadata.response_id is None:
-                            metadata.response_id = msg.response_id
-                        if not metadata.model_name:
-                            metadata.model_name = ctx.llm_client.model_name
-                        if metadata.provider is None:
-                            metadata.provider = ctx.llm_client.get_llm_config().provider_name or None
-                        yield events.UsageEvent(
-                            session_id=session_ctx.session_id,
-                            usage=metadata,
+                            yield events.ResponseCompleteEvent(
+                                content=message.join_text_parts(msg.parts),
+                                response_id=msg.response_id,
+                                session_id=session_ctx.session_id,
+                                thinking_text=thinking_text or None,
+                            )
+                        if msg.stop_reason == "aborted":
+                            yield events.InterruptEvent(session_id=session_ctx.session_id)
+                        if msg.usage:
+                            metadata = msg.usage
+                            if metadata.response_id is None:
+                                metadata.response_id = msg.response_id
+                            if not metadata.model_name:
+                                metadata.model_name = ctx.llm_client.model_name
+                            if metadata.provider is None:
+                                metadata.provider = ctx.llm_client.get_llm_config().provider_name or None
+                            yield events.UsageEvent(
+                                session_id=session_ctx.session_id,
+                                usage=metadata,
+                            )
+                    case message.StreamErrorItem() as msg:
+                        turn_result.stream_error = msg
+                        log_debug(
+                            "[StreamError]",
+                            msg.error,
+                            style="red",
+                            debug_type=DebugType.RESPONSE,
                         )
-                case message.StreamErrorItem() as msg:
-                    turn_result.stream_error = msg
-                    log_debug(
-                        "[StreamError]",
-                        msg.error,
-                        style="red",
-                        debug_type=DebugType.RESPONSE,
-                    )
-                case message.ToolCallStartDelta() as msg:
-                    if thinking_active:
-                        thinking_active = False
-                        yield events.ThinkingEndEvent(
-                            response_id=msg.response_id,
+                    case message.ToolCallStartDelta() as msg:
+                        if thinking_active:
+                            thinking_active = False
+                            yield events.ThinkingEndEvent(
+                                response_id=msg.response_id,
+                                session_id=session_ctx.session_id,
+                            )
+                        if assistant_text_active:
+                            assistant_text_active = False
+                            yield events.AssistantTextEndEvent(
+                                response_id=msg.response_id,
+                                session_id=session_ctx.session_id,
+                            )
+                        yield events.ToolCallStartEvent(
                             session_id=session_ctx.session_id,
-                        )
-                    if assistant_text_active:
-                        assistant_text_active = False
-                        yield events.AssistantTextEndEvent(
                             response_id=msg.response_id,
-                            session_id=session_ctx.session_id,
+                            tool_call_id=msg.call_id,
+                            tool_name=msg.name,
+                            model_id=ctx.llm_client.model_name,
                         )
-                    yield events.ToolCallStartEvent(
-                        session_id=session_ctx.session_id,
-                        response_id=msg.response_id,
-                        tool_call_id=msg.call_id,
-                        tool_name=msg.name,
-                    )
-                case _:
-                    continue
+                    case _:
+                        continue
+        finally:
+            self._llm_stream = None
     def _append_success_history(self, turn_result: TurnResult) -> None:
         """Persist successful turn artifacts to conversation history."""
         session_ctx = self._context.session_ctx
         if turn_result.assistant_message:
             session_ctx.append_history([turn_result.assistant_message])
-        self._assistant_delta_buffer.clear()
-        self._assistant_response_id = None
     async def _run_tool_executor(self, tool_calls: list[ToolCallRequest]) -> AsyncGenerator[events.Event]:
         """Run tools for the turn and translate executor events to UI events."""
@@ -404,23 +402,15 @@ class TurnExecutor:
         finally:
             self._tool_executor = None
-    def _persist_partial_assistant_on_cancel(self) -> None:
-        """Persist streamed assistant text when a turn is interrupted.
+    def _persist_partial_message_on_cancel(self) -> None:
+        """Persist accumulated message when a turn is interrupted.
-        Reasoning and tool calls are intentionally discarded on interrupt; only
-        the assistant message text collected so far is saved so it appears in
-        subsequent history/context.
+        Retrieves the partial message from the LLM stream, including both
+        thinking and assistant text accumulated so far.
         """
-        if not self._assistant_delta_buffer:
+        if self._llm_stream is None:
             return
-        partial_text = "".join(self._assistant_delta_buffer) + INTERRUPT_MARKER
-        if not partial_text:
+        partial_message = self._llm_stream.get_partial_message()
+        if partial_message is None:
             return
-        partial_message = message.AssistantMessage(
-            parts=message.text_parts_from_str(partial_text),
-            response_id=self._assistant_response_id,
-            stop_reason="aborted",
-        )
         self._context.session_ctx.append_history([partial_message])
-        self._assistant_delta_buffer.clear()

klaude-code 2.4.1__py3-none-any.whl → 2.5.0__py3-none-any.whl

klaude-code 2.4.1py3-none-any.whl → 2.5.0py3-none-any.whl