PyPI - klaude-code - Versions diffs - 2.5.1__py3-none-any.whl → 2.5.3__py3-none-any.whl - Mend

klaude-code 2.5.1py3-none-any.whl → 2.5.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (58) hide show

klaude_code/.DS_Store +0 -0
klaude_code/cli/auth_cmd.py +2 -13
klaude_code/cli/cost_cmd.py +10 -10
klaude_code/cli/list_model.py +8 -0
klaude_code/cli/main.py +41 -8
klaude_code/cli/session_cmd.py +2 -11
klaude_code/config/assets/builtin_config.yaml +45 -26
klaude_code/config/config.py +30 -7
klaude_code/config/model_matcher.py +3 -3
klaude_code/config/sub_agent_model_helper.py +1 -1
klaude_code/const.py +2 -1
klaude_code/core/agent_profile.py +1 -0
klaude_code/core/executor.py +4 -0
klaude_code/core/loaded_skills.py +36 -0
klaude_code/core/tool/context.py +1 -3
klaude_code/core/tool/file/edit_tool.py +1 -1
klaude_code/core/tool/file/read_tool.py +2 -2
klaude_code/core/tool/file/write_tool.py +1 -1
klaude_code/core/turn.py +19 -7
klaude_code/llm/anthropic/client.py +97 -60
klaude_code/llm/anthropic/input.py +20 -9
klaude_code/llm/google/client.py +223 -148
klaude_code/llm/google/input.py +44 -36
klaude_code/llm/openai_compatible/stream.py +109 -99
klaude_code/llm/openrouter/reasoning.py +4 -29
klaude_code/llm/partial_message.py +2 -32
klaude_code/llm/responses/client.py +99 -81
klaude_code/llm/responses/input.py +11 -25
klaude_code/llm/stream_parts.py +94 -0
klaude_code/log.py +57 -0
klaude_code/protocol/events/system.py +3 -0
klaude_code/protocol/llm_param.py +1 -0
klaude_code/session/export.py +259 -91
klaude_code/session/templates/export_session.html +141 -59
klaude_code/skill/.DS_Store +0 -0
klaude_code/skill/assets/.DS_Store +0 -0
klaude_code/skill/loader.py +1 -0
klaude_code/tui/command/fork_session_cmd.py +14 -23
klaude_code/tui/command/model_picker.py +2 -17
klaude_code/tui/command/refresh_cmd.py +2 -0
klaude_code/tui/command/resume_cmd.py +2 -18
klaude_code/tui/command/sub_agent_model_cmd.py +5 -19
klaude_code/tui/command/thinking_cmd.py +2 -14
klaude_code/tui/components/common.py +1 -1
klaude_code/tui/components/metadata.py +22 -21
klaude_code/tui/components/rich/markdown.py +8 -0
klaude_code/tui/components/rich/quote.py +36 -8
klaude_code/tui/components/rich/theme.py +2 -0
klaude_code/tui/components/welcome.py +32 -0
klaude_code/tui/input/prompt_toolkit.py +3 -1
klaude_code/tui/machine.py +19 -1
klaude_code/tui/renderer.py +3 -4
klaude_code/tui/terminal/selector.py +174 -31
{klaude_code-2.5.1.dist-info → klaude_code-2.5.3.dist-info}/METADATA +1 -1
{klaude_code-2.5.1.dist-info → klaude_code-2.5.3.dist-info}/RECORD +57 -53
klaude_code/skill/assets/jj-workspace/SKILL.md +0 -20
{klaude_code-2.5.1.dist-info → klaude_code-2.5.3.dist-info}/WHEEL +0 -0
{klaude_code-2.5.1.dist-info → klaude_code-2.5.3.dist-info}/entry_points.txt +0 -0

klaude_code/llm/responses/client.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import json
 from collections.abc import AsyncGenerator
-from typing import TYPE_CHECKING, Literal, override
+from typing import TYPE_CHECKING, override
 import httpx
 import openai
@@ -11,9 +11,14 @@ from openai.types.responses.response_create_params import ResponseCreateParamsSt
 from klaude_code.const import LLM_HTTP_TIMEOUT_CONNECT, LLM_HTTP_TIMEOUT_READ, LLM_HTTP_TIMEOUT_TOTAL
 from klaude_code.llm.client import LLMClientABC, LLMStreamABC
 from klaude_code.llm.input_common import apply_config_defaults
-from klaude_code.llm.partial_message import degrade_thinking_to_text
 from klaude_code.llm.registry import register
 from klaude_code.llm.responses.input import convert_history_to_input, convert_tool_schema
+from klaude_code.llm.stream_parts import (
+    append_text_part,
+    append_thinking_text_part,
+    build_partial_message,
+    build_partial_parts,
+)
 from klaude_code.llm.usage import MetadataTracker, error_llm_stream
 from klaude_code.log import DebugType, log_debug
 from klaude_code.protocol import llm_param, message, model
@@ -58,68 +63,82 @@ def build_payload(param: llm_param.LLMCallParameter) -> ResponseCreateParamsStre
 class ResponsesStreamStateManager:
-    """Manages streaming state for Responses API and provides partial message access."""
+    """Manages streaming state for Responses API and provides partial message access.
+    Accumulates parts directly during streaming to support get_partial_message()
+    for cancellation scenarios. Merges consecutive text parts of the same type.
+    Each reasoning summary is kept as a separate ThinkingTextPart.
+    """
     def __init__(self, model_id: str) -> None:
         self.model_id = model_id
         self.response_id: str | None = None
-        self.stage: Literal["waiting", "thinking", "assistant", "tool"] = "waiting"
-        self.accumulated_thinking: list[str] = []
-        self.accumulated_text: list[str] = []
-        self.pending_signature: str | None = None
         self.assistant_parts: list[message.Part] = []
         self.stop_reason: model.StopReason | None = None
-    def flush_thinking(self) -> None:
-        """Flush accumulated thinking content into parts."""
-        if self.accumulated_thinking:
-            self.assistant_parts.append(
-                message.ThinkingTextPart(
-                    text="".join(self.accumulated_thinking),
-                    model_id=self.model_id,
-                )
+        self._new_thinking_part: bool = True  # Start fresh for first thinking part
+        self._summary_count: int = 0  # Track number of summary parts seen
+    def start_new_thinking_part(self) -> bool:
+        """Mark that the next thinking text should create a new ThinkingTextPart.
+        Returns True if this is not the first summary part (needs separator).
+        """
+        self._new_thinking_part = True
+        needs_separator = self._summary_count > 0
+        self._summary_count += 1
+        return needs_separator
+    def append_thinking_text(self, text: str) -> None:
+        """Append thinking text, merging with previous ThinkingTextPart if in same summary."""
+        if (
+            append_thinking_text_part(
+                self.assistant_parts,
+                text,
+                model_id=self.model_id,
+                force_new=self._new_thinking_part,
             )
-            self.accumulated_thinking.clear()
-        if self.pending_signature:
-            self.assistant_parts.append(
-                message.ThinkingSignaturePart(
-                    signature=self.pending_signature,
-                    model_id=self.model_id,
-                    format="openai_reasoning",
-                )
+            is not None
+        ):
+            self._new_thinking_part = False
+    def append_text(self, text: str) -> None:
+        """Append text, merging with previous TextPart if possible."""
+        append_text_part(self.assistant_parts, text)
+    def append_thinking_signature(self, signature: str) -> None:
+        """Append a ThinkingSignaturePart after the current part."""
+        self.assistant_parts.append(
+            message.ThinkingSignaturePart(
+                signature=signature,
+                model_id=self.model_id,
+                format="openai-responses",
             )
-            self.pending_signature = None
+        )
-    def flush_text(self) -> None:
-        """Flush accumulated text content into parts."""
-        if not self.accumulated_text:
-            return
-        self.assistant_parts.append(message.TextPart(text="".join(self.accumulated_text)))
-        self.accumulated_text.clear()
+    def append_tool_call(self, call_id: str, item_id: str | None, name: str, arguments_json: str) -> None:
+        """Append a ToolCallPart."""
+        self.assistant_parts.append(
+            message.ToolCallPart(
+                call_id=call_id,
+                id=item_id,
+                tool_name=name,
+                arguments_json=arguments_json,
+            )
+        )
-    def flush_all(self) -> list[message.Part]:
-        """Flush all accumulated content and return parts."""
-        self.flush_thinking()
-        self.flush_text()
-        return list(self.assistant_parts)
+    def get_partial_parts(self) -> list[message.Part]:
+        """Get accumulated parts excluding tool calls, with thinking degraded.
+        Filters out ToolCallPart and applies degrade_thinking_to_text.
+        """
+        return build_partial_parts(self.assistant_parts)
     def get_partial_message(self) -> message.AssistantMessage | None:
-        """Build a partial AssistantMessage from accumulated state."""
-        parts = self.flush_all()
-        filtered_parts: list[message.Part] = []
-        for part in parts:
-            if isinstance(part, message.ToolCallPart):
-                continue
-            filtered_parts.append(part)
-        filtered_parts = degrade_thinking_to_text(filtered_parts)
-        if not filtered_parts:
-            return None
-        return message.AssistantMessage(
-            parts=filtered_parts,
-            response_id=self.response_id,
-            stop_reason="aborted",
-        )
+        """Build a partial AssistantMessage from accumulated state.
+        Returns None if no content has been accumulated yet.
+        """
+        return build_partial_message(self.assistant_parts, response_id=self.response_id)
 async def parse_responses_stream(
@@ -157,24 +176,28 @@ async def parse_responses_stream(
             match event:
                 case responses.ResponseCreatedEvent() as event:
                     state.response_id = event.response.id
+                case responses.ResponseReasoningSummaryPartAddedEvent():
+                    # New reasoning summary part started, ensure it becomes a new ThinkingTextPart
+                    needs_separator = state.start_new_thinking_part()
+                    if needs_separator:
+                        # Add blank lines between summary parts for visual separation
+                        yield message.ThinkingTextDelta(content="  \n  \n", response_id=state.response_id)
                 case responses.ResponseReasoningSummaryTextDeltaEvent() as event:
                     if event.delta:
                         metadata_tracker.record_token()
-                        if state.stage == "assistant":
-                            state.flush_text()
-                        state.stage = "thinking"
-                        state.accumulated_thinking.append(event.delta)
+                        state.append_thinking_text(event.delta)
                         yield message.ThinkingTextDelta(content=event.delta, response_id=state.response_id)
                 case responses.ResponseReasoningSummaryTextDoneEvent() as event:
-                    if event.text and not state.accumulated_thinking:
-                        state.accumulated_thinking.append(event.text)
+                    # Fallback: if no delta was received but done has full text, use it
+                    if event.text:
+                        # Check if we already have content for this summary by seeing if last part matches
+                        last_part = state.assistant_parts[-1] if state.assistant_parts else None
+                        if not isinstance(last_part, message.ThinkingTextPart) or not last_part.text:
+                            state.append_thinking_text(event.text)
                 case responses.ResponseTextDeltaEvent() as event:
                     if event.delta:
                         metadata_tracker.record_token()
-                        if state.stage == "thinking":
-                            state.flush_thinking()
-                        state.stage = "assistant"
-                        state.accumulated_text.append(event.delta)
+                        state.append_text(event.delta)
                         yield message.AssistantTextDelta(content=event.delta, response_id=state.response_id)
                 case responses.ResponseOutputItemAddedEvent() as event:
                     if isinstance(event.item, responses.ResponseFunctionToolCall):
@@ -188,30 +211,23 @@ async def parse_responses_stream(
                     match event.item:
                         case responses.ResponseReasoningItem() as item:
                             if item.encrypted_content:
-                                state.pending_signature = item.encrypted_content
+                                state.append_thinking_signature(item.encrypted_content)
                         case responses.ResponseOutputMessage() as item:
-                            if not state.accumulated_text:
+                            # Fallback: if no text delta was received, extract from final message
+                            has_text = any(isinstance(p, message.TextPart) for p in state.assistant_parts)
+                            if not has_text:
                                 text_content = "\n".join(
-                                    [
-                                        part.text
-                                        for part in item.content
-                                        if isinstance(part, responses.ResponseOutputText)
-                                    ]
+                                    part.text for part in item.content if isinstance(part, responses.ResponseOutputText)
                                 )
                                 if text_content:
-                                    state.accumulated_text.append(text_content)
+                                    state.append_text(text_content)
                         case responses.ResponseFunctionToolCall() as item:
                             metadata_tracker.record_token()
-                            state.flush_thinking()
-                            state.flush_text()
-                            state.stage = "tool"
-                            state.assistant_parts.append(
-                                message.ToolCallPart(
-                                    call_id=item.call_id,
-                                    id=item.id,
-                                    tool_name=item.name,
-                                    arguments_json=item.arguments.strip(),
-                                )
+                            state.append_tool_call(
+                                call_id=item.call_id,
+                                item_id=item.id,
+                                name=item.name,
+                                arguments_json=item.arguments.strip(),
                             )
                         case _:
                             pass
@@ -254,10 +270,12 @@ async def parse_responses_stream(
                     )
     except (openai.OpenAIError, httpx.HTTPError) as e:
         yield message.StreamErrorItem(error=f"{e.__class__.__name__} {e!s}")
+        state.stop_reason = "error"
-    parts = state.flush_all()
     metadata_tracker.set_response_id(state.response_id)
     metadata = metadata_tracker.finalize()
+    # On error, use partial parts (excluding incomplete tool calls) for potential prefill on retry
+    parts = state.get_partial_parts() if state.stop_reason == "error" else list(state.assistant_parts)
     yield message.AssistantMessage(
         parts=parts,
         response_id=state.response_id,

klaude_code/llm/responses/input.py CHANGED Viewed

@@ -80,8 +80,6 @@ def convert_history_to_input(
     """Convert a list of messages to response input params."""
     items: list[responses.ResponseInputItemParam] = []
-    degraded_thinking_texts: list[str] = []
     for msg, attachment in attach_developer_messages(history):
         match msg:
             case message.SystemMessage():
@@ -116,12 +114,19 @@ def convert_history_to_input(
             case message.ToolResultMessage():
                 items.append(_build_tool_result_item(msg, attachment))
             case message.AssistantMessage():
-                assistant_text_parts: list[responses.ResponseInputContentParam] = []
+                assistant_text_parts: list[responses.ResponseOutputTextParam] = []
                 pending_thinking_text: str | None = None
                 pending_signature: str | None = None
                 native_thinking_parts, degraded_for_message = split_thinking_parts(msg, model_name)
                 native_thinking_ids = {id(part) for part in native_thinking_parts}
-                degraded_thinking_texts.extend(degraded_for_message)
+                if degraded_for_message:
+                    degraded_text = "<thinking>\n" + "\n".join(degraded_for_message) + "\n</thinking>"
+                    assistant_text_parts.append(
+                        cast(
+                            responses.ResponseOutputTextParam,
+                            {"type": "output_text", "text": degraded_text},
+                        )
+                    )
                 def flush_text() -> None:
                     nonlocal assistant_text_parts
@@ -164,8 +169,8 @@ def convert_history_to_input(
                     if isinstance(part, message.TextPart):
                         assistant_text_parts.append(
                             cast(
-                                responses.ResponseInputContentParam,
-                                {"type": "input_text", "text": part.text},
+                                responses.ResponseOutputTextParam,
+                                {"type": "output_text", "text": part.text},
                             )
                         )
                     elif isinstance(part, message.ToolCallPart):
@@ -188,25 +193,6 @@ def convert_history_to_input(
             case _:
                 continue
-    if degraded_thinking_texts:
-        degraded_item = cast(
-            responses.ResponseInputItemParam,
-            {
-                "type": "message",
-                "role": "assistant",
-                "content": [
-                    cast(
-                        responses.ResponseInputContentParam,
-                        {
-                            "type": "input_text",
-                            "text": "<thinking>\n" + "\n".join(degraded_thinking_texts) + "\n</thinking>",
-                        },
-                    )
-                ],
-            },
-        )
-        items.insert(0, degraded_item)
     return items

klaude_code/llm/stream_parts.py ADDED Viewed

@@ -0,0 +1,94 @@
+from __future__ import annotations
+from collections.abc import MutableSequence
+from klaude_code.protocol import message
+def append_text_part(parts: MutableSequence[message.Part], text: str) -> int | None:
+    if not text:
+        return None
+    if parts:
+        last = parts[-1]
+        if isinstance(last, message.TextPart):
+            parts[-1] = message.TextPart(text=last.text + text)
+            return len(parts) - 1
+    parts.append(message.TextPart(text=text))
+    return len(parts) - 1
+def append_thinking_text_part(
+    parts: MutableSequence[message.Part],
+    text: str,
+    *,
+    model_id: str,
+    force_new: bool = False,
+) -> int | None:
+    if not text:
+        return None
+    if not force_new and parts:
+        last = parts[-1]
+        if isinstance(last, message.ThinkingTextPart):
+            parts[-1] = message.ThinkingTextPart(
+                text=last.text + text,
+                model_id=model_id,
+            )
+            return len(parts) - 1
+    parts.append(message.ThinkingTextPart(text=text, model_id=model_id))
+    return len(parts) - 1
+def degrade_thinking_to_text(parts: list[message.Part]) -> list[message.Part]:
+    """Degrade thinking parts into a regular TextPart.
+    Some providers require thinking signatures/encrypted content to be echoed back
+    for subsequent calls. During interruption we cannot reliably determine whether
+    we have a complete signature, so we persist thinking as plain text instead.
+    """
+    thinking_texts: list[str] = []
+    non_thinking_parts: list[message.Part] = []
+    for part in parts:
+        if isinstance(part, message.ThinkingTextPart):
+            text = part.text
+            if text and text.strip():
+                thinking_texts.append(text)
+            continue
+        if isinstance(part, message.ThinkingSignaturePart):
+            continue
+        non_thinking_parts.append(part)
+    if not thinking_texts:
+        return non_thinking_parts
+    joined = "\n".join(thinking_texts).strip()
+    thinking_block = f"<thinking>\n{joined}\n</thinking>"
+    if non_thinking_parts:
+        thinking_block += "\n\n"
+    return [message.TextPart(text=thinking_block), *non_thinking_parts]
+def build_partial_parts(parts: list[message.Part]) -> list[message.Part]:
+    filtered_parts: list[message.Part] = [p for p in parts if not isinstance(p, message.ToolCallPart)]
+    return degrade_thinking_to_text(filtered_parts)
+def build_partial_message(
+    parts: list[message.Part],
+    *,
+    response_id: str | None,
+) -> message.AssistantMessage | None:
+    partial_parts = build_partial_parts(parts)
+    if not partial_parts:
+        return None
+    return message.AssistantMessage(
+        parts=partial_parts,
+        response_id=response_id,
+        stop_reason="aborted",
+    )

klaude_code/log.py CHANGED Viewed

@@ -1,13 +1,16 @@
 import gzip
+import json
 import logging
 import os
 import shutil
 import subprocess
+from base64 import b64encode
 from collections.abc import Iterable
 from datetime import datetime, timedelta
 from enum import Enum
 from logging.handlers import RotatingFileHandler
 from pathlib import Path
+from typing import cast
 from rich.console import Console
 from rich.logging import RichHandler
@@ -316,3 +319,57 @@ def _trash_path(path: Path) -> None:
         )
     except FileNotFoundError:
         path.unlink(missing_ok=True)
+# Debug JSON serialization utilities
+_DEBUG_TRUNCATE_PREFIX_CHARS = 96
+# Keys whose values should be truncated (e.g., signatures, large payloads)
+_TRUNCATE_KEYS = {"thought_signature", "thoughtSignature"}
+def _truncate_debug_str(value: str, *, prefix_chars: int = _DEBUG_TRUNCATE_PREFIX_CHARS) -> str:
+    if len(value) <= prefix_chars:
+        return value
+    return f"{value[:prefix_chars]}...(truncated,len={len(value)})"
+def _sanitize_debug_value(value: object) -> object:
+    if isinstance(value, (bytes, bytearray)):
+        encoded = b64encode(bytes(value)).decode("ascii")
+        return _truncate_debug_str(encoded)
+    if isinstance(value, str):
+        return value
+    if isinstance(value, list):
+        return [_sanitize_debug_value(v) for v in cast(list[object], value)]
+    if isinstance(value, dict):
+        return _sanitize_debug_dict(value)  # type: ignore[arg-type]
+    return value
+def _sanitize_debug_dict(obj: dict[object, object]) -> dict[object, object]:
+    sanitized: dict[object, object] = {}
+    for k, v in obj.items():
+        if k in _TRUNCATE_KEYS:
+            if isinstance(v, str):
+                sanitized[k] = _truncate_debug_str(v)
+            else:
+                sanitized[k] = _sanitize_debug_value(v)
+            continue
+        sanitized[k] = _sanitize_debug_value(v)
+    # Truncate inline image payloads (data field with mime_type indicates image blob)
+    if "data" in sanitized and ("mime_type" in sanitized or "mimeType" in sanitized):
+        data = sanitized.get("data")
+        if isinstance(data, str):
+            sanitized["data"] = _truncate_debug_str(data)
+        elif isinstance(data, (bytes, bytearray)):
+            encoded = b64encode(bytes(data)).decode("ascii")
+            sanitized["data"] = _truncate_debug_str(encoded)
+    return sanitized
+def debug_json(value: object) -> str:
+    """Serialize a value to JSON for debug logging, truncating large payloads."""
+    return json.dumps(_sanitize_debug_value(value), ensure_ascii=False)

klaude_code/protocol/events/system.py CHANGED Viewed

@@ -1,5 +1,7 @@
 from __future__ import annotations
+from pydantic import Field
 from klaude_code.protocol import llm_param
 from klaude_code.protocol.events.chat import DeveloperMessageEvent, UserMessageEvent
 from klaude_code.protocol.events.lifecycle import TaskFinishEvent, TaskStartEvent, TurnStartEvent
@@ -14,6 +16,7 @@ class WelcomeEvent(Event):
     work_dir: str
     llm_config: llm_param.LLMConfigParameter
     show_klaude_code_info: bool = True
+    loaded_skills: dict[str, list[str]] = Field(default_factory=dict)
 class ErrorEvent(Event):

klaude_code/protocol/llm_param.py CHANGED Viewed

@@ -120,6 +120,7 @@ class LLMConfigProviderParameter(BaseModel):
 class LLMConfigModelParameter(BaseModel):
     model_id: str | None = None
+    disabled: bool = False
     temperature: float | None = None
     max_tokens: int | None = None
     context_limit: int | None = None

klaude-code 2.5.1__py3-none-any.whl → 2.5.3__py3-none-any.whl

klaude-code 2.5.1py3-none-any.whl → 2.5.3py3-none-any.whl