PyPI - lite-agent - Versions diffs - 0.6.0__py3-none-any.whl → 0.9.0__py3-none-any.whl - Mend

lite-agent 0.6.0py3-none-any.whl → 0.9.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of lite-agent might be problematic. Click here for more details.

Files changed (21) hide show

lite_agent/agent.py +233 -47
lite_agent/chat_display.py +319 -54
lite_agent/client.py +4 -0
lite_agent/constants.py +30 -0
lite_agent/message_transfers.py +24 -5
lite_agent/processors/completion_event_processor.py +14 -20
lite_agent/processors/response_event_processor.py +23 -15
lite_agent/response_handlers/__init__.py +1 -0
lite_agent/response_handlers/base.py +17 -9
lite_agent/response_handlers/completion.py +35 -7
lite_agent/response_handlers/responses.py +46 -12
lite_agent/runner.py +336 -249
lite_agent/types/__init__.py +2 -0
lite_agent/types/messages.py +6 -5
lite_agent/utils/__init__.py +0 -0
lite_agent/utils/message_builder.py +213 -0
lite_agent/utils/metrics.py +50 -0
{lite_agent-0.6.0.dist-info → lite_agent-0.9.0.dist-info}/METADATA +3 -2
lite_agent-0.9.0.dist-info/RECORD +31 -0
lite_agent-0.6.0.dist-info/RECORD +0 -27
{lite_agent-0.6.0.dist-info → lite_agent-0.9.0.dist-info}/WHEEL +0 -0

lite_agent/chat_display.py CHANGED Viewed

@@ -26,6 +26,8 @@ from lite_agent.types import (
     AgentSystemMessage,
     AgentUserMessage,
     AssistantMessageMeta,
+    AssistantToolCall,
+    AssistantToolCallResult,
     BasicMessageMeta,
     FlexibleRunnerMessage,
     LLMResponseMeta,
@@ -228,9 +230,9 @@ def _update_message_counts(message: FlexibleRunnerMessage, counts: dict[str, int
         counts["Assistant"] += 1
         # Count tool calls and outputs within the assistant message
         for content_item in message.content:
-            if content_item.type == "tool_call":
+            if isinstance(content_item, AssistantToolCall):
                 counts["Function Call"] += 1
-            elif content_item.type == "tool_call_result":
+            elif isinstance(content_item, AssistantToolCallResult):
                 counts["Function Output"] += 1
     elif isinstance(message, NewSystemMessage):
         counts["System"] += 1
@@ -295,10 +297,18 @@ def _process_object_meta(meta: BasicMessageMeta | LLMResponseMeta | AssistantMes
     """处理对象类型的 meta 数据。"""
     # LLMResponseMeta 和 AssistantMessageMeta 都有这些字段
     if isinstance(meta, (LLMResponseMeta, AssistantMessageMeta)):
-        if hasattr(meta, "input_tokens") and meta.input_tokens is not None:
-            total_input += int(meta.input_tokens)
-        if hasattr(meta, "output_tokens") and meta.output_tokens is not None:
-            total_output += int(meta.output_tokens)
+        # For AssistantMessageMeta, use the structured usage field
+        if isinstance(meta, AssistantMessageMeta) and meta.usage is not None:
+            if meta.usage.input_tokens is not None:
+                total_input += int(meta.usage.input_tokens)
+            if meta.usage.output_tokens is not None:
+                total_output += int(meta.usage.output_tokens)
+        # For LLMResponseMeta, use the flat fields
+        elif isinstance(meta, LLMResponseMeta):
+            if hasattr(meta, "input_tokens") and meta.input_tokens is not None:
+                total_input += int(meta.input_tokens)
+            if hasattr(meta, "output_tokens") and meta.output_tokens is not None:
+                total_output += int(meta.output_tokens)
         if hasattr(meta, "latency_ms") and meta.latency_ms is not None:
             total_latency += int(meta.latency_ms)
         if hasattr(meta, "output_time_ms") and meta.output_time_ms is not None:
@@ -363,11 +373,9 @@ def display_chat_summary(messages: RunnerMessages, *, console: Console | None =
         messages: 要汇总的消息列表
         console: Rich Console 实例，如果为 None 则创建新的
     """
-    if console is None:
-        console = Console()
+    active_console = console or Console()
     summary_table = build_chat_summary_table(messages)
-    console.print(summary_table)
+    active_console.print(summary_table)
 def display_messages(
@@ -446,7 +454,7 @@ def _display_single_message_compact(
     show_timestamp: bool = False,
     local_timezone: timezone | None = None,
 ) -> None:
-    """以紧凑格式打印单个消息。"""
+    """以列式格式打印单个消息，类似 rich log。"""
     def truncate_content(content: str, max_length: int) -> str:
         """截断内容并添加省略号。"""
@@ -454,20 +462,259 @@ def _display_single_message_compact(
             return content
         return content[: max_length - 3] + "..."
-    # 创建消息上下文
-    context_config = {
-        "console": console,
-        "index": index,
-        "message": message,
-        "max_content_length": max_content_length,
-        "truncate_content": truncate_content,
-        "show_timestamp": show_timestamp,
-        "local_timezone": local_timezone,
-    }
-    context = _create_message_context(context_config)
+    # 获取时间戳
+    timestamp = None
+    if show_timestamp:
+        message_time = _extract_message_time(message)
+        timestamp = _format_timestamp(message_time, local_timezone=local_timezone)
+    # 创建列式显示
+    _display_message_in_columns(message, console, index, timestamp, max_content_length, truncate_content)
+def _display_message_in_columns(
+    message: FlexibleRunnerMessage,
+    console: Console,
+    index: int | None,
+    timestamp: str | None,
+    max_content_length: int,
+    truncate_content: Callable[[str, int], str],
+) -> None:
+    """以列式格式显示消息，类似 rich log。"""
+    # 构建时间和索引列
+    time_str = timestamp or ""
+    index_str = f"#{index:2d}" if index is not None else ""
+    # 根据消息类型处理内容
+    if isinstance(message, NewUserMessage):
+        _display_user_message_with_columns(message, console, time_str, index_str, max_content_length, truncate_content)
+    elif isinstance(message, NewAssistantMessage):
+        _display_assistant_message_with_columns(message, console, time_str, index_str, max_content_length, truncate_content)
+    elif isinstance(message, NewSystemMessage):
+        _display_system_message_with_columns(message, console, time_str, index_str, max_content_length, truncate_content)
+    else:
+        # 处理旧格式消息
+        _display_legacy_message_with_columns(message, console, time_str, index_str, max_content_length, truncate_content)
+def _display_user_message_with_columns(
+    message: NewUserMessage,
+    console: Console,
+    time_str: str,
+    index_str: str,
+    max_content_length: int,
+    truncate_content: Callable[[str, int], str],
+) -> None:
+    """使用列布局显示用户消息。"""
+    content_parts = []
+    for item in message.content:
+        if item.type == "text":
+            content_parts.append(item.text)
+        elif item.type == "image":
+            if item.image_url:
+                content_parts.append(f"[Image: {item.image_url}]")
+            elif item.file_id:
+                content_parts.append(f"[Image: {item.file_id}]")
+        elif item.type == "file":
+            file_name = item.file_name or item.file_id
+            content_parts.append(f"[File: {file_name}]")
+    content = " ".join(content_parts)
+    content = truncate_content(content, max_content_length)
+    # 创建表格来确保对齐
+    table = Table.grid(padding=0)
+    table.add_column(width=8, justify="left")  # 时间列
+    table.add_column(width=4, justify="left")  # 序号列
+    table.add_column(min_width=0)  # 内容列
+    lines = content.split("\n")
+    for i, line in enumerate(lines):
+        if i == 0:
+            # 第一行显示完整信息
+            table.add_row(
+                f"[dim]{time_str:8}[/dim]",
+                f"[dim]{index_str:4}[/dim]",
+                f"[blue]User:[/blue] {line}",
+            )
+        else:
+            # 续行只在内容列显示
+            table.add_row("", "", line)
+    console.print(table)
+def _display_system_message_with_columns(
+    message: NewSystemMessage,
+    console: Console,
+    time_str: str,
+    index_str: str,
+    max_content_length: int,
+    truncate_content: Callable[[str, int], str],
+) -> None:
+    """使用列布局显示系统消息。"""
+    content = truncate_content(message.content, max_content_length)
+    # 创建表格来确保对齐
+    table = Table.grid(padding=0)
+    table.add_column(width=8, justify="left")  # 时间列
+    table.add_column(width=4, justify="left")  # 序号列
+    table.add_column(min_width=0)  # 内容列
+    lines = content.split("\n")
+    for i, line in enumerate(lines):
+        if i == 0:
+            # 第一行显示完整信息
+            table.add_row(
+                f"[dim]{time_str:8}[/dim]",
+                f"[dim]{index_str:4}[/dim]",
+                f"[yellow]System:[/yellow] {line}",
+            )
+        else:
+            # 续行只在内容列显示
+            table.add_row("", "", line)
+    console.print(table)
+def _display_assistant_message_with_columns(
+    message: NewAssistantMessage,
+    console: Console,
+    time_str: str,
+    index_str: str,
+    max_content_length: int,
+    truncate_content: Callable[[str, int], str],
+) -> None:
+    """使用列布局显示助手消息。"""
+    # 提取内容
+    text_parts = []
+    tool_calls = []
+    tool_results = []
+    for item in message.content:
+        if item.type == "text":
+            text_parts.append(item.text)
+        elif item.type == "tool_call":
+            tool_calls.append(item)
+        elif item.type == "tool_call_result":
+            tool_results.append(item)
+    # 构建元信息
+    meta_info = ""
+    if message.meta:
+        meta_parts = []
+        if message.meta.model is not None:
+            meta_parts.append(f"Model:{message.meta.model}")
+        if message.meta.latency_ms is not None:
+            meta_parts.append(f"Latency:{message.meta.latency_ms}ms")
+        if message.meta.total_time_ms is not None:
+            meta_parts.append(f"Output:{message.meta.total_time_ms}ms")
+        if message.meta.usage and message.meta.usage.input_tokens is not None and message.meta.usage.output_tokens is not None:
+            total_tokens = message.meta.usage.input_tokens + message.meta.usage.output_tokens
+            meta_parts.append(f"Tokens:↑{message.meta.usage.input_tokens}↓{message.meta.usage.output_tokens}={total_tokens}")
+        if meta_parts:
+            meta_info = f" [dim]({' | '.join(meta_parts)})[/dim]"
+    # 创建表格来确保对齐
+    table = Table.grid(padding=0)
+    table.add_column(width=8, justify="left")  # 时间列
+    table.add_column(width=4, justify="left")  # 序号列
+    table.add_column(min_width=0)  # 内容列
+    # 处理文本内容
+    first_row_added = False
+    if text_parts:
+        content = " ".join(text_parts)
+        content = truncate_content(content, max_content_length)
+        lines = content.split("\n")
+        for i, line in enumerate(lines):
+            if i == 0:
+                # 第一行显示完整信息
+                table.add_row(
+                    f"[dim]{time_str:8}[/dim]",
+                    f"[dim]{index_str:4}[/dim]",
+                    f"[green]Assistant:[/green]{meta_info} {line}",
+                )
+                first_row_added = True
+            else:
+                # 续行只在内容列显示
+                table.add_row("", "", line)
+    # 如果没有文本内容，只显示助手消息头
+    if not first_row_added:
+        table.add_row(
+            f"[dim]{time_str:8}[/dim]",
+            f"[dim]{index_str:4}[/dim]",
+            f"[green]Assistant:[/green]{meta_info}",
+        )
+    # 添加工具调用
+    for tool_call in tool_calls:
+        args_str = ""
+        if tool_call.arguments:
+            try:
+                parsed_args = json.loads(tool_call.arguments) if isinstance(tool_call.arguments, str) else tool_call.arguments
+                args_str = f" {parsed_args}"
+            except (json.JSONDecodeError, TypeError):
+                args_str = f" {tool_call.arguments}"
+        args_display = truncate_content(args_str, max_content_length - len(tool_call.name) - 10)
+        table.add_row("", "", f"[magenta]Call:[/magenta] {tool_call.name}{args_display}")
+    # 添加工具结果
+    for tool_result in tool_results:
+        output = truncate_content(str(tool_result.output), max_content_length)
+        time_info = ""
+        if tool_result.execution_time_ms is not None:
+            time_info = f" [dim]({tool_result.execution_time_ms}ms)[/dim]"
+        table.add_row("", "", f"[cyan]Output:[/cyan]{time_info}")
+        lines = output.split("\n")
+        for line in lines:
+            table.add_row("", "", line)
+    console.print(table)
+def _display_legacy_message_with_columns(
+    message: FlexibleRunnerMessage,
+    console: Console,
+    time_str: str,
+    index_str: str,
+    max_content_length: int,
+    truncate_content: Callable[[str, int], str],
+) -> None:
+    """使用列布局显示旧格式消息。"""
+    # 这里可以处理旧格式消息，暂时简单显示
+    try:
+        content = str(message.model_dump()) if hasattr(message, "model_dump") else str(message)  # type: ignore[attr-defined]
+    except Exception:
+        content = str(message)
+    content = truncate_content(content, max_content_length)
+    # 创建表格来确保对齐
+    table = Table.grid(padding=0)
+    table.add_column(width=8, justify="left")  # 时间列
+    table.add_column(width=4, justify="left")  # 序号列
+    table.add_column(min_width=0)  # 内容列
+    lines = content.split("\n")
+    for i, line in enumerate(lines):
+        if i == 0:
+            # 第一行显示完整信息
+            table.add_row(
+                f"[dim]{time_str:8}[/dim]",
+                f"[dim]{index_str:4}[/dim]",
+                f"[red]Legacy:[/red] {line}",
+            )
+        else:
+            # 续行只在内容列显示
+            table.add_row("", "", line)
-    # 根据消息类型分发处理
-    _dispatch_message_display(message, context)
+    console.print(table)
 def _create_message_context(context_config: dict[str, FlexibleRunnerMessage | Console | int | bool | timezone | Callable[[str, int], str] | None]) -> MessageContext:
@@ -573,13 +820,15 @@ def _display_assistant_message_compact_v2(message: AgentAssistantMessage, contex
     meta_info = ""
     if message.meta:
         meta_parts = []
+        if message.meta.model is not None:
+            meta_parts.append(f"Model:{message.meta.model}")
         if message.meta.latency_ms is not None:
             meta_parts.append(f"Latency:{message.meta.latency_ms}ms")
         if message.meta.output_time_ms is not None:
             meta_parts.append(f"Output:{message.meta.output_time_ms}ms")
-        if message.meta.input_tokens is not None and message.meta.output_tokens is not None:
-            total_tokens = message.meta.input_tokens + message.meta.output_tokens
-            meta_parts.append(f"Tokens:↑{message.meta.input_tokens}↓{message.meta.output_tokens}={total_tokens}")
+        if message.meta.usage and message.meta.usage.input_tokens is not None and message.meta.usage.output_tokens is not None:
+            total_tokens = message.meta.usage.input_tokens + message.meta.usage.output_tokens
+            meta_parts.append(f"Tokens:↑{message.meta.usage.input_tokens}↓{message.meta.usage.output_tokens}={total_tokens}")
         if meta_parts:
             meta_info = f" [dim]({' | '.join(meta_parts)})[/dim]"
@@ -648,7 +897,11 @@ def _display_dict_function_call_compact(message: dict, context: MessageContext)
 def _display_dict_function_output_compact(message: dict, context: MessageContext) -> None:
     """显示字典类型的函数输出消息。"""
     output = context.truncate_content(str(message.get("output", "")), context.max_content_length)
-    context.console.print(f"{context.timestamp_str}{context.index_str}[cyan]Output:[/cyan]")
+    # Add execution time if available
+    time_info = ""
+    if message.get("execution_time_ms") is not None:
+        time_info = f" [dim]({message['execution_time_ms']}ms)[/dim]"
+    context.console.print(f"{context.timestamp_str}{context.index_str}[cyan]Output:[/cyan]{time_info}")
     context.console.print(f"{output}")
@@ -668,6 +921,8 @@ def _display_dict_assistant_compact(message: dict, context: MessageContext) -> N
     meta = message.get("meta")
     if meta and isinstance(meta, dict):
         meta_parts = []
+        if meta.get("model") is not None:
+            meta_parts.append(f"Model:{meta['model']}")
         if meta.get("latency_ms") is not None:
             meta_parts.append(f"Latency:{meta['latency_ms']}ms")
         if meta.get("output_time_ms") is not None:
@@ -735,30 +990,34 @@ def _display_new_assistant_message_compact(message: NewAssistantMessage, context
         elif item.type == "tool_call_result":
             tool_results.append(item)
-    # Display text content first if available
-    if text_parts:
-        content = " ".join(text_parts)
-        content = context.truncate_content(content, context.max_content_length)
-        # Add meta data information (使用英文标签)
-        meta_info = ""
-        if message.meta:
-            meta_parts = []
-            if message.meta.latency_ms is not None:
-                meta_parts.append(f"Latency:{message.meta.latency_ms}ms")
-            if message.meta.total_time_ms is not None:
-                meta_parts.append(f"Output:{message.meta.total_time_ms}ms")
-            if message.meta.usage and message.meta.usage.input_tokens is not None and message.meta.usage.output_tokens is not None:
-                total_tokens = message.meta.usage.input_tokens + message.meta.usage.output_tokens
-                meta_parts.append(f"Tokens:↑{message.meta.usage.input_tokens}↓{message.meta.usage.output_tokens}={total_tokens}")
-            if meta_parts:
-                meta_info = f" [dim]({' | '.join(meta_parts)})[/dim]"
+    # Add meta data information (使用英文标签)
+    meta_info = ""
+    if message.meta:
+        meta_parts = []
+        if message.meta.model is not None:
+            meta_parts.append(f"Model:{message.meta.model}")
+        if message.meta.latency_ms is not None:
+            meta_parts.append(f"Latency:{message.meta.latency_ms}ms")
+        if message.meta.total_time_ms is not None:
+            meta_parts.append(f"Output:{message.meta.total_time_ms}ms")
+        if message.meta.usage and message.meta.usage.input_tokens is not None and message.meta.usage.output_tokens is not None:
+            total_tokens = message.meta.usage.input_tokens + message.meta.usage.output_tokens
+            meta_parts.append(f"Tokens:↑{message.meta.usage.input_tokens}↓{message.meta.usage.output_tokens}={total_tokens}")
+        if meta_parts:
+            meta_info = f" [dim]({' | '.join(meta_parts)})[/dim]"
+    # Always show Assistant header if there's any content (text, tool calls, or results)
+    if text_parts or tool_calls or tool_results:
         context.console.print(f"{context.timestamp_str}{context.index_str}[green]Assistant:[/green]{meta_info}")
-        context.console.print(f"{content}")
-    # Display tool calls
+        # Display text content if available
+        if text_parts:
+            content = " ".join(text_parts)
+            content = context.truncate_content(content, context.max_content_length)
+            context.console.print(f"{content}")
+    # Display tool calls with proper indentation
     for tool_call in tool_calls:
         args_str = ""
         if tool_call.arguments:
@@ -769,11 +1028,17 @@ def _display_new_assistant_message_compact(message: NewAssistantMessage, context
                 args_str = f" {tool_call.arguments}"
         args_display = context.truncate_content(args_str, context.max_content_length - len(tool_call.name) - 10)
-        context.console.print(f"{context.timestamp_str}{context.index_str}[magenta]Call:[/magenta]")
-        context.console.print(f"{tool_call.name}{args_display}")
+        # Always use indented format for better hierarchy
+        context.console.print(f"  [magenta]Call:[/magenta] {tool_call.name}{args_display}")
-    # Display tool results
+    # Display tool results with proper indentation
     for tool_result in tool_results:
         output = context.truncate_content(str(tool_result.output), context.max_content_length)
-        context.console.print(f"{context.timestamp_str}{context.index_str}[cyan]Output:[/cyan]")
-        context.console.print(f"{output}")
+        # Add execution time if available
+        time_info = ""
+        if tool_result.execution_time_ms is not None:
+            time_info = f" [dim]({tool_result.execution_time_ms}ms)[/dim]"
+        # Always use indented format for better hierarchy
+        context.console.print(f"  [cyan]Output:[/cyan]{time_info}")
+        context.console.print(f"  {output}")

lite_agent/client.py CHANGED Viewed

@@ -100,6 +100,7 @@ class BaseLLMClient(abc.ABC):
         tools: list[ChatCompletionToolParam] | None = None,
         tool_choice: str = "auto",
         reasoning: ReasoningConfig = None,
+        *,
         streaming: bool = True,
         **kwargs: Any,  # noqa: ANN401
     ) -> Any:  # noqa: ANN401
@@ -112,6 +113,7 @@ class BaseLLMClient(abc.ABC):
         tools: list[FunctionToolParam] | None = None,
         tool_choice: Literal["none", "auto", "required"] = "auto",
         reasoning: ReasoningConfig = None,
+        *,
         streaming: bool = True,
         **kwargs: Any,  # noqa: ANN401
     ) -> Any:  # noqa: ANN401
@@ -136,6 +138,7 @@ class LiteLLMClient(BaseLLMClient):
         tools: list[ChatCompletionToolParam] | None = None,
         tool_choice: str = "auto",
         reasoning: ReasoningConfig = None,
+        *,
         streaming: bool = True,
         **kwargs: Any,  # noqa: ANN401
     ) -> Any:  # noqa: ANN401
@@ -187,6 +190,7 @@ class LiteLLMClient(BaseLLMClient):
         tools: list[FunctionToolParam] | None = None,
         tool_choice: Literal["none", "auto", "required"] = "auto",
         reasoning: ReasoningConfig = None,
+        *,
         streaming: bool = True,
         **kwargs: Any,  # noqa: ANN401
     ) -> Any:  # type: ignore[return]  # noqa: ANN401

lite_agent/constants.py ADDED Viewed

@@ -0,0 +1,30 @@
+from typing import Literal
+class CompletionMode:
+    """Agent completion modes."""
+    STOP: Literal["stop"] = "stop"  # Traditional completion until model decides to stop
+    CALL: Literal["call"] = "call"  # Completion until specific tool is called
+class ToolName:
+    """System tool names."""
+    TRANSFER_TO_AGENT = "transfer_to_agent"
+    TRANSFER_TO_PARENT = "transfer_to_parent"
+    WAIT_FOR_USER = "wait_for_user"
+class StreamIncludes:
+    """Default stream includes configuration."""
+    DEFAULT_INCLUDES = (
+        "completion_raw",
+        "usage",
+        "function_call",
+        "function_call_output",
+        "content_delta",
+        "function_call_delta",
+        "assistant_message",
+    )

lite_agent/message_transfers.py CHANGED Viewed

@@ -5,7 +5,9 @@ This module provides common message transfer functions that can be used
 with agents to preprocess messages before sending them to the API.
 """
-from lite_agent.types import RunnerMessages
+import json
+from lite_agent.types import NewUserMessage, RunnerMessages, UserTextContent
 def consolidate_history_transfer(messages: RunnerMessages) -> RunnerMessages:
@@ -43,8 +45,8 @@ def consolidate_history_transfer(messages: RunnerMessages) -> RunnerMessages:
     # Create the consolidated message
     consolidated_content = "以下是目前发生的所有交互:\n\n" + "\n".join(xml_content) + "\n\n接下来该做什么?"
-    # Return a single user message
-    return [{"role": "user", "content": consolidated_content}]
+    # Return a single user message using NewMessage format
+    return [NewUserMessage(content=[UserTextContent(text=consolidated_content)])]
 def _process_message_to_xml(message: dict | object) -> list[str]:
@@ -67,8 +69,25 @@ def _process_message_to_xml(message: dict | object) -> list[str]:
         # Handle new message format where content is a list
         if isinstance(content, list):
-            # Extract text from content items
-            text_parts = [item.text for item in content if (hasattr(item, "type") and item.type == "text") or hasattr(item, "text")]
+            # Process each content item
+            text_parts = []
+            for item in content:
+                if hasattr(item, "type"):
+                    if item.type == "text":
+                        text_parts.append(item.text)
+                    elif item.type == "tool_call":
+                        # Handle tool call content
+                        arguments = item.arguments
+                        if isinstance(arguments, dict):
+                            arguments = json.dumps(arguments, ensure_ascii=False)
+                        xml_lines.append(f"  <function_call name='{item.name}' arguments='{arguments}' />")
+                    elif item.type == "tool_call_result":
+                        # Handle tool call result content
+                        xml_lines.append(f"  <function_result call_id='{item.call_id}'>{item.output}</function_result>")
+                elif hasattr(item, "text"):
+                    text_parts.append(item.text)
+            # Add text content as message if any
             content_text = " ".join(text_parts)
             if content_text:
                 xml_lines.append(f"  <message role='{role}'>{content_text}</message>")

lite_agent/processors/completion_event_processor.py CHANGED Viewed

@@ -26,6 +26,7 @@ from lite_agent.types import (
     ToolCallFunction,
     UsageEvent,
 )
+from lite_agent.utils.metrics import TimingMetrics
 class CompletionEventProcessor:
@@ -71,21 +72,18 @@ class CompletionEventProcessor:
             if not self.yielded_content:
                 self.yielded_content = True
                 end_time = datetime.now(timezone.utc)
-                latency_ms = None
-                output_time_ms = None
-                # latency_ms: 从开始准备输出到 LLM 输出第一个字符的时间差
-                if self._start_time and self._first_output_time:
-                    latency_ms = int((self._first_output_time - self._start_time).total_seconds() * 1000)
-                # output_time_ms: 从输出第一个字符到输出完成的时间差
-                if self._first_output_time and self._output_complete_time:
-                    output_time_ms = int((self._output_complete_time - self._first_output_time).total_seconds() * 1000)
+                latency_ms = TimingMetrics.calculate_latency_ms(self._start_time, self._first_output_time)
+                output_time_ms = TimingMetrics.calculate_output_time_ms(self._first_output_time, self._output_complete_time)
                 usage = MessageUsage(
                     input_tokens=self._usage_data.get("input_tokens"),
                     output_tokens=self._usage_data.get("output_tokens"),
                 )
+                # Extract model information from chunk
+                model_name = getattr(chunk, "model", None)
                 meta = AssistantMessageMeta(
                     sent_at=end_time,
+                    model=model_name,
                     latency_ms=latency_ms,
                     total_time_ms=output_time_ms,
                     usage=usage,
@@ -152,21 +150,18 @@ class CompletionEventProcessor:
             if not self.yielded_content:
                 self.yielded_content = True
                 end_time = datetime.now(timezone.utc)
-                latency_ms = None
-                output_time_ms = None
-                # latency_ms: 从开始准备输出到 LLM 输出第一个字符的时间差
-                if self._start_time and self._first_output_time:
-                    latency_ms = int((self._first_output_time - self._start_time).total_seconds() * 1000)
-                # output_time_ms: 从输出第一个字符到输出完成的时间差
-                if self._first_output_time and self._output_complete_time:
-                    output_time_ms = int((self._output_complete_time - self._first_output_time).total_seconds() * 1000)
+                latency_ms = TimingMetrics.calculate_latency_ms(self._start_time, self._first_output_time)
+                output_time_ms = TimingMetrics.calculate_output_time_ms(self._first_output_time, self._output_complete_time)
                 usage = MessageUsage(
                     input_tokens=self._usage_data.get("input_tokens"),
                     output_tokens=self._usage_data.get("output_tokens"),
                 )
+                # Extract model information from chunk
+                model_name = getattr(chunk, "model", None)
                 meta = AssistantMessageMeta(
                     sent_at=end_time,
+                    model=model_name,
                     latency_ms=latency_ms,
                     total_time_ms=output_time_ms,
                     usage=usage,
@@ -199,10 +194,9 @@ class CompletionEventProcessor:
             results.append(UsageEvent(usage=EventUsage(input_tokens=usage["prompt_tokens"], output_tokens=usage["completion_tokens"])))
             # Then yield timing event if we have timing data
-            if self._start_time and self._first_output_time and self._output_complete_time:
-                latency_ms = int((self._first_output_time - self._start_time).total_seconds() * 1000)
-                output_time_ms = int((self._output_complete_time - self._first_output_time).total_seconds() * 1000)
+            latency_ms = TimingMetrics.calculate_latency_ms(self._start_time, self._first_output_time)
+            output_time_ms = TimingMetrics.calculate_output_time_ms(self._first_output_time, self._output_complete_time)
+            if latency_ms is not None and output_time_ms is not None:
                 results.append(
                     TimingEvent(
                         timing=Timing(

lite-agent 0.6.0__py3-none-any.whl → 0.9.0__py3-none-any.whl

Potentially problematic release.

lite-agent 0.6.0py3-none-any.whl → 0.9.0py3-none-any.whl