PyPI - botrun-flow-lang - Versions diffs - 6.2.61__py3-none-any.whl → 6.2.62__py3-none-any.whl - Mend

botrun-flow-lang 6.2.61py3-none-any.whl → 6.2.62py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

botrun_flow_lang/langgraph_agents/agents/util/custom_vertex_claude.py CHANGED Viewed

@@ -8,7 +8,7 @@ Supports tool calling for LangGraph react agent compatibility.
 """
 import json
-from typing import Any, Dict, List, Optional, Tuple, Union
+from typing import Any, Dict, Iterator, List, Optional, Tuple, Union
 import httpx
@@ -18,12 +18,13 @@ from langchain_core.callbacks import CallbackManagerForLLMRun
 from langchain_core.language_models.chat_models import BaseChatModel
 from langchain_core.messages import (
     AIMessage,
+    AIMessageChunk,
     BaseMessage,
     HumanMessage,
     SystemMessage,
     ToolMessage,
 )
-from langchain_core.outputs import ChatGeneration, ChatResult
+from langchain_core.outputs import ChatGeneration, ChatGenerationChunk, ChatResult
 from pydantic import ConfigDict
 from botrun_flow_lang.utils.botrun_logger import get_default_botrun_logger
@@ -193,23 +194,20 @@ class ChatVertexAIClaude(BaseChatModel):
         return system, merged
-    def _generate(
+    def _build_payload(
         self,
         messages: List[BaseMessage],
         stop: Optional[List[str]] = None,
-        run_manager: Optional[CallbackManagerForLLMRun] = None,
         **kwargs,
-    ) -> ChatResult:
-        """Call Vertex AI Claude via rawPredict (non-streaming)."""
+    ) -> Tuple[str, Dict[str, Any], int]:
+        """Build API payload shared by _generate and _stream.
+        Returns:
+            (access_token, payload, tools_count)
+        """
         system, api_messages = self._convert_messages(messages)
         access_token = self._get_access_token()
-        url = (
-            f"https://{self.location}-aiplatform.googleapis.com/v1/"
-            f"projects/{self.project_id}/locations/{self.location}/"
-            f"publishers/anthropic/models/{self.model}:rawPredict"
-        )
         payload: Dict[str, Any] = {
             "anthropic_version": "vertex-2023-10-16",
             "messages": api_messages,
@@ -221,12 +219,10 @@ class ChatVertexAIClaude(BaseChatModel):
         if stop:
             payload["stop_sequences"] = stop
-        # Tools from bind_tools()
         tools = kwargs.get("tools", [])
         if tools:
             payload["tools"] = tools
-        # Tool choice
         tool_choice = kwargs.get("tool_choice")
         if tool_choice:
             if isinstance(tool_choice, str):
@@ -244,13 +240,32 @@ class ChatVertexAIClaude(BaseChatModel):
             elif isinstance(tool_choice, dict):
                 payload["tool_choice"] = tool_choice
+        return access_token, payload, len(tools)
+    def _generate(
+        self,
+        messages: List[BaseMessage],
+        stop: Optional[List[str]] = None,
+        run_manager: Optional[CallbackManagerForLLMRun] = None,
+        **kwargs,
+    ) -> ChatResult:
+        """Call Vertex AI Claude via rawPredict (non-streaming)."""
+        access_token, payload, tools_count = self._build_payload(
+            messages, stop, **kwargs
+        )
+        url = (
+            f"https://{self.location}-aiplatform.googleapis.com/v1/"
+            f"projects/{self.project_id}/locations/{self.location}/"
+            f"publishers/anthropic/models/{self.model}:rawPredict"
+        )
         logger.info(
             f"[ChatVertexAIClaude] rawPredict: model={self.model}, "
-            f"location={self.location}, messages={len(api_messages)}, "
-            f"tools={len(tools)}"
+            f"location={self.location}, messages={len(payload['messages'])}, "
+            f"tools={tools_count}"
         )
-        # Make API call via httpx
         data = _http_post_json(url, payload, access_token)
         # Parse response
@@ -305,6 +320,192 @@ class ChatVertexAIClaude(BaseChatModel):
             },
         )
+    def _stream(
+        self,
+        messages: List[BaseMessage],
+        stop: Optional[List[str]] = None,
+        run_manager: Optional[CallbackManagerForLLMRun] = None,
+        **kwargs,
+    ) -> Iterator[ChatGenerationChunk]:
+        """Call Vertex AI Claude via streamRawPredict (streaming).
+        Yields ChatGenerationChunk with AIMessageChunk for each SSE event.
+        Handles both text and tool_use content blocks.
+        """
+        access_token, payload, tools_count = self._build_payload(
+            messages, stop, **kwargs
+        )
+        payload["stream"] = True
+        url = (
+            f"https://{self.location}-aiplatform.googleapis.com/v1/"
+            f"projects/{self.project_id}/locations/{self.location}/"
+            f"publishers/anthropic/models/{self.model}:streamRawPredict"
+        )
+        logger.info(
+            f"[ChatVertexAIClaude] streamRawPredict: model={self.model}, "
+            f"location={self.location}, messages={len(payload['messages'])}, "
+            f"tools={tools_count}"
+        )
+        headers = {
+            "Content-Type": "application/json",
+            "Authorization": f"Bearer {access_token}",
+        }
+        # Track state across SSE events
+        usage_metadata: Dict[str, int] = {}
+        # Map block index -> tool info for tool_use streaming
+        tool_use_blocks: Dict[int, Dict[str, Any]] = {}
+        try:
+            with httpx.Client(timeout=300.0) as client:
+                with client.stream(
+                    "POST", url, headers=headers, json=payload
+                ) as response:
+                    if response.status_code != 200:
+                        error_body = response.read().decode("utf-8", errors="ignore")
+                        error_msg = f"Vertex AI API error: {response.status_code} - {error_body}"
+                        logger.error(f"[ChatVertexAIClaude] {error_msg}")
+                        raise Exception(error_msg)
+                    for line in response.iter_lines():
+                        if isinstance(line, bytes):
+                            line = line.decode("utf-8")
+                        line = line.strip()
+                        if not line or line.startswith("event:"):
+                            continue
+                        if line.startswith("data:"):
+                            data_str = line[5:].strip()
+                        else:
+                            data_str = line
+                        try:
+                            data = json.loads(data_str)
+                        except json.JSONDecodeError:
+                            continue
+                        if not data:
+                            continue
+                        event_type = data.get("type", "")
+                        if event_type == "message_start":
+                            msg = data.get("message", {})
+                            if "usage" in msg:
+                                usage_metadata["input_tokens"] = msg["usage"].get(
+                                    "input_tokens", 0
+                                )
+                        elif event_type == "content_block_start":
+                            block = data.get("content_block", {})
+                            index = data.get("index", 0)
+                            if block.get("type") == "tool_use":
+                                # Start of a tool_use block
+                                tool_use_blocks[index] = {
+                                    "id": block.get("id", ""),
+                                    "name": block.get("name", ""),
+                                    "args_json": "",
+                                }
+                                chunk = AIMessageChunk(
+                                    content="",
+                                    tool_call_chunks=[
+                                        {
+                                            "name": block.get("name", ""),
+                                            "args": "",
+                                            "id": block.get("id", ""),
+                                            "index": index,
+                                        }
+                                    ],
+                                )
+                                yield ChatGenerationChunk(message=chunk)
+                                if run_manager:
+                                    run_manager.on_llm_new_token(
+                                        "", chunk=chunk
+                                    )
+                        elif event_type == "content_block_delta":
+                            delta = data.get("delta", {})
+                            index = data.get("index", 0)
+                            delta_type = delta.get("type", "")
+                            if delta_type == "text_delta":
+                                text = delta.get("text", "")
+                                if text:
+                                    chunk = AIMessageChunk(content=text)
+                                    yield ChatGenerationChunk(message=chunk)
+                                    if run_manager:
+                                        run_manager.on_llm_new_token(
+                                            text, chunk=chunk
+                                        )
+                            elif delta_type == "input_json_delta":
+                                partial_json = delta.get("partial_json", "")
+                                if index in tool_use_blocks:
+                                    tool_use_blocks[index][
+                                        "args_json"
+                                    ] += partial_json
+                                chunk = AIMessageChunk(
+                                    content="",
+                                    tool_call_chunks=[
+                                        {
+                                            "name": None,
+                                            "args": partial_json,
+                                            "id": None,
+                                            "index": index,
+                                        }
+                                    ],
+                                )
+                                yield ChatGenerationChunk(message=chunk)
+                                if run_manager:
+                                    run_manager.on_llm_new_token(
+                                        "", chunk=chunk
+                                    )
+                        elif event_type == "message_delta":
+                            delta = data.get("delta", {})
+                            if "usage" in data:
+                                usage_metadata["output_tokens"] = data[
+                                    "usage"
+                                ].get("output_tokens", 0)
+                        elif event_type == "message_stop":
+                            # Yield final chunk with usage metadata
+                            input_tokens = usage_metadata.get("input_tokens", 0)
+                            output_tokens = usage_metadata.get(
+                                "output_tokens", 0
+                            )
+                            chunk = AIMessageChunk(
+                                content="",
+                                usage_metadata={
+                                    "input_tokens": input_tokens,
+                                    "output_tokens": output_tokens,
+                                    "total_tokens": input_tokens
+                                    + output_tokens,
+                                },
+                                response_metadata={
+                                    "model": self.model,
+                                },
+                            )
+                            yield ChatGenerationChunk(message=chunk)
+                            logger.info(
+                                f"[ChatVertexAIClaude] Stream complete: "
+                                f"tokens=({input_tokens}+{output_tokens}"
+                                f"={input_tokens + output_tokens})"
+                            )
+        except httpx.HTTPStatusError as e:
+            error_body = e.response.text if e.response else ""
+            error_msg = (
+                f"Vertex AI API error: {e.response.status_code} - {error_body}"
+            )
+            logger.error(f"[ChatVertexAIClaude] {error_msg}")
+            raise Exception(error_msg) from e
 def _http_post_json(
     url: str, payload: Dict[str, Any], access_token: str

{botrun_flow_lang-6.2.61.dist-info → botrun_flow_lang-6.2.62.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: botrun-flow-lang
-Version: 6.2.61
+Version: 6.2.62
 Summary: A flow language for botrun
 Author-email: sebastian-hsu <sebastian.hsu@gmail.com>
 License: MIT

{botrun_flow_lang-6.2.61.dist-info → botrun_flow_lang-6.2.62.dist-info}/RECORD RENAMED Viewed

@@ -39,7 +39,7 @@ botrun_flow_lang/langgraph_agents/agents/gov_researcher/gov_researcher_graph.py,
 botrun_flow_lang/langgraph_agents/agents/tools/__init__.py,sha256=-z1uuC3IET02q8kPhPlr-L9eTGJqgHjEJlC__cG16H0,105
 botrun_flow_lang/langgraph_agents/agents/tools/gemini_code_execution.py,sha256=EEp8xhVU-Kj1Nk5qV8ObqdVZ8gT6GITrE4VyjIc2InA,14238
 botrun_flow_lang/langgraph_agents/agents/util/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-botrun_flow_lang/langgraph_agents/agents/util/custom_vertex_claude.py,sha256=RDj1-PnoR36xdOUu7r6yMQrxAe-CXyGcSZEKiOlPxJY,14951
+botrun_flow_lang/langgraph_agents/agents/util/custom_vertex_claude.py,sha256=4ZCNILUCJoZMMy_Dh1Slf-KvYuMzhZNamnfDZXhjSQE,24124
 botrun_flow_lang/langgraph_agents/agents/util/gemini_grounding.py,sha256=JTfH9WJNDlpvMvfzXyZy3bHeCN58MTnEOiamQGMsqh0,2884
 botrun_flow_lang/langgraph_agents/agents/util/html_util.py,sha256=g5yJO0qTqRq_kb-xhSnWX3WAbHDIjNQYl7ErRBPQwHs,13230
 botrun_flow_lang/langgraph_agents/agents/util/img_util.py,sha256=6OERtpGGimlev4Pb_O1UbMNaT_DMBHSmAgo9gB-R8xk,12385
@@ -100,6 +100,6 @@ botrun_flow_lang/utils/yaml_utils.py,sha256=dPlabIol-Clhnwc7N5nuffCaLSq8dyvmvjRw
 botrun_flow_lang/utils/clients/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 botrun_flow_lang/utils/clients/rate_limit_client.py,sha256=96NNCHB9I5C5bpVFF6sfPhmh4oAx3UdOLb-Z4PAXLdg,8558
 botrun_flow_lang/utils/clients/token_verify_client.py,sha256=-AnYApJ9CvxVn-RhCCZZ2LCrf065fgskhwLKAm-aiN0,5893
-botrun_flow_lang-6.2.61.dist-info/METADATA,sha256=7mfsw0_BTSzWq5fSeKqCg0RmuOEyMfdKwItnzlRA0p8,6164
-botrun_flow_lang-6.2.61.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
-botrun_flow_lang-6.2.61.dist-info/RECORD,,
+botrun_flow_lang-6.2.62.dist-info/METADATA,sha256=ZI_XX1JwrqTbJ_SzdzSm1y1Iw882DxfAv2ESCLhJxNw,6164
+botrun_flow_lang-6.2.62.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
+botrun_flow_lang-6.2.62.dist-info/RECORD,,

{botrun_flow_lang-6.2.61.dist-info → botrun_flow_lang-6.2.62.dist-info}/WHEEL RENAMED Viewed

File without changes

botrun-flow-lang 6.2.61__py3-none-any.whl → 6.2.62__py3-none-any.whl

botrun-flow-lang 6.2.61py3-none-any.whl → 6.2.62py3-none-any.whl