PyPI - chatlas - Versions diffs - 0.7.1__py3-none-any.whl → 0.8.1__py3-none-any.whl - Mend

chatlas 0.7.1py3-none-any.whl → 0.8.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of chatlas might be problematic. Click here for more details.

Files changed (18) hide show

chatlas/__init__.py +2 -1
chatlas/_anthropic.py +1 -4
chatlas/_callbacks.py +56 -0
chatlas/_chat.py +182 -84
chatlas/_content.py +6 -0
chatlas/_databricks.py +1 -1
chatlas/_logging.py +29 -5
chatlas/_snowflake.py +398 -72
chatlas/_tools.py +59 -1
chatlas/_version.py +2 -2
chatlas/types/anthropic/_submit.py +7 -0
chatlas/types/openai/_submit.py +1 -0
{chatlas-0.7.1.dist-info → chatlas-0.8.1.dist-info}/METADATA +2 -2
{chatlas-0.7.1.dist-info → chatlas-0.8.1.dist-info}/RECORD +16 -17
chatlas/types/snowflake/__init__.py +0 -8
chatlas/types/snowflake/_submit.py +0 -24
{chatlas-0.7.1.dist-info → chatlas-0.8.1.dist-info}/WHEEL +0 -0
{chatlas-0.7.1.dist-info → chatlas-0.8.1.dist-info}/licenses/LICENSE +0 -0

chatlas/_snowflake.py CHANGED Viewed

@@ -1,32 +1,60 @@
-import asyncio
-import json
-from typing import TYPE_CHECKING, Iterable, Literal, Optional, TypedDict, cast, overload
+from typing import (
+    TYPE_CHECKING,
+    Generator,
+    Literal,
+    Optional,
+    TypedDict,
+    Union,
+    overload,
+)
+import orjson
 from pydantic import BaseModel
 from ._chat import Chat
-from ._content import Content, ContentJson, ContentText
+from ._content import (
+    Content,
+    ContentJson,
+    ContentText,
+    ContentToolRequest,
+    ContentToolResult,
+)
 from ._logging import log_model_default
 from ._provider import Provider
+from ._tokens import tokens_log
 from ._tools import Tool, basemodel_to_param_schema
 from ._turn import Turn, normalize_turns
-from ._utils import drop_none, wrap_async_iterable
+from ._utils import drop_none
 if TYPE_CHECKING:
-    from snowflake.snowpark import Column
+    import snowflake.core.cortex.inference_service._generated.models as models
+    from snowflake.core.rest import Event, SSEClient
+    Completion = models.NonStreamingCompleteResponse
+    CompletionChunk = models.StreamingCompleteResponseDataEvent
+    # Manually constructed TypedDict equivalent of models.CompleteRequest
+    class CompleteRequest(TypedDict, total=False):
+        """
+        CompleteRequest parameters for Snowflake Cortex LLMs.
+        See `snowflake.core.cortex.inference_service.CompleteRequest` for more details.
+        """
+        temperature: Union[float, int]
+        """Temperature controls the amount of randomness used in response generation. A higher temperature corresponds to more randomness."""
-    # Types inferred from the return type of the `snowflake.cortex.complete` function
-    Completion = str | Column
-    CompletionChunk = str
+        top_p: Union[float, int]
+        """Threshold probability for nucleus sampling. A higher top-p value increases the diversity of tokens that the model considers, while a lower value results in more predictable output."""
-    from .types.snowflake import SubmitInputArgs
+        max_tokens: int
+        """The maximum number of output tokens to produce. The default value is model-dependent."""
+        guardrails: models.GuardrailsConfig
+        """Controls whether guardrails are enabled."""
-# The main prompt input type for Snowflake
-# This was copy-pasted from `snowflake.cortex._complete.ConversationMessage`
-class ConversationMessage(TypedDict):
-    role: str
-    content: str
+        tool_choice: models.ToolChoice
+        """Determines how tools are selected."""
 def ChatSnowflake(
@@ -41,7 +69,7 @@ def ChatSnowflake(
     private_key_file: Optional[str] = None,
     private_key_file_pwd: Optional[str] = None,
     kwargs: Optional[dict[str, "str | int"]] = None,
-) -> Chat["SubmitInputArgs", "Completion"]:
+) -> Chat["CompleteRequest", "Completion"]:
     """
     Chat with a Snowflake Cortex LLM
@@ -116,7 +144,7 @@ def ChatSnowflake(
     """
     if model is None:
-        model = log_model_default("llama3.1-70b")
+        model = log_model_default("claude-3-7-sonnet")
     return Chat(
         provider=SnowflakeProvider(
@@ -150,6 +178,7 @@ class SnowflakeProvider(Provider["Completion", "CompletionChunk", "CompletionChu
         kwargs: Optional[dict[str, "str | int"]],
     ):
         try:
+            from snowflake.core import Root
             from snowflake.snowpark import Session
         except ImportError:
             raise ImportError(
@@ -170,7 +199,9 @@ class SnowflakeProvider(Provider["Completion", "CompletionChunk", "CompletionChu
         )
         self._model = model
-        self._session = Session.builder.configs(configs).create()
+        session = Session.builder.configs(configs).create()
+        self._cortex_service = Root(session).cortex_inference_service
     @overload
     def chat_perform(
@@ -180,7 +211,7 @@ class SnowflakeProvider(Provider["Completion", "CompletionChunk", "CompletionChu
         turns: list[Turn],
         tools: dict[str, Tool],
         data_model: Optional[type[BaseModel]] = None,
-        kwargs: Optional["SubmitInputArgs"] = None,
+        kwargs: Optional["CompleteRequest"] = None,
     ): ...
     @overload
@@ -191,7 +222,7 @@ class SnowflakeProvider(Provider["Completion", "CompletionChunk", "CompletionChu
         turns: list[Turn],
         tools: dict[str, Tool],
         data_model: Optional[type[BaseModel]] = None,
-        kwargs: Optional["SubmitInputArgs"] = None,
+        kwargs: Optional["CompleteRequest"] = None,
     ): ...
     def chat_perform(
@@ -201,12 +232,25 @@ class SnowflakeProvider(Provider["Completion", "CompletionChunk", "CompletionChu
         turns: list[Turn],
         tools: dict[str, Tool],
         data_model: Optional[type[BaseModel]] = None,
-        kwargs: Optional["SubmitInputArgs"] = None,
+        kwargs: Optional["CompleteRequest"] = None,
     ):
-        from snowflake.cortex import complete
+        req = self._complete_request(stream, turns, tools, data_model, kwargs)
+        client = self._cortex_service.complete(req)
+        try:
+            events = client.events()
+        except Exception as e:
+            data = parse_request_object(client)
+            if data is None:
+                raise e
+            return data
-        kwargs = self._chat_perform_args(stream, turns, tools, data_model, kwargs)
-        return complete(**kwargs)
+        if stream:
+            return generate_event_data(events)
+        for evt in events:
+            if evt.data:
+                return parse_event_data(evt.data, stream=False)
     @overload
     async def chat_perform_async(
@@ -216,7 +260,7 @@ class SnowflakeProvider(Provider["Completion", "CompletionChunk", "CompletionChu
         turns: list[Turn],
         tools: dict[str, Tool],
         data_model: Optional[type[BaseModel]] = None,
-        kwargs: Optional["SubmitInputArgs"] = None,
+        kwargs: Optional["CompleteRequest"] = None,
     ): ...
     @overload
@@ -227,7 +271,7 @@ class SnowflakeProvider(Provider["Completion", "CompletionChunk", "CompletionChu
         turns: list[Turn],
         tools: dict[str, Tool],
         data_model: Optional[type[BaseModel]] = None,
-        kwargs: Optional["SubmitInputArgs"] = None,
+        kwargs: Optional["CompleteRequest"] = None,
     ): ...
     async def chat_perform_async(
@@ -237,65 +281,164 @@ class SnowflakeProvider(Provider["Completion", "CompletionChunk", "CompletionChu
         turns: list[Turn],
         tools: dict[str, Tool],
         data_model: Optional[type[BaseModel]] = None,
-        kwargs: Optional["SubmitInputArgs"] = None,
+        kwargs: Optional["CompleteRequest"] = None,
     ):
-        from snowflake.cortex import complete
-        kwargs = self._chat_perform_args(stream, turns, tools, data_model, kwargs)
+        req = self._complete_request(stream, turns, tools, data_model, kwargs)
+        res = self._cortex_service.complete_async(req)
+        # TODO: is there a way to get the SSEClient result without blocking?
+        client = res.result()
-        # Prevent the main thread from being blocked (Snowflake doesn't have native async support)
-        res = await asyncio.to_thread(complete, **kwargs)
+        try:
+            events = client.events()
+        except Exception as e:
+            data = parse_request_object(client)
+            if data is None:
+                raise e
+            return data
-        # When streaming, res is an iterable of strings, but Chat() wants an async iterable
         if stream:
-            res = wrap_async_iterable(cast(Iterable[str], res))
+            return generate_event_data_async(events)
-        return res
+        for evt in events:
+            if evt.data:
+                return parse_event_data(evt.data, stream=False)
-    def _chat_perform_args(
+    def _complete_request(
         self,
         stream: bool,
         turns: list[Turn],
         tools: dict[str, Tool],
         data_model: Optional[type[BaseModel]] = None,
-        kwargs: Optional["SubmitInputArgs"] = None,
+        kwargs: Optional["CompleteRequest"] = None,
     ):
-        kwargs_full: "SubmitInputArgs" = {
-            "stream": stream,
-            "prompt": self._as_prompt_input(turns),
-            "model": self._model,
-            "session": self._session,
-            **(kwargs or {}),
-        }
-        # TODO: get tools working
+        from snowflake.core.cortex.inference_service import CompleteRequest
+        req = CompleteRequest(
+            model=self._model,
+            messages=self._as_request_messages(turns),
+            stream=stream,
+        )
         if tools:
-            raise ValueError("Snowflake does not currently support tools.")
+            req.tools = req.tools or []
+            snow_tools = [self._as_snowflake_tool(tool) for tool in tools.values()]
+            req.tools.extend(snow_tools)
         if data_model is not None:
+            import snowflake.core.cortex.inference_service._generated.models as models
             params = basemodel_to_param_schema(data_model)
-            opts = kwargs_full.get("options") or {}
-            opts["response_format"] = {
-                "type": "json",
-                "schema": {
+            req.response_format = models.CompleteRequestResponseFormat(
+                type="json",
+                schema={
                     "type": "object",
                     "properties": params["properties"],
                     "required": params["required"],
                 },
-            }
-            kwargs_full["options"] = opts
+            )
-        return kwargs_full
+        if kwargs:
+            for k, v in kwargs.items():
+                if hasattr(req, k):
+                    setattr(req, k, v)
+                else:
+                    raise ValueError(
+                        f"Unknown parameter {k} for Snowflake CompleteRequest. "
+                        "Please check the Snowflake documentation for valid parameters."
+                    )
-    def stream_text(self, chunk):
-        return chunk
+        return req
+    def stream_text(self, chunk):
+        if not chunk.choices:
+            return None
+        delta = chunk.choices[0].delta
+        if delta is None or "content" not in delta:
+            return None
+        return delta["content"]
+    # Snowflake sort-of follows OpenAI/Anthropic streaming formats except they
+    # don't have the critical "index" field in the delta that the merge logic
+    # depends on (i.e., OpenAI), or official start/stop events (i.e.,
+    # Anthropic). So we have to do some janky merging here.
+    #
+    # This was done in a panic to get working asap, so don't judge :) I wouldn't
+    # be surprised if Snowflake realizes how bad this streaming format is and
+    # changes it in the future (thus probably breaking this code :( ).
     def stream_merge_chunks(self, completion, chunk):
         if completion is None:
             return chunk
-        return completion + chunk
+        if completion.choices is None or chunk.choices is None:
+            raise ValueError(
+                "Unexpected None for completion.choices. Please report this issue."
+            )
+        if completion.choices[0].delta is None or chunk.choices[0].delta is None:
+            raise ValueError(
+                "Unexpected None for completion.choices[0].delta. Please report this issue."
+            )
+        delta = completion.choices[0].delta
+        new_delta = chunk.choices[0].delta
+        if "content_list" not in delta or "content_list" not in new_delta:
+            raise ValueError(
+                "Expected content_list to be in completion.choices[0].delta. Please report this issue."
+            )
+        content_list = delta["content_list"]
+        new_content_list = new_delta["content_list"]
+        if not isinstance(content_list, list) or not isinstance(new_content_list, list):
+            raise ValueError(
+                f"Expected content_list to be a list, got {type(new_content_list)}"
+            )
+        if new_delta["type"] == "tool_use":
+            # Presence of "tool_use_id" indicates a new tool request; otherwise, we're
+            # expecting input parameters
+            if "tool_use_id" in new_delta:
+                del new_delta["text"]  # why is this here :eye-roll:?
+                content_list.append(new_delta)
+            elif "input" in new_delta:
+                # find most recent content with type: "tool_use" and append to that
+                for i in range(len(content_list) - 1, -1, -1):
+                    if "tool_use_id" in content_list[i]:
+                        content_list[i]["input"] = content_list[i].get("input", "")
+                        content_list[i]["input"] += new_delta["input"]
+                        break
+            else:
+                raise ValueError(
+                    f"Unexpected tool_use delta: {new_delta}. Please report this issue."
+                )
+        elif new_delta["type"] == "text":
+            text = new_delta["text"]
+            # find most recent content with type: "text" and append to that
+            for i in range(len(content_list) - 1, -1, -1):
+                if content_list[i].get("type") == "text":
+                    content_list[i]["text"] += text
+                    break
+            else:
+                # if we don't find it, just append to the end
+                # this shouldn't happen, but just in case
+                content_list.append({"type": "text", "text": text})
+        else:
+            raise ValueError(
+                f"Unexpected streaming delta type: {new_delta['type']}. Please report this issue."
+            )
+        completion.choices[0].delta["content_list"] = content_list
+        return completion
     def stream_turn(self, completion, has_data_model) -> Turn:
+        import snowflake.core.cortex.inference_service._generated.models as models
+        completion_dict = completion.model_dump()
+        delta = completion_dict["choices"][0].pop("delta")
+        completion_dict["choices"][0]["message"] = delta
+        completion = models.NonStreamingCompleteResponse.model_construct(
+            **completion_dict
+        )
         return self._as_turn(completion, has_data_model)
     def value_turn(self, completion, has_data_model) -> Turn:
@@ -321,24 +464,207 @@ class SnowflakeProvider(Provider["Completion", "CompletionChunk", "CompletionChu
             "Snowflake does not currently support token counting."
         )
-    def _as_prompt_input(self, turns: list[Turn]) -> list["ConversationMessage"]:
-        res: list["ConversationMessage"] = []
+    def _as_request_messages(self, turns: list[Turn]):
+        from snowflake.core.cortex.inference_service import CompleteRequestMessagesInner
+        res: list[CompleteRequestMessagesInner] = []
         for turn in turns:
-            res.append(
-                {
-                    "role": turn.role,
-                    "content": str(turn),
-                }
+            req = CompleteRequestMessagesInner(
+                role=turn.role,
+                content=turn.text,
             )
+            for x in turn.contents:
+                if isinstance(x, ContentToolRequest):
+                    req.content_list = req.content_list or []
+                    req.content_list.append(
+                        {
+                            "type": "tool_use",
+                            "tool_use": {
+                                "tool_use_id": x.id,
+                                "name": x.name,
+                                "input": x.arguments,
+                            },
+                        }
+                    )
+                elif isinstance(x, ContentToolResult):
+                    # Snowflake does like empty content
+                    req.content = req.content or "[tool_result]"
+                    req.content_list = req.content_list or []
+                    req.content_list.append(
+                        {
+                            "type": "tool_results",
+                            "tool_results": {
+                                "tool_use_id": x.id,
+                                "name": x.name,
+                                "content": [
+                                    {"type": "text", "text": x.get_model_value()}
+                                ],
+                            },
+                        }
+                    )
+                elif isinstance(x, ContentJson):
+                    req.content = req.content or "<structured data/>"
+            res.append(req)
         return res
-    def _as_turn(self, completion, has_data_model) -> Turn:
-        completion = cast(str, completion)
+    def _as_turn(self, completion: "Completion", has_data_model: bool) -> Turn:
+        import snowflake.core.cortex.inference_service._generated.models as models
+        if not completion.choices:
+            return Turn("assistant", [])
+        choice = completion.choices[0]
+        if isinstance(choice, dict):
+            choice = models.NonStreamingCompleteResponseChoicesInner.from_dict(choice)
+        message = choice.message
+        if message is None:
+            return Turn("assistant", [])
+        contents: list[Content] = []
+        content_list = message.content_list or []
+        for content in content_list:
+            if "text" in content:
+                if has_data_model:
+                    data = orjson.loads(content["text"])
+                    contents.append(ContentJson(value=data))
+                else:
+                    contents.append(ContentText(text=content["text"]))
+            elif "tool_use_id" in content:
+                params = content.get("input", "{}")
+                try:
+                    params = orjson.loads(params)
+                except orjson.JSONDecodeError:
+                    raise ValueError(
+                        f"Failed to parse tool_use input: {params}. Please report this issue."
+                    )
+                contents.append(
+                    ContentToolRequest(
+                        name=content["name"],
+                        id=content["tool_use_id"],
+                        arguments=params,
+                    )
+                )
+        usage = completion.usage
+        if usage is None:
+            tokens = (0, 0)
+        else:
+            tokens = (usage.prompt_tokens or 0, usage.completion_tokens or 0)
+        tokens_log(self, tokens)
+        return Turn(
+            "assistant",
+            contents,
+            tokens=tokens,
+            # TODO: no finish_reason in Snowflake?
+            # finish_reason=completion.choices[0].finish_reason,
+            completion=completion,
+        )
+    # N.B. this is currently the best documentation I can find for how tool calling works
+    # https://quickstarts.snowflake.com/guide/getting-started-with-tool-use-on-cortex-and-anthropic-claude/index.html#5
+    def _as_snowflake_tool(self, tool: Tool):
+        import snowflake.core.cortex.inference_service._generated.models as models
+        func = tool.schema["function"]
+        params = func.get("parameters", {})
+        props = params.get("properties", {})
+        if not isinstance(props, dict):
+            raise ValueError(
+                f"Tool function parameters must be a dictionary, got {type(props)}"
+            )
+        required = params.get("required", [])
+        if not isinstance(required, list):
+            raise ValueError(
+                f"Tool function required parameters must be a list, got {type(required)}"
+            )
+        input_schema = models.ToolToolSpecInputSchema(
+            type="object",
+            properties=props or None,
+            required=required or None,
+        )
+        spec = models.ToolToolSpec(
+            type="generic",
+            name=func["name"],
+            description=func.get("description", ""),
+            input_schema=input_schema,
+        )
-        if has_data_model:
-            data = json.loads(completion)
-            contents = [ContentJson(value=data)]
+        return models.Tool(tool_spec=spec)
+# Yield parsed event data from the Snowflake SSEClient
+# (this is only needed for the streaming case).
+def generate_event_data(events: Generator["Event", None, None]):
+    for x in events:
+        if x.data:
+            yield parse_event_data(x.data, stream=True)
+# Same thing for the async case.
+async def generate_event_data_async(events: Generator["Event", None, None]):
+    for x in events:
+        if x.data:
+            yield parse_event_data(x.data, stream=True)
+@overload
+def parse_event_data(
+    data: str, stream: Literal[True]
+) -> "models.StreamingCompleteResponseDataEvent": ...
+@overload
+def parse_event_data(
+    data: str, stream: Literal[False]
+) -> "models.NonStreamingCompleteResponse": ...
+def parse_event_data(
+    data: str, stream: bool
+) -> "models.NonStreamingCompleteResponse | models.StreamingCompleteResponseDataEvent":
+    "Parse the (JSON) event data from Snowflake using the relevant pydantic model."
+    import snowflake.core.cortex.inference_service._generated.models as models
+    try:
+        if stream:
+            return models.StreamingCompleteResponseDataEvent.from_json(data)
         else:
-            contents = [ContentText(text=completion)]
+            return models.NonStreamingCompleteResponse.from_json(data)
+    except Exception:
+        raise ValueError(
+            f"Failed to parse Snowflake event data: {data}. "
+            "Please report this error here: https://github.com/posit-dev/chatlas/issues/new"
+        )
+# At the time writing, .events() flat out errors in the stream=False case since
+# the Content-Type is set to application/json;charset=utf-8, and SSEClient
+# doesn't know how to handle that.
+# https://github.com/snowflakedb/snowflake-ml-python/blob/6910e96/snowflake/cortex/_sse_client.py#L69
+#
+# So, do some janky stuff here to get the data out of the response.
+#
+# If and when snowflake fixes this, we can remove the try/except block.
+def parse_request_object(
+    client: "SSEClient",
+) -> "Optional[models.NonStreamingCompleteResponse]":
+    try:
+        import urllib3
+        if isinstance(client._event_source, urllib3.response.HTTPResponse):
+            return parse_event_data(
+                client._event_source.data.decode("utf-8"),
+                stream=False,
+            )
+    except Exception:
+        pass
-        return Turn("assistant", contents)
+    return None

chatlas/_tools.py CHANGED Viewed

@@ -8,7 +8,10 @@ from pydantic import BaseModel, Field, create_model
 from . import _utils
-__all__ = ("Tool",)
+__all__ = (
+    "Tool",
+    "ToolRejectError",
+)
 if TYPE_CHECKING:
     from openai.types.chat import ChatCompletionToolParam
@@ -47,6 +50,61 @@ class Tool:
         self.name = self.schema["function"]["name"]
+class ToolRejectError(Exception):
+    """
+    Error to represent a tool call being rejected.
+    This error is meant to be raised when an end user has chosen to deny a tool
+    call. It can be raised in a tool function or in a `.on_tool_request()`
+    callback registered via a :class:`~chatlas.Chat`. When used in the callback,
+    the tool call is rejected before the tool function is invoked.
+    Parameters
+    ----------
+    reason
+        A string describing the reason for rejecting the tool call. This will be
+        included in the error message passed to the LLM. In addition to the
+        reason, the error message will also include "Tool call rejected." to
+        indicate that the tool call was not processed.
+    Raises
+    -------
+    ToolRejectError
+        An error with a message informing the LLM that the tool call was
+        rejected (and the reason why).
+    Examples
+    --------
+    >>> import os
+    >>> import chatlas as ctl
+    >>>
+    >>> chat = ctl.ChatOpenAI()
+    >>>
+    >>> def list_files():
+    ...     "List files in the user's current directory"
+    ...     while True:
+    ...         allow = input(
+    ...             "Would you like to allow access to your current directory? (yes/no): "
+    ...         )
+    ...         if allow.lower() == "yes":
+    ...             return os.listdir(".")
+    ...         elif allow.lower() == "no":
+    ...             raise ctl.ToolRejectError(
+    ...                 "The user has chosen to disallow the tool call."
+    ...             )
+    ...         else:
+    ...             print("Please answer with 'yes' or 'no'.")
+    >>>
+    >>> chat.register_tool(list_files)
+    >>> chat.chat("What files are available in my current directory?")
+    """
+    def __init__(self, reason: str = "The user has chosen to disallow the tool call."):
+        message = f"Tool call rejected. {reason}"
+        super().__init__(message)
+        self.message = message
 def func_to_schema(
     func: Callable[..., Any] | Callable[..., Awaitable[Any]],
     model: Optional[type[BaseModel]] = None,

chatlas/_version.py CHANGED Viewed

@@ -17,5 +17,5 @@ __version__: str
 __version_tuple__: VERSION_TUPLE
 version_tuple: VERSION_TUPLE
-__version__ = version = '0.7.1'
-__version_tuple__ = version_tuple = (0, 7, 1)
+__version__ = version = '0.8.1'
+__version_tuple__ = version_tuple = (0, 8, 1)

chatlas 0.7.1__py3-none-any.whl → 0.8.1__py3-none-any.whl

Potentially problematic release.

chatlas 0.7.1py3-none-any.whl → 0.8.1py3-none-any.whl