PyPI - vectorvein - Versions diffs - 0.2.7__py3-none-any.whl → 0.2.8__py3-none-any.whl - Mend

vectorvein 0.2.7py3-none-any.whl → 0.2.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (9) hide show

vectorvein/chat_clients/anthropic_client.py CHANGED Viewed

@@ -1,11 +1,30 @@
 # @Author: Bi Ying
 # @Date:   2024-07-26 14:48:55
 import json
-from typing import overload, Generator, AsyncGenerator, Any, Literal, Iterable
+from typing import (
+    Any,
+    Dict,
+    List,
+    Union,
+    Literal,
+    Iterable,
+    overload,
+    Optional,
+    Generator,
+    AsyncGenerator,
+)
 import httpx
 from openai._types import NotGiven as OpenAINotGiven
 from openai._types import NOT_GIVEN as OPENAI_NOT_GIVEN
+from openai._types import Headers, Query, Body
+from openai.types.shared_params.metadata import Metadata
+from openai.types.chat.completion_create_params import ResponseFormat
+from openai.types.chat.chat_completion_modality import ChatCompletionModality
+from openai.types.chat.chat_completion_audio_param import ChatCompletionAudioParam
+from openai.types.chat.chat_completion_reasoning_effort import ChatCompletionReasoningEffort
+from openai.types.chat.chat_completion_stream_options_param import ChatCompletionStreamOptionsParam
+from openai.types.chat.chat_completion_prediction_content_param import ChatCompletionPredictionContentParam
 from anthropic import (
     Anthropic,
     AnthropicVertex,
@@ -21,6 +40,7 @@ from anthropic.types import (
     RedactedThinkingBlock,
     MessageParam,
     ToolUseBlock,
+    ThinkingConfigParam,
     RawMessageDeltaEvent,
     RawMessageStartEvent,
     RawContentBlockStartEvent,
@@ -45,7 +65,6 @@ from ..types.llm_parameters import (
     ChatCompletionMessage,
     ChatCompletionToolParam,
     ChatCompletionDeltaMessage,
-    ChatCompletionStreamOptionsParam,
 )
@@ -261,11 +280,33 @@ class AnthropicChatClient(BaseChatClient):
         max_tokens: int | None = None,
         tools: Iterable[ToolParam] | NotGiven = NOT_GIVEN,
         tool_choice: ToolChoice | NotGiven = NOT_GIVEN,
-        response_format: dict | None = None,
+        response_format: ResponseFormat | NotGiven = NOT_GIVEN,
         stream_options: ChatCompletionStreamOptionsParam | None = None,
         top_p: float | NotGiven | None = NOT_GIVEN,
         skip_cutoff: bool = False,
-        **kwargs,
+        audio: Optional[ChatCompletionAudioParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        frequency_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logit_bias: Optional[Dict[str, int]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logprobs: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        max_completion_tokens: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        metadata: Optional[Metadata] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        modalities: Optional[List[ChatCompletionModality]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        n: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        parallel_tool_calls: bool | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        prediction: Optional[ChatCompletionPredictionContentParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        presence_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        reasoning_effort: Optional[ChatCompletionReasoningEffort] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        thinking: ThinkingConfigParam | None | NotGiven = NOT_GIVEN,
+        seed: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        service_tier: Optional[Literal["auto", "default"]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        stop: Union[Optional[str], List[str]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        store: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        top_logprobs: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        user: str | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | OpenAINotGiven = OPENAI_NOT_GIVEN,
     ) -> ChatCompletionMessage:
         pass
@@ -280,11 +321,33 @@ class AnthropicChatClient(BaseChatClient):
         max_tokens: int | None = None,
         tools: Iterable[ToolParam] | NotGiven = NOT_GIVEN,
         tool_choice: ToolChoice | NotGiven = NOT_GIVEN,
-        response_format: dict | None = None,
+        response_format: ResponseFormat | NotGiven = NOT_GIVEN,
         stream_options: ChatCompletionStreamOptionsParam | None = None,
         top_p: float | NotGiven | None = NOT_GIVEN,
         skip_cutoff: bool = False,
-        **kwargs,
+        audio: Optional[ChatCompletionAudioParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        frequency_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logit_bias: Optional[Dict[str, int]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logprobs: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        max_completion_tokens: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        metadata: Optional[Metadata] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        modalities: Optional[List[ChatCompletionModality]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        n: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        parallel_tool_calls: bool | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        prediction: Optional[ChatCompletionPredictionContentParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        presence_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        reasoning_effort: Optional[ChatCompletionReasoningEffort] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        thinking: ThinkingConfigParam | None | NotGiven = NOT_GIVEN,
+        seed: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        service_tier: Optional[Literal["auto", "default"]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        stop: Union[Optional[str], List[str]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        store: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        top_logprobs: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        user: str | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | OpenAINotGiven = OPENAI_NOT_GIVEN,
     ) -> Generator[ChatCompletionDeltaMessage, None, None]:
         pass
@@ -299,11 +362,33 @@ class AnthropicChatClient(BaseChatClient):
         max_tokens: int | None = None,
         tools: Iterable[ToolParam] | NotGiven = NOT_GIVEN,
         tool_choice: ToolChoice | NotGiven = NOT_GIVEN,
-        response_format: dict | None = None,
+        response_format: ResponseFormat | NotGiven = NOT_GIVEN,
         stream_options: ChatCompletionStreamOptionsParam | None = None,
         top_p: float | NotGiven | None = NOT_GIVEN,
         skip_cutoff: bool = False,
-        **kwargs,
+        audio: Optional[ChatCompletionAudioParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        frequency_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logit_bias: Optional[Dict[str, int]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logprobs: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        max_completion_tokens: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        metadata: Optional[Metadata] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        modalities: Optional[List[ChatCompletionModality]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        n: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        parallel_tool_calls: bool | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        prediction: Optional[ChatCompletionPredictionContentParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        presence_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        reasoning_effort: Optional[ChatCompletionReasoningEffort] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        thinking: ThinkingConfigParam | None | NotGiven = NOT_GIVEN,
+        seed: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        service_tier: Optional[Literal["auto", "default"]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        stop: Union[Optional[str], List[str]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        store: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        top_logprobs: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        user: str | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | OpenAINotGiven = OPENAI_NOT_GIVEN,
     ) -> ChatCompletionMessage | Generator[ChatCompletionDeltaMessage, Any, None]:
         pass
@@ -317,11 +402,33 @@ class AnthropicChatClient(BaseChatClient):
         max_tokens: int | None = None,
         tools: Iterable[ToolParam] | NotGiven = NOT_GIVEN,
         tool_choice: ToolChoice | NotGiven = NOT_GIVEN,
-        response_format: dict | None = None,
+        response_format: ResponseFormat | NotGiven = NOT_GIVEN,
         stream_options: ChatCompletionStreamOptionsParam | None = None,
         top_p: float | NotGiven | None = NOT_GIVEN,
         skip_cutoff: bool = False,
-        **kwargs,
+        audio: Optional[ChatCompletionAudioParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        frequency_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logit_bias: Optional[Dict[str, int]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logprobs: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        max_completion_tokens: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        metadata: Optional[Metadata] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        modalities: Optional[List[ChatCompletionModality]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        n: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        parallel_tool_calls: bool | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        prediction: Optional[ChatCompletionPredictionContentParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        presence_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        reasoning_effort: Optional[ChatCompletionReasoningEffort] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        thinking: ThinkingConfigParam | None | NotGiven = NOT_GIVEN,
+        seed: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        service_tier: Optional[Literal["auto", "default"]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        stop: Union[Optional[str], List[str]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        store: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        top_logprobs: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        user: str | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | OpenAINotGiven = OPENAI_NOT_GIVEN,
     ):
         if model is not None:
             self.model = model
@@ -342,9 +449,6 @@ class AnthropicChatClient(BaseChatClient):
             formatted_messages = refactor_into_openai_messages(messages)
-            if "thinking" in kwargs:
-                kwargs.pop("thinking")  # TODO: 暂时没看到如何处理 openai 接口的 thinking 参数，如 openrouter 中使用
             if self.stream:
                 def _generator():
@@ -369,7 +473,28 @@ class AnthropicChatClient(BaseChatClient):
                         stream_options=stream_options,
                         top_p=top_p,
                         skip_cutoff=skip_cutoff,
-                        **kwargs,
+                        audio=audio,
+                        frequency_penalty=frequency_penalty,
+                        logit_bias=logit_bias,
+                        logprobs=logprobs,
+                        max_completion_tokens=max_completion_tokens,
+                        metadata=metadata,
+                        modalities=modalities,
+                        n=n,
+                        parallel_tool_calls=parallel_tool_calls,
+                        prediction=prediction,
+                        presence_penalty=presence_penalty,
+                        reasoning_effort=reasoning_effort,
+                        seed=seed,
+                        service_tier=service_tier,
+                        stop=stop,
+                        store=store,
+                        top_logprobs=top_logprobs,
+                        user=user,
+                        extra_headers=extra_headers,
+                        extra_query=extra_query,
+                        extra_body=extra_body,
+                        timeout=timeout,
                     )
                     for chunk in response:
                         yield chunk
@@ -396,7 +521,28 @@ class AnthropicChatClient(BaseChatClient):
                     response_format=response_format,
                     top_p=top_p,
                     skip_cutoff=skip_cutoff,
-                    **kwargs,
+                    audio=audio,
+                    frequency_penalty=frequency_penalty,
+                    logit_bias=logit_bias,
+                    logprobs=logprobs,
+                    max_completion_tokens=max_completion_tokens,
+                    metadata=metadata,
+                    modalities=modalities,
+                    n=n,
+                    parallel_tool_calls=parallel_tool_calls,
+                    prediction=prediction,
+                    presence_penalty=presence_penalty,
+                    reasoning_effort=reasoning_effort,
+                    seed=seed,
+                    service_tier=service_tier,
+                    stop=stop,
+                    store=store,
+                    top_logprobs=top_logprobs,
+                    user=user,
+                    extra_headers=extra_headers,
+                    extra_query=extra_query,
+                    extra_body=extra_body,
+                    timeout=timeout,
                 )
         raw_client = self.raw_client  # 调用完 self.raw_client 后，self.model_id 会被赋值
@@ -410,6 +556,8 @@ class AnthropicChatClient(BaseChatClient):
             top_p = NOT_GIVEN
         if isinstance(self.temperature, NotGiven) or self.temperature is None:
             self.temperature = NOT_GIVEN
+        if isinstance(thinking, NotGiven) or thinking is None:
+            thinking = NOT_GIVEN
         if messages[0].get("role") == "system":
             system_prompt: str = messages[0]["content"]
@@ -454,7 +602,7 @@ class AnthropicChatClient(BaseChatClient):
                 tools=tools_params,
                 tool_choice=tool_choice_param,
                 top_p=top_p,
-                **kwargs,
+                thinking=thinking,
             )
             def generator():
@@ -528,7 +676,7 @@ class AnthropicChatClient(BaseChatClient):
                 tools=tools_params,
                 tool_choice=tool_choice_param,
                 top_p=top_p,
-                **kwargs,
+                thinking=thinking,
             )
             result = {
@@ -662,11 +810,33 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
         max_tokens: int | None = None,
         tools: Iterable[ToolParam] | NotGiven = NOT_GIVEN,
         tool_choice: ToolChoice | NotGiven = NOT_GIVEN,
-        response_format: dict | None = None,
+        response_format: ResponseFormat | NotGiven = NOT_GIVEN,
         stream_options: ChatCompletionStreamOptionsParam | None = None,
         top_p: float | NotGiven | None = NOT_GIVEN,
         skip_cutoff: bool = False,
-        **kwargs,
+        audio: Optional[ChatCompletionAudioParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        frequency_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logit_bias: Optional[Dict[str, int]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logprobs: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        max_completion_tokens: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        metadata: Optional[Metadata] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        modalities: Optional[List[ChatCompletionModality]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        n: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        parallel_tool_calls: bool | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        prediction: Optional[ChatCompletionPredictionContentParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        presence_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        reasoning_effort: Optional[ChatCompletionReasoningEffort] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        thinking: ThinkingConfigParam | None | NotGiven = NOT_GIVEN,
+        seed: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        service_tier: Optional[Literal["auto", "default"]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        stop: Union[Optional[str], List[str]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        store: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        top_logprobs: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        user: str | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | OpenAINotGiven = OPENAI_NOT_GIVEN,
     ) -> ChatCompletionMessage:
         pass
@@ -681,11 +851,33 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
         max_tokens: int | None = None,
         tools: Iterable[ToolParam] | NotGiven = NOT_GIVEN,
         tool_choice: ToolChoice | NotGiven = NOT_GIVEN,
-        response_format: dict | None = None,
+        response_format: ResponseFormat | NotGiven = NOT_GIVEN,
         stream_options: ChatCompletionStreamOptionsParam | None = None,
         top_p: float | NotGiven | None = NOT_GIVEN,
         skip_cutoff: bool = False,
-        **kwargs,
+        audio: Optional[ChatCompletionAudioParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        frequency_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logit_bias: Optional[Dict[str, int]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logprobs: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        max_completion_tokens: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        metadata: Optional[Metadata] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        modalities: Optional[List[ChatCompletionModality]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        n: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        parallel_tool_calls: bool | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        prediction: Optional[ChatCompletionPredictionContentParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        presence_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        reasoning_effort: Optional[ChatCompletionReasoningEffort] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        thinking: ThinkingConfigParam | None | NotGiven = NOT_GIVEN,
+        seed: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        service_tier: Optional[Literal["auto", "default"]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        stop: Union[Optional[str], List[str]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        store: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        top_logprobs: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        user: str | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | OpenAINotGiven = OPENAI_NOT_GIVEN,
     ) -> AsyncGenerator[ChatCompletionDeltaMessage, Any]:
         pass
@@ -700,11 +892,33 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
         max_tokens: int | None = None,
         tools: Iterable[ToolParam] | NotGiven = NOT_GIVEN,
         tool_choice: ToolChoice | NotGiven = NOT_GIVEN,
-        response_format: dict | None = None,
+        response_format: ResponseFormat | NotGiven = NOT_GIVEN,
         stream_options: ChatCompletionStreamOptionsParam | None = None,
         top_p: float | NotGiven | None = NOT_GIVEN,
         skip_cutoff: bool = False,
-        **kwargs,
+        audio: Optional[ChatCompletionAudioParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        frequency_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logit_bias: Optional[Dict[str, int]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logprobs: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        max_completion_tokens: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        metadata: Optional[Metadata] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        modalities: Optional[List[ChatCompletionModality]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        n: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        parallel_tool_calls: bool | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        prediction: Optional[ChatCompletionPredictionContentParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        presence_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        reasoning_effort: Optional[ChatCompletionReasoningEffort] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        thinking: ThinkingConfigParam | None | NotGiven = NOT_GIVEN,
+        seed: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        service_tier: Optional[Literal["auto", "default"]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        stop: Union[Optional[str], List[str]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        store: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        top_logprobs: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        user: str | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | OpenAINotGiven = OPENAI_NOT_GIVEN,
     ) -> ChatCompletionMessage | AsyncGenerator[ChatCompletionDeltaMessage, Any]:
         pass
@@ -718,11 +932,33 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
         max_tokens: int | None = None,
         tools: Iterable[ToolParam] | NotGiven = NOT_GIVEN,
         tool_choice: ToolChoice | NotGiven = NOT_GIVEN,
-        response_format: dict | None = None,
+        response_format: ResponseFormat | NotGiven = NOT_GIVEN,
         stream_options: ChatCompletionStreamOptionsParam | None = None,
         top_p: float | NotGiven | None = NOT_GIVEN,
         skip_cutoff: bool = False,
-        **kwargs,
+        audio: Optional[ChatCompletionAudioParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        frequency_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logit_bias: Optional[Dict[str, int]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        logprobs: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        max_completion_tokens: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        metadata: Optional[Metadata] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        modalities: Optional[List[ChatCompletionModality]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        n: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        parallel_tool_calls: bool | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        prediction: Optional[ChatCompletionPredictionContentParam] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        presence_penalty: Optional[float] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        reasoning_effort: Optional[ChatCompletionReasoningEffort] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        thinking: ThinkingConfigParam | None | NotGiven = NOT_GIVEN,
+        seed: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        service_tier: Optional[Literal["auto", "default"]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        stop: Union[Optional[str], List[str]] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        store: Optional[bool] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        top_logprobs: Optional[int] | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        user: str | OpenAINotGiven = OPENAI_NOT_GIVEN,
+        extra_headers: Headers | None = None,
+        extra_query: Query | None = None,
+        extra_body: Body | None = None,
+        timeout: float | httpx.Timeout | None | OpenAINotGiven = OPENAI_NOT_GIVEN,
     ):
         if model is not None:
             self.model = model
@@ -743,9 +979,6 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
             formatted_messages = refactor_into_openai_messages(messages)
-            if "thinking" in kwargs:
-                kwargs.pop("thinking")  # TODO: 暂时没看到如何处理 openai 接口的 thinking 参数，如 openrouter 中使用
             if self.stream:
                 async def _generator():
@@ -771,7 +1004,28 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
                         stream_options=stream_options,
                         top_p=top_p,
                         skip_cutoff=skip_cutoff,
-                        **kwargs,
+                        audio=audio,
+                        frequency_penalty=frequency_penalty,
+                        logit_bias=logit_bias,
+                        logprobs=logprobs,
+                        max_completion_tokens=max_completion_tokens,
+                        metadata=metadata,
+                        modalities=modalities,
+                        n=n,
+                        parallel_tool_calls=parallel_tool_calls,
+                        prediction=prediction,
+                        presence_penalty=presence_penalty,
+                        reasoning_effort=reasoning_effort,
+                        seed=seed,
+                        service_tier=service_tier,
+                        stop=stop,
+                        store=store,
+                        top_logprobs=top_logprobs,
+                        user=user,
+                        extra_headers=extra_headers,
+                        extra_query=extra_query,
+                        extra_body=extra_body,
+                        timeout=timeout,
                     )
                     async for chunk in response:
                         yield chunk
@@ -799,7 +1053,28 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
                     response_format=response_format,
                     top_p=top_p,
                     skip_cutoff=skip_cutoff,
-                    **kwargs,
+                    audio=audio,
+                    frequency_penalty=frequency_penalty,
+                    logit_bias=logit_bias,
+                    logprobs=logprobs,
+                    max_completion_tokens=max_completion_tokens,
+                    metadata=metadata,
+                    modalities=modalities,
+                    n=n,
+                    parallel_tool_calls=parallel_tool_calls,
+                    prediction=prediction,
+                    presence_penalty=presence_penalty,
+                    reasoning_effort=reasoning_effort,
+                    seed=seed,
+                    service_tier=service_tier,
+                    stop=stop,
+                    store=store,
+                    top_logprobs=top_logprobs,
+                    user=user,
+                    extra_headers=extra_headers,
+                    extra_query=extra_query,
+                    extra_body=extra_body,
+                    timeout=timeout,
                 )
         raw_client = self.raw_client  # 调用完 self.raw_client 后，self.model_id 会被赋值
@@ -813,6 +1088,8 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
             top_p = NOT_GIVEN
         if isinstance(self.temperature, NotGiven) or self.temperature is None:
             self.temperature = NOT_GIVEN
+        if isinstance(thinking, NotGiven) or thinking is None:
+            thinking = NOT_GIVEN
         if messages[0].get("role") == "system":
             system_prompt = messages[0]["content"]
@@ -857,7 +1134,7 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
                 tools=tools_params,
                 tool_choice=tool_choice_param,
                 top_p=top_p,
-                **kwargs,
+                thinking=thinking,
             )
             async def generator():
@@ -931,7 +1208,7 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
                 tools=tools_params,
                 tool_choice=tool_choice_param,
                 top_p=top_p,
-                **kwargs,
+                thinking=thinking,
             )
             result = {

vectorvein 0.2.7__py3-none-any.whl → 0.2.8__py3-none-any.whl

vectorvein 0.2.7py3-none-any.whl → 0.2.8py3-none-any.whl