PyPI - vectorvein - Versions diffs - 0.1.37__py3-none-any.whl → 0.1.39__py3-none-any.whl - Mend

vectorvein 0.1.37py3-none-any.whl → 0.1.39py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

vectorvein/chat_clients/anthropic_client.py CHANGED Viewed

@@ -135,12 +135,19 @@ class AnthropicChatClient(BaseChatClient):
             http_client,
             backend_name,
         )
+        self.model_id = None
     @cached_property
     def raw_client(self):
         if self.random_endpoint:
             self.random_endpoint = True
-            self.endpoint_id = random.choice(self.backend_settings.models[self.model].endpoints)
+            endpoint = random.choice(self.backend_settings.models[self.model].endpoints)
+            self.model_id = None
+            if isinstance(endpoint, dict):
+                self.endpoint_id = endpoint["endpoint_id"]
+                self.model_id = endpoint["model_id"]
+            else:
+                self.endpoint_id = endpoint
             self.endpoint = settings.get_endpoint(self.endpoint_id)
         if self.endpoint.is_vertex:
@@ -265,7 +272,13 @@ class AnthropicChatClient(BaseChatClient):
         if self.random_endpoint:
             self.random_endpoint = True
-            self.endpoint_id = random.choice(self.backend_settings.models[self.model].endpoints)
+            endpoint = random.choice(self.backend_settings.models[self.model].endpoints)
+            self.model_id = None
+            if isinstance(endpoint, dict):
+                self.endpoint_id = endpoint["endpoint_id"]
+                self.model_id = endpoint["model_id"]
+            else:
+                self.endpoint_id = endpoint
             self.endpoint = settings.get_endpoint(self.endpoint_id)
         if self.endpoint.api_schema_type == "openai":
@@ -304,7 +317,10 @@ class AnthropicChatClient(BaseChatClient):
         assert isinstance(self.raw_client, Anthropic | AnthropicVertex)
+        raw_client = self.raw_client  # 调用完 self.raw_client 后，self.model_id 会被赋值
         self.model_setting = self.backend_settings.models[self.model]
+        if self.model_id is None:
+            self.model_id = self.model_setting.id
         if messages[0].get("role") == "system":
             system_prompt: str = messages[0]["content"]
@@ -317,7 +333,7 @@ class AnthropicChatClient(BaseChatClient):
                 messages,
                 max_count=self.model_setting.context_length,
                 backend=self.BACKEND_NAME,
-                model=self.model_setting.id,
+                model=self.model,
             )
         messages = format_messages_alternate(messages)
@@ -329,7 +345,7 @@ class AnthropicChatClient(BaseChatClient):
         if max_tokens is None:
             max_output_tokens = self.model_setting.max_output_tokens
-            token_counts = get_message_token_counts(messages=messages, tools=tools_params, model=self.model_setting.id)
+            token_counts = get_message_token_counts(messages=messages, tools=tools_params, model=self.model)
             if max_output_tokens is not None:
                 max_tokens = self.model_setting.context_length - token_counts
                 max_tokens = min(max(max_tokens, 1), max_output_tokens)
@@ -337,8 +353,8 @@ class AnthropicChatClient(BaseChatClient):
                 max_tokens = self.model_setting.context_length - token_counts
         if self.stream:
-            stream_response = self.raw_client.messages.create(
-                model=self.model_setting.id,
+            stream_response = raw_client.messages.create(
+                model=self.model_id,
                 messages=messages,
                 system=system_prompt,
                 stream=True,
@@ -399,8 +415,8 @@ class AnthropicChatClient(BaseChatClient):
             return generator()
         else:
-            response = self.raw_client.messages.create(
-                model=self.model_setting.id,
+            response = raw_client.messages.create(
+                model=self.model_id,
                 messages=messages,
                 system=system_prompt,
                 stream=False,
@@ -457,12 +473,19 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
             http_client,
             backend_name,
         )
+        self.model_id = None
     @cached_property
     def raw_client(self):
         if self.random_endpoint:
             self.random_endpoint = True
-            self.endpoint_id = random.choice(self.backend_settings.models[self.model].endpoints)
+            endpoint = random.choice(self.backend_settings.models[self.model].endpoints)
+            self.model_id = None
+            if isinstance(endpoint, dict):
+                self.endpoint_id = endpoint["endpoint_id"]
+                self.model_id = endpoint["model_id"]
+            else:
+                self.endpoint_id = endpoint
             self.endpoint = settings.get_endpoint(self.endpoint_id)
         if self.endpoint.is_vertex:
@@ -587,7 +610,13 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
         if self.random_endpoint:
             self.random_endpoint = True
-            self.endpoint_id = random.choice(self.backend_settings.models[self.model].endpoints)
+            endpoint = random.choice(self.backend_settings.models[self.model].endpoints)
+            self.model_id = None
+            if isinstance(endpoint, dict):
+                self.endpoint_id = endpoint["endpoint_id"]
+                self.model_id = endpoint["model_id"]
+            else:
+                self.endpoint_id = endpoint
             self.endpoint = settings.get_endpoint(self.endpoint_id)
         if self.endpoint.api_schema_type == "openai":
@@ -628,7 +657,10 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
         assert isinstance(self.raw_client, AsyncAnthropic | AsyncAnthropicVertex)
+        raw_client = self.raw_client  # 调用完 self.raw_client 后，self.model_id 会被赋值
         self.model_setting = self.backend_settings.models[self.model]
+        if self.model_id is None:
+            self.model_id = self.model_setting.id
         if messages[0].get("role") == "system":
             system_prompt = messages[0]["content"]
@@ -641,7 +673,7 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
                 messages,
                 max_count=self.model_setting.context_length,
                 backend=self.BACKEND_NAME,
-                model=self.model_setting.id,
+                model=self.model,
             )
         messages = format_messages_alternate(messages)
@@ -653,7 +685,7 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
         if max_tokens is None:
             max_output_tokens = self.model_setting.max_output_tokens
-            token_counts = get_message_token_counts(messages=messages, tools=tools_params, model=self.model_setting.id)
+            token_counts = get_message_token_counts(messages=messages, tools=tools_params, model=self.model)
             if max_output_tokens is not None:
                 max_tokens = self.model_setting.context_length - token_counts
                 max_tokens = min(max(max_tokens, 1), max_output_tokens)
@@ -661,8 +693,8 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
                 max_tokens = self.model_setting.context_length - token_counts
         if self.stream:
-            stream_response = await self.raw_client.messages.create(
-                model=self.model_setting.id,
+            stream_response = await raw_client.messages.create(
+                model=self.model_id,
                 messages=messages,
                 system=system_prompt,
                 stream=True,
@@ -723,8 +755,8 @@ class AsyncAnthropicChatClient(BaseAsyncChatClient):
             return generator()
         else:
-            response = await self.raw_client.messages.create(
-                model=self.model_setting.id,
+            response = await raw_client.messages.create(
+                model=self.model_id,
                 messages=messages,
                 system=system_prompt,
                 stream=False,

vectorvein/chat_clients/openai_compatible_client.py CHANGED Viewed

@@ -55,12 +55,19 @@ class OpenAICompatibleChatClient(BaseChatClient):
             http_client,
             backend_name,
         )
+        self.model_id = None
     @cached_property
     def raw_client(self) -> OpenAI | AzureOpenAI:
         if self.random_endpoint:
             self.random_endpoint = True
-            self.endpoint_id = random.choice(self.backend_settings.models[self.model].endpoints)
+            endpoint = random.choice(self.backend_settings.models[self.model].endpoints)
+            self.model_id = None
+            if isinstance(endpoint, dict):
+                self.endpoint_id = endpoint["endpoint_id"]
+                self.model_id = endpoint["model_id"]
+            else:
+                self.endpoint_id = endpoint
             self.endpoint = settings.get_endpoint(self.endpoint_id)
         if self.endpoint.is_azure:
@@ -141,14 +148,17 @@ class OpenAICompatibleChatClient(BaseChatClient):
         if temperature is not None:
             self.temperature = temperature
+        raw_client = self.raw_client  # 调用完 self.raw_client 后，self.model_id 会被赋值
         self.model_setting = self.backend_settings.models[self.model]
+        if self.model_id is None:
+            self.model_id = self.model_setting.id
         if self.context_length_control == ContextLengthControlType.Latest:
             messages = cutoff_messages(
                 messages,
                 max_count=self.model_setting.context_length,
                 backend=self.BACKEND_NAME,
-                model=self.model_setting.id,
+                model=self.model,
             )
         if tools:
@@ -167,7 +177,7 @@ class OpenAICompatibleChatClient(BaseChatClient):
         if max_tokens is None:
             max_output_tokens = self.model_setting.max_output_tokens
-            token_counts = get_message_token_counts(messages=messages, tools=tools, model=self.model_setting.id)
+            token_counts = get_message_token_counts(messages=messages, tools=tools, model=self.model)
             if max_output_tokens is not None:
                 max_tokens = self.model_setting.context_length - token_counts - 64
                 max_tokens = min(max(max_tokens, 1), max_output_tokens)
@@ -180,8 +190,8 @@ class OpenAICompatibleChatClient(BaseChatClient):
             self.response_format = {}
         if self.stream:
-            stream_response: Stream[ChatCompletionChunk] = self.raw_client.chat.completions.create(
-                model=self.model_setting.id,
+            stream_response: Stream[ChatCompletionChunk] = raw_client.chat.completions.create(
+                model=self.model_id,
                 messages=messages,
                 stream=True,
                 temperature=self.temperature,
@@ -221,8 +231,8 @@ class OpenAICompatibleChatClient(BaseChatClient):
             return generator()
         else:
-            response: ChatCompletion = self.raw_client.chat.completions.create(
-                model=self.model_setting.id,
+            response: ChatCompletion = raw_client.chat.completions.create(
+                model=self.model_id,
                 messages=messages,
                 stream=False,
                 temperature=self.temperature,
@@ -277,12 +287,19 @@ class AsyncOpenAICompatibleChatClient(BaseAsyncChatClient):
             http_client,
             backend_name,
         )
+        self.model_id = None
     @cached_property
     def raw_client(self):
         if self.random_endpoint:
             self.random_endpoint = True
-            self.endpoint_id = random.choice(self.backend_settings.models[self.model].endpoints)
+            endpoint = random.choice(self.backend_settings.models[self.model].endpoints)
+            self.model_id = None
+            if isinstance(endpoint, dict):
+                self.endpoint_id = endpoint["endpoint_id"]
+                self.model_id = endpoint["model_id"]
+            else:
+                self.endpoint_id = endpoint
             self.endpoint = settings.get_endpoint(self.endpoint_id)
         if self.endpoint.is_azure:
@@ -363,14 +380,17 @@ class AsyncOpenAICompatibleChatClient(BaseAsyncChatClient):
         if temperature is not None:
             self.temperature = temperature
+        raw_client = self.raw_client  # 调用完 self.raw_client 后，self.model_id 会被赋值
         self.model_setting = self.backend_settings.models[self.model]
+        if self.model_id is None:
+            self.model_id = self.model_setting.id
         if self.context_length_control == ContextLengthControlType.Latest:
             messages = cutoff_messages(
                 messages,
                 max_count=self.model_setting.context_length,
                 backend=self.BACKEND_NAME,
-                model=self.model_setting.id,
+                model=self.model,
             )
         if tools:
@@ -394,7 +414,7 @@ class AsyncOpenAICompatibleChatClient(BaseAsyncChatClient):
         if max_tokens is None:
             max_output_tokens = self.model_setting.max_output_tokens
-            token_counts = get_message_token_counts(messages=messages, tools=tools, model=self.model_setting.id)
+            token_counts = get_message_token_counts(messages=messages, tools=tools, model=self.model)
             if max_output_tokens is not None:
                 max_tokens = self.model_setting.context_length - token_counts - 64
                 max_tokens = min(max(max_tokens, 1), max_output_tokens)
@@ -402,8 +422,8 @@ class AsyncOpenAICompatibleChatClient(BaseAsyncChatClient):
                 max_tokens = self.model_setting.context_length - token_counts - 64
         if self.stream:
-            stream_response: AsyncStream[ChatCompletionChunk] = await self.raw_client.chat.completions.create(
-                model=self.model_setting.id,
+            stream_response: AsyncStream[ChatCompletionChunk] = await raw_client.chat.completions.create(
+                model=self.model_id,
                 messages=messages,
                 stream=self.stream,
                 temperature=self.temperature,
@@ -443,8 +463,8 @@ class AsyncOpenAICompatibleChatClient(BaseAsyncChatClient):
             return generator()
         else:
-            response: ChatCompletion = await self.raw_client.chat.completions.create(
-                model=self.model_setting.id,
+            response: ChatCompletion = await raw_client.chat.completions.create(
+                model=self.model_id,
                 messages=messages,
                 stream=self.stream,
                 temperature=self.temperature,

vectorvein/types/llm_parameters.py CHANGED Viewed

@@ -2,6 +2,11 @@
 # @Date:   2024-07-26 23:48:04
 from typing import List, Dict, Optional, Union, Iterable
+try:
+    from typing import TypedDict
+except ImportError:
+    from typing_extensions import TypedDict
 from pydantic import BaseModel, Field
 from anthropic.types import ToolParam as AnthropicToolParam
@@ -18,6 +23,11 @@ from openai.types.chat.chat_completion_tool_choice_option_param import ChatCompl
 from . import defaults as defs
+class EndpointOptionDict(TypedDict):
+    endpoint_id: str
+    model_id: str
 class EndpointSetting(BaseModel):
     id: str = Field(..., description="The id of the endpoint.")
     region: Optional[str] = Field(None, description="The region for the endpoint.")
@@ -40,7 +50,9 @@ class EndpointSetting(BaseModel):
 class ModelSetting(BaseModel):
     id: str = Field(..., description="The id of the model.")
-    endpoints: List[str] = Field(default_factory=list, description="Available endpoints for the model.")
+    endpoints: List[Union[str, EndpointOptionDict]] = Field(
+        default_factory=list, description="Available endpoints for the model."
+    )
     function_call_available: bool = Field(False, description="Indicates if function call is available.")
     response_format_available: bool = Field(False, description="Indicates if response format is available.")
     native_multimodal: bool = Field(False, description="Indicates if the model is a native multimodal model.")

{vectorvein-0.1.37.dist-info → vectorvein-0.1.39.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: vectorvein
-Version: 0.1.37
+Version: 0.1.39
 Summary: Default template for PDM package
 Author-Email: Anderson <andersonby@163.com>
 License: MIT

{vectorvein-0.1.37.dist-info → vectorvein-0.1.39.dist-info}/RECORD RENAMED Viewed

@@ -1,9 +1,9 @@
-vectorvein-0.1.37.dist-info/METADATA,sha256=a6dST0w8XT0n9IOLJsanwGQVc383RUhaJfnk_0_pWbg,502
-vectorvein-0.1.37.dist-info/WHEEL,sha256=thaaA2w1JzcGC48WYufAs8nrYZjJm8LqNfnXFOFyCC4,90
-vectorvein-0.1.37.dist-info/entry_points.txt,sha256=6OYgBcLyFCUgeqLgnvMyOJxPCWzgy7se4rLPKtNonMs,34
+vectorvein-0.1.39.dist-info/METADATA,sha256=XMrGbvJdYrzLFSSwtRa-Go4IBP6ZCzZ2dXKBiURPvFU,502
+vectorvein-0.1.39.dist-info/WHEEL,sha256=thaaA2w1JzcGC48WYufAs8nrYZjJm8LqNfnXFOFyCC4,90
+vectorvein-0.1.39.dist-info/entry_points.txt,sha256=6OYgBcLyFCUgeqLgnvMyOJxPCWzgy7se4rLPKtNonMs,34
 vectorvein/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 vectorvein/chat_clients/__init__.py,sha256=dW169oK1n3v8Z0uD8itghzlCP72rxiaS-XYn6fvI2xM,16788
-vectorvein/chat_clients/anthropic_client.py,sha256=kJWSplijhBbCvDX_VkPcMNcehJSjZ9zFjq_Ja8hAUkg,31117
+vectorvein/chat_clients/anthropic_client.py,sha256=jF9pDlnkhjM6-OLPCQQxkh27xjzbTRaEY53olRd3_aY,32413
 vectorvein/chat_clients/baichuan_client.py,sha256=CVMvpgjdrZGv0BWnTOBD-f2ufZ3wq3496wqukumsAr4,526
 vectorvein/chat_clients/base_client.py,sha256=7i456Yn-tqY0oPeIj_wHWNGGzCKPAbX5Ufxy2wWGMNY,8653
 vectorvein/chat_clients/deepseek_client.py,sha256=3qWu01NlJAP2N-Ff62d5-CZXZitlizE1fzb20LNetig,526
@@ -14,7 +14,7 @@ vectorvein/chat_clients/minimax_client.py,sha256=0MVMb4g0K_VKnPGHYX81jHiBaQUGWFG
 vectorvein/chat_clients/mistral_client.py,sha256=1aKSylzBDaLYcFnaBIL4-sXSzWmXfBeON9Q0rq-ziWw,534
 vectorvein/chat_clients/moonshot_client.py,sha256=gbu-6nGxx8uM_U2WlI4Wus881rFRotzHtMSoYOcruGU,526
 vectorvein/chat_clients/openai_client.py,sha256=Nz6tV45pWcsOupxjnsRsGTicbQNJWIZyxuJoJ5DGMpg,527
-vectorvein/chat_clients/openai_compatible_client.py,sha256=auaKGXvwOhLu9JUxFyOq--yJ5Wrpijf7o6i8FKq0_jQ,18877
+vectorvein/chat_clients/openai_compatible_client.py,sha256=FVm_ZYL9UP6t6hTUNxPyoxGYqXHJMw37UGOQ-t63gaw,19709
 vectorvein/chat_clients/py.typed,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 vectorvein/chat_clients/qwen_client.py,sha256=-ryh-m9PgsO0fc4ulcCmPTy1155J8YUy15uPoJQOHA0,513
 vectorvein/chat_clients/stepfun_client.py,sha256=zsD2W5ahmR4DD9cqQTXmJr3txrGuvxbRWhFlRdwNijI,519
@@ -27,8 +27,8 @@ vectorvein/settings/py.typed,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,
 vectorvein/types/defaults.py,sha256=xefmRNYBGbnWA5kjLLFKN91UM5gnHZ5-kcCNlQRfznk,22095
 vectorvein/types/enums.py,sha256=x_S0IJiEWijOAEiMNdiGDGEWGtmt7TwMriJVDqrDmTo,1637
 vectorvein/types/exception.py,sha256=gnW4GnJ76jND6UGnodk9xmqkcbeS7Cz2rvncA2HpD5E,69
-vectorvein/types/llm_parameters.py,sha256=uvVS3dqqvGMJoiz79LxdKjGj3YSmGD3U_yA0f7mLoTM,4903
+vectorvein/types/llm_parameters.py,sha256=ocaPlauKhiljvWZFPd0Tlfw_ndbAin48mtn_Qyr5qjs,5137
 vectorvein/types/py.typed,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 vectorvein/utilities/media_processing.py,sha256=BujciRmw1GMmc3ELRvafL8STcy6r5b2rVnh27-uA7so,2256
 vectorvein/utilities/retry.py,sha256=9ePuJdeUUGx-qMWfaFxmlOvG_lQPwCQ4UB1z3Edlo34,993
-vectorvein-0.1.37.dist-info/RECORD,,
+vectorvein-0.1.39.dist-info/RECORD,,

{vectorvein-0.1.37.dist-info → vectorvein-0.1.39.dist-info}/WHEEL RENAMED Viewed

File without changes

{vectorvein-0.1.37.dist-info → vectorvein-0.1.39.dist-info}/entry_points.txt RENAMED Viewed

File without changes

vectorvein 0.1.37__py3-none-any.whl → 0.1.39__py3-none-any.whl

vectorvein 0.1.37py3-none-any.whl → 0.1.39py3-none-any.whl