PyPI - tamar-model-client - Versions diffs - 0.1.1__py3-none-any.whl → 0.1.3__py3-none-any.whl - Mend

tamar-model-client 0.1.1py3-none-any.whl → 0.1.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (21) hide show

tamar_model_client/__init__.py +11 -0
tamar_model_client/async_client.py +414 -0
tamar_model_client/auth.py +14 -0
tamar_model_client/enums/__init__.py +8 -0
tamar_model_client/enums/channel.py +11 -0
tamar_model_client/enums/invoke.py +10 -0
tamar_model_client/enums/providers.py +8 -0
tamar_model_client/exceptions.py +11 -0
tamar_model_client/generated/__init__.py +0 -0
tamar_model_client/generated/model_service_pb2.py +45 -0
tamar_model_client/generated/model_service_pb2_grpc.py +145 -0
tamar_model_client/schemas/__init__.py +17 -0
tamar_model_client/schemas/inputs.py +294 -0
tamar_model_client/schemas/outputs.py +24 -0
tamar_model_client/sync_client.py +111 -0
{tamar_model_client-0.1.1.dist-info → tamar_model_client-0.1.3.dist-info}/METADATA +61 -90
tamar_model_client-0.1.3.dist-info/RECORD +34 -0
tamar_model_client-0.1.3.dist-info/top_level.txt +1 -0
tamar_model_client-0.1.1.dist-info/RECORD +0 -19
tamar_model_client-0.1.1.dist-info/top_level.txt +0 -1
{tamar_model_client-0.1.1.dist-info → tamar_model_client-0.1.3.dist-info}/WHEEL +0 -0

tamar_model_client/__init__.py ADDED Viewed

@@ -0,0 +1,11 @@
+from .sync_client import TamarModelClient
+from .async_client import AsyncTamarModelClient
+from .exceptions import ModelManagerClientError, ConnectionError, ValidationError
+__all__ = [
+    "TamarModelClient",
+    "AsyncTamarModelClient",
+    "ModelManagerClientError",
+    "ConnectionError",
+    "ValidationError",
+]

tamar_model_client/async_client.py ADDED Viewed

@@ -0,0 +1,414 @@
+import asyncio
+import atexit
+import base64
+import json
+import logging
+import os
+import grpc
+from typing import Optional, AsyncIterator, Union, Iterable
+from openai import NOT_GIVEN
+from pydantic import BaseModel
+from .auth import JWTAuthHandler
+from .enums import ProviderType, InvokeType
+from .exceptions import ConnectionError, ValidationError
+from .schemas import ModelRequest, ModelResponse, BatchModelRequest, BatchModelResponse
+from .generated import model_service_pb2, model_service_pb2_grpc
+from .schemas.inputs import GoogleGenAiInput, OpenAIResponsesInput, OpenAIChatCompletionsInput
+if not logging.getLogger().hasHandlers():
+    # 配置日志格式
+    logging.basicConfig(
+        level=logging.INFO,
+        format="%(asctime)s [%(levelname)s] %(message)s",
+    )
+logger = logging.getLogger(__name__)
+def is_effective_value(value) -> bool:
+    """
+    递归判断value是否是有意义的有效值
+    """
+    if value is None or value is NOT_GIVEN:
+        return False
+    if isinstance(value, str):
+        return value.strip() != ""
+    if isinstance(value, bytes):
+        return len(value) > 0
+    if isinstance(value, dict):
+        for v in value.values():
+            if is_effective_value(v):
+                return True
+        return False
+    if isinstance(value, list):
+        for item in value:
+            if is_effective_value(item):
+                return True
+        return False
+    return True  # 其他类型（int/float/bool）只要不是None就算有效
+def serialize_value(value):
+    """递归处理单个值，处理BaseModel, dict, list, bytes"""
+    if not is_effective_value(value):
+        return None
+    if isinstance(value, BaseModel):
+        return serialize_value(value.model_dump())
+    if hasattr(value, "dict") and callable(value.dict):
+        return serialize_value(value.dict())
+    if isinstance(value, dict):
+        return {k: serialize_value(v) for k, v in value.items()}
+    if isinstance(value, list) or (isinstance(value, Iterable) and not isinstance(value, (str, bytes))):
+        return [serialize_value(v) for v in value]
+    if isinstance(value, bytes):
+        return f"bytes:{base64.b64encode(value).decode('utf-8')}"
+    return value
+from typing import Any
+def remove_none_from_dict(data: Any) -> Any:
+    """
+    遍历 dict/list，递归删除 value 为 None 的字段
+    """
+    if isinstance(data, dict):
+        new_dict = {}
+        for key, value in data.items():
+            if value is None:
+                continue
+            cleaned_value = remove_none_from_dict(value)
+            new_dict[key] = cleaned_value
+        return new_dict
+    elif isinstance(data, list):
+        return [remove_none_from_dict(item) for item in data]
+    else:
+        return data
+class AsyncTamarModelClient:
+    def __init__(
+            self,
+            server_address: Optional[str] = None,
+            jwt_secret_key: Optional[str] = None,
+            jwt_token: Optional[str] = None,
+            default_payload: Optional[dict] = None,
+            token_expires_in: int = 3600,
+            max_retries: int = 3,  # 最大重试次数
+            retry_delay: float = 1.0,  # 初始重试延迟（秒）
+    ):
+        # 服务端地址
+        self.server_address = server_address or os.getenv("MODEL_MANAGER_SERVER_ADDRESS")
+        if not self.server_address:
+            raise ValueError("Server address must be provided via argument or environment variable.")
+        self.default_invoke_timeout = float(os.getenv("MODEL_MANAGER_SERVER_INVOKE_TIMEOUT", 30.0))
+        # JWT 配置
+        self.jwt_secret_key = jwt_secret_key or os.getenv("MODEL_MANAGER_SERVER_JWT_SECRET_KEY")
+        self.jwt_handler = JWTAuthHandler(self.jwt_secret_key)
+        self.jwt_token = jwt_token  # 用户传入的 Token（可选）
+        self.default_payload = default_payload
+        self.token_expires_in = token_expires_in
+        # === TLS/Authority 配置 ===
+        self.use_tls = os.getenv("MODEL_MANAGER_SERVER_GRPC_USE_TLS", "true").lower() == "true"
+        self.default_authority = os.getenv("MODEL_MANAGER_SERVER_GRPC_DEFAULT_AUTHORITY")
+        # === 重试配置 ===
+        self.max_retries = max_retries if max_retries is not None else int(
+            os.getenv("MODEL_MANAGER_SERVER_GRPC_MAX_RETRIES", 3))
+        self.retry_delay = retry_delay if retry_delay is not None else float(
+            os.getenv("MODEL_MANAGER_SERVER_GRPC_RETRY_DELAY", 1.0))
+        # === gRPC 通道相关 ===
+        self.channel: Optional[grpc.aio.Channel] = None
+        self.stub: Optional[model_service_pb2_grpc.ModelServiceStub] = None
+        self._closed = False
+        atexit.register(self._safe_sync_close)  # 注册进程退出自动关闭
+    def _build_auth_metadata(self) -> list:
+        if not self.jwt_token and self.jwt_handler:
+            self.jwt_token = self.jwt_handler.encode_token(self.default_payload, expires_in=self.token_expires_in)
+        return [("authorization", f"Bearer {self.jwt_token}")] if self.jwt_token else []
+    async def _ensure_initialized(self):
+        """初始化 gRPC 通道，支持 TLS 与重试机制"""
+        if self.channel and self.stub:
+            return
+        retry_count = 0
+        options = []
+        if self.default_authority:
+            options.append(("grpc.default_authority", self.default_authority))
+        while retry_count <= self.max_retries:
+            try:
+                if self.use_tls:
+                    credentials = grpc.ssl_channel_credentials()
+                    self.channel = grpc.aio.secure_channel(
+                        self.server_address,
+                        credentials,
+                        options=options
+                    )
+                    logger.info("🔐 Using secure gRPC channel (TLS enabled)")
+                else:
+                    self.channel = grpc.aio.insecure_channel(
+                        self.server_address,
+                        options=options
+                    )
+                    logger.info("🔓 Using insecure gRPC channel (TLS disabled)")
+                await self.channel.channel_ready()
+                self.stub = model_service_pb2_grpc.ModelServiceStub(self.channel)
+                logger.info(f"✅ gRPC channel initialized to {self.server_address}")
+                return
+            except grpc.FutureTimeoutError as e:
+                logger.warning(f"❌ gRPC channel initialization timed out: {str(e)}")
+            except grpc.RpcError as e:
+                logger.warning(f"❌ gRPC channel initialization failed: {str(e)}")
+            except Exception as e:
+                logger.warning(f"❌ Unexpected error during channel initialization: {str(e)}")
+            retry_count += 1
+            if retry_count > self.max_retries:
+                raise ConnectionError(f"❌ Failed to initialize gRPC channel after {self.max_retries} retries.")
+            # 指数退避：延迟时间 = retry_delay * (2 ^ (retry_count - 1))
+            delay = self.retry_delay * (2 ** (retry_count - 1))
+            logger.info(f"🚀 Retrying connection (attempt {retry_count}/{self.max_retries}) after {delay:.2f}s delay...")
+            await asyncio.sleep(delay)
+    async def _stream(self, model_request, metadata, invoke_timeout) -> AsyncIterator[ModelResponse]:
+        try:
+            async for response in self.stub.Invoke(model_request, metadata=metadata, timeout=invoke_timeout):
+                yield ModelResponse(
+                    content=response.content,
+                    usage=json.loads(response.usage) if response.usage else None,
+                    raw_response=json.loads(response.raw_response) if response.raw_response else None,
+                    error=response.error or None,
+                )
+        except grpc.RpcError as e:
+            raise ConnectionError(f"gRPC call failed: {str(e)}")
+        except Exception as e:
+            raise ValidationError(f"Invalid input: {str(e)}")
+    async def invoke(self, model_request: ModelRequest, timeout: Optional[float] = None) -> Union[
+        ModelResponse, AsyncIterator[ModelResponse]]:
+        """
+       通用调用模型方法。
+        Args:
+            model_request: ModelRequest 对象，包含请求参数。
+        Yields:
+            ModelResponse: 支持流式或非流式的模型响应
+        Raises:
+            ValidationError: 输入验证失败。
+            ConnectionError: 连接服务端失败。
+        """
+        await self._ensure_initialized()
+        if not self.default_payload:
+            self.default_payload = {
+                "org_id": model_request.user_context.org_id or "",
+                "user_id": model_request.user_context.user_id or ""
+            }
+        # 动态根据 provider/invoke_type 决定使用哪个 input 字段
+        try:
+            if model_request.provider == ProviderType.GOOGLE:
+                allowed_fields = GoogleGenAiInput.model_fields.keys()
+            elif model_request.provider in {ProviderType.OPENAI, ProviderType.AZURE}:
+                if model_request.invoke_type in {InvokeType.RESPONSES, InvokeType.GENERATION}:
+                    allowed_fields = OpenAIResponsesInput.model_fields.keys()
+                elif model_request.invoke_type == InvokeType.CHAT_COMPLETIONS:
+                    allowed_fields = OpenAIChatCompletionsInput.model_fields.keys()
+                else:
+                    raise ValueError(f"暂不支持的调用类型: {model_request.invoke_type}")
+            else:
+                raise ValueError(f"暂不支持的提供商: {model_request.provider}")
+            # 将 ModelRequest 转 dict，过滤只保留 base + allowed 的字段
+            model_request_dict = model_request.model_dump(exclude_unset=True)
+            grpc_request_kwargs = {}
+            for field in allowed_fields:
+                if field in model_request_dict:
+                    value = model_request_dict[field]
+                    # 跳过无效的值
+                    if not is_effective_value(value):
+                        continue
+                    # 序列化grpc不支持的类型
+                    grpc_request_kwargs[field] = serialize_value(value)
+                    # 清理 serialize后的 grpc_request_kwargs
+                    grpc_request_kwargs = remove_none_from_dict(grpc_request_kwargs)
+            request = model_service_pb2.ModelRequestItem(
+                provider=model_request.provider.value,
+                channel=model_request.channel.value,
+                invoke_type=model_request.invoke_type.value,
+                stream=model_request.stream or False,
+                org_id=model_request.user_context.org_id or "",
+                user_id=model_request.user_context.user_id or "",
+                client_type=model_request.user_context.client_type or "",
+                extra=grpc_request_kwargs
+            )
+        except Exception as e:
+            raise ValueError(f"构建请求失败: {str(e)}") from e
+        metadata = self._build_auth_metadata()
+        invoke_timeout = timeout or self.default_invoke_timeout
+        if model_request.stream:
+            return self._stream(request, metadata, invoke_timeout)
+        else:
+            async for response in self.stub.Invoke(request, metadata=metadata, timeout=invoke_timeout):
+                return ModelResponse(
+                    content=response.content,
+                    usage=json.loads(response.usage) if response.usage else None,
+                    raw_response=json.loads(response.raw_response) if response.raw_response else None,
+                    error=response.error or None,
+                    custom_id=None,
+                    request_id=response.request_id if response.request_id else None,
+                )
+    async def invoke_batch(self, batch_request_model: BatchModelRequest, timeout: Optional[float] = None) -> \
+            BatchModelResponse:
+        """
+        批量模型调用接口
+        Args:
+            batch_request_model: 多条 BatchModelRequest 输入
+            timeout: 调用超时，单位秒
+        Returns:
+            BatchModelResponse: 批量请求的结果
+        """
+        await self._ensure_initialized()
+        if not self.default_payload:
+            self.default_payload = {
+                "org_id": batch_request_model.user_context.org_id or "",
+                "user_id": batch_request_model.user_context.user_id or ""
+            }
+        metadata = self._build_auth_metadata()
+        # 构造批量请求
+        items = []
+        for model_request_item in batch_request_model.items:
+            # 动态根据 provider/invoke_type 决定使用哪个 input 字段
+            try:
+                if model_request_item.provider == ProviderType.GOOGLE:
+                    allowed_fields = GoogleGenAiInput.model_fields.keys()
+                elif model_request_item.provider in {ProviderType.OPENAI, ProviderType.AZURE}:
+                    if model_request_item.invoke_type in {InvokeType.RESPONSES, InvokeType.GENERATION}:
+                        allowed_fields = OpenAIResponsesInput.model_fields.keys()
+                    elif model_request_item.invoke_type == InvokeType.CHAT_COMPLETIONS:
+                        allowed_fields = OpenAIChatCompletionsInput.model_fields.keys()
+                    else:
+                        raise ValueError(f"暂不支持的调用类型: {model_request_item.invoke_type}")
+                else:
+                    raise ValueError(f"暂不支持的提供商: {model_request_item.provider}")
+                # 将 ModelRequest 转 dict，过滤只保留 base + allowed 的字段
+                model_request_dict = model_request_item.model_dump(exclude_unset=True)
+                grpc_request_kwargs = {}
+                for field in allowed_fields:
+                    if field in model_request_dict:
+                        value = model_request_dict[field]
+                        # 跳过无效的值
+                        if not is_effective_value(value):
+                            continue
+                        # 序列化grpc不支持的类型
+                        grpc_request_kwargs[field] = serialize_value(value)
+                        # 清理 serialize后的 grpc_request_kwargs
+                        grpc_request_kwargs = remove_none_from_dict(grpc_request_kwargs)
+                items.append(model_service_pb2.ModelRequestItem(
+                    provider=model_request_item.provider.value,
+                    channel=model_request_item.channel.value,
+                    invoke_type=model_request_item.invoke_type.value,
+                    stream=model_request_item.stream or False,
+                    custom_id=model_request_item.custom_id or "",
+                    priority=model_request_item.priority or 1,
+                    org_id=batch_request_model.user_context.org_id or "",
+                    user_id=batch_request_model.user_context.user_id or "",
+                    client_type=batch_request_model.user_context.client_type or "",
+                    extra=grpc_request_kwargs,
+                ))
+            except Exception as e:
+                raise ValueError(f"构建请求失败: {str(e)}，item={model_request_item.custom_id}") from e
+        try:
+            # 超时处理逻辑
+            invoke_timeout = timeout or self.default_invoke_timeout
+            # 调用 gRPC 接口
+            response = await self.stub.BatchInvoke(
+                model_service_pb2.ModelRequest(items=items),
+                timeout=invoke_timeout,
+                metadata=metadata
+            )
+            result = []
+            for res_item in response.items:
+                result.append(ModelResponse(
+                    content=res_item.content,
+                    usage=json.loads(res_item.usage) if res_item.usage else None,
+                    raw_response=json.loads(res_item.raw_response) if res_item.raw_response else None,
+                    error=res_item.error or None,
+                    custom_id=res_item.custom_id if res_item.custom_id else None
+                ))
+            return BatchModelResponse(
+                request_id=response.request_id if response.request_id else None,
+                responses=result
+            )
+        except grpc.RpcError as e:
+            raise ConnectionError(f"BatchInvoke failed: {str(e)}")
+    async def close(self):
+        """关闭 gRPC 通道"""
+        if self.channel and not self._closed:
+            await self.channel.close()
+            self._closed = True
+            await self.channel.close()
+            logger.info("✅ gRPC channel closed")
+    def _safe_sync_close(self):
+        """进程退出时自动关闭 channel（事件循环处理兼容）"""
+        if self.channel and not self._closed:
+            try:
+                loop = asyncio.get_event_loop()
+                if loop.is_running():
+                    loop.create_task(self.close())
+                else:
+                    loop.run_until_complete(self.close())
+            except Exception as e:
+                logger.warning(f"❌ gRPC channel close failed at exit: {e}")
+    async def __aenter__(self):
+        """支持 async with 自动初始化连接"""
+        await self._ensure_initialized()
+        return self
+    async def __aexit__(self, exc_type, exc_val, exc_tb):
+        """支持 async with 自动关闭连接"""
+        await self.close()

tamar_model_client/auth.py ADDED Viewed

@@ -0,0 +1,14 @@
+import time
+import jwt
+# JWT 处理类
+class JWTAuthHandler:
+    def __init__(self, secret_key: str):
+        self.secret_key = secret_key
+    def encode_token(self, payload: dict, expires_in: int = 3600) -> str:
+        """生成带过期时间的 JWT Token"""
+        payload = payload.copy()
+        payload["exp"] = int(time.time()) + expires_in
+        return jwt.encode(payload, self.secret_key, algorithm="HS256")

tamar_model_client/enums/__init__.py ADDED Viewed

@@ -0,0 +1,8 @@
+"""
+枚举类型定义
+"""
+from .channel import Channel
+from .invoke import InvokeType
+from .providers import ProviderType
+__all__ = ["ProviderType", "InvokeType", "Channel"]

tamar_model_client/enums/channel.py ADDED Viewed

@@ -0,0 +1,11 @@
+from enum import Enum
+class Channel(str, Enum):
+    """渠道枚举"""
+    OPENAI = "openai"
+    VERTEXAI = "vertexai"
+    AI_STUDIO = "ai-studio"
+    # 默认的
+    NORMAL = "normal"

tamar_model_client/enums/invoke.py ADDED Viewed

@@ -0,0 +1,10 @@
+from enum import Enum
+class InvokeType(str, Enum):
+    """模型调用类型枚举"""
+    RESPONSES = "responses"
+    CHAT_COMPLETIONS = "chat-completions"
+    # 默认的
+    GENERATION = "generation"

tamar_model_client/enums/providers.py ADDED Viewed

@@ -0,0 +1,8 @@
+from enum import Enum
+class ProviderType(str, Enum):
+    """模型提供商类型枚举"""
+    OPENAI = "openai"
+    GOOGLE = "google"
+    AZURE = "azure"

tamar_model_client/exceptions.py ADDED Viewed

@@ -0,0 +1,11 @@
+class ModelManagerClientError(Exception):
+    """Base exception for Model Manager Client errors"""
+    pass
+class ConnectionError(ModelManagerClientError):
+    """Raised when connection to gRPC server fails"""
+    pass
+class ValidationError(ModelManagerClientError):
+    """Raised when input validation fails"""
+    pass

tamar_model_client/generated/__init__.py ADDED Viewed

File without changes

tamar_model_client/generated/model_service_pb2.py ADDED Viewed

@@ -0,0 +1,45 @@
+# -*- coding: utf-8 -*-
+# Generated by the protocol buffer compiler.  DO NOT EDIT!
+# NO CHECKED-IN PROTOBUF GENCODE
+# source: model_service.proto
+# Protobuf Python Version: 5.29.0
+"""Generated protocol buffer code."""
+from google.protobuf import descriptor as _descriptor
+from google.protobuf import descriptor_pool as _descriptor_pool
+from google.protobuf import runtime_version as _runtime_version
+from google.protobuf import symbol_database as _symbol_database
+from google.protobuf.internal import builder as _builder
+_runtime_version.ValidateProtobufRuntimeVersion(
+    _runtime_version.Domain.PUBLIC,
+    5,
+    29,
+    0,
+    '',
+    'model_service.proto'
+)
+# @@protoc_insertion_point(imports)
+_sym_db = _symbol_database.Default()
+from google.protobuf import struct_pb2 as google_dot_protobuf_dot_struct__pb2
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x13model_service.proto\x12\rmodel_service\x1a\x1cgoogle/protobuf/struct.proto\"\x82\x02\n\x10ModelRequestItem\x12\x10\n\x08provider\x18\x01 \x01(\t\x12\x0f\n\x07\x63hannel\x18\x02 \x01(\t\x12\x13\n\x0binvoke_type\x18\x03 \x01(\t\x12\x0e\n\x06stream\x18\x04 \x01(\x08\x12\x0e\n\x06org_id\x18\x05 \x01(\t\x12\x0f\n\x07user_id\x18\x06 \x01(\t\x12\x13\n\x0b\x63lient_type\x18\x07 \x01(\t\x12\x15\n\x08priority\x18\x08 \x01(\x05H\x00\x88\x01\x01\x12\x16\n\tcustom_id\x18\t \x01(\tH\x01\x88\x01\x01\x12&\n\x05\x65xtra\x18\n \x01(\x0b\x32\x17.google.protobuf.StructB\x0b\n\t_priorityB\x0c\n\n_custom_id\">\n\x0cModelRequest\x12.\n\x05items\x18\x01 \x03(\x0b\x32\x1f.model_service.ModelRequestItem\"\xa6\x01\n\x11ModelResponseItem\x12\x0f\n\x07\x63ontent\x18\x01 \x01(\t\x12\r\n\x05usage\x18\x02 \x01(\t\x12\x14\n\x0craw_response\x18\x03 \x01(\t\x12\r\n\x05\x65rror\x18\x04 \x01(\t\x12\x16\n\tcustom_id\x18\x05 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nrequest_id\x18\x06 \x01(\tH\x01\x88\x01\x01\x42\x0c\n\n_custom_idB\r\n\x0b_request_id\"T\n\rModelResponse\x12\x12\n\nrequest_id\x18\x01 \x01(\t\x12/\n\x05items\x18\x02 \x03(\x0b\x32 .model_service.ModelResponseItem2\xa7\x01\n\x0cModelService\x12M\n\x06Invoke\x12\x1f.model_service.ModelRequestItem\x1a .model_service.ModelResponseItem0\x01\x12H\n\x0b\x42\x61tchInvoke\x12\x1b.model_service.ModelRequest\x1a\x1c.model_service.ModelResponseb\x06proto3')
+_globals = globals()
+_builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
+_builder.BuildTopDescriptorsAndMessages(DESCRIPTOR, 'model_service_pb2', _globals)
+if not _descriptor._USE_C_DESCRIPTORS:
+  DESCRIPTOR._loaded_options = None
+  _globals['_MODELREQUESTITEM']._serialized_start=69
+  _globals['_MODELREQUESTITEM']._serialized_end=327
+  _globals['_MODELREQUEST']._serialized_start=329
+  _globals['_MODELREQUEST']._serialized_end=391
+  _globals['_MODELRESPONSEITEM']._serialized_start=394
+  _globals['_MODELRESPONSEITEM']._serialized_end=560
+  _globals['_MODELRESPONSE']._serialized_start=562
+  _globals['_MODELRESPONSE']._serialized_end=646
+  _globals['_MODELSERVICE']._serialized_start=649
+  _globals['_MODELSERVICE']._serialized_end=816
+# @@protoc_insertion_point(module_scope)

tamar-model-client 0.1.1__py3-none-any.whl → 0.1.3__py3-none-any.whl

tamar-model-client 0.1.1py3-none-any.whl → 0.1.3py3-none-any.whl