PyPI - isa-model - Versions diffs - 0.3.91__py3-none-any.whl → 0.4.3__py3-none-any.whl - Mend

isa-model 0.3.91py3-none-any.whl → 0.4.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (228) hide show

isa_model/client.py +1166 -584
isa_model/core/cache/redis_cache.py +410 -0
isa_model/core/config/config_manager.py +282 -12
isa_model/core/config.py +91 -1
isa_model/core/database/__init__.py +1 -0
isa_model/core/database/direct_db_client.py +114 -0
isa_model/core/database/migration_manager.py +563 -0
isa_model/core/database/migrations.py +297 -0
isa_model/core/database/supabase_client.py +258 -0
isa_model/core/dependencies.py +316 -0
isa_model/core/discovery/__init__.py +19 -0
isa_model/core/discovery/consul_discovery.py +190 -0
isa_model/core/logging/__init__.py +54 -0
isa_model/core/logging/influx_logger.py +523 -0
isa_model/core/logging/loki_logger.py +160 -0
isa_model/core/models/__init__.py +46 -0
isa_model/core/models/config_models.py +625 -0
isa_model/core/models/deployment_billing_tracker.py +430 -0
isa_model/core/models/model_billing_tracker.py +60 -88
isa_model/core/models/model_manager.py +66 -25
isa_model/core/models/model_metadata.py +690 -0
isa_model/core/models/model_repo.py +217 -55
isa_model/core/models/model_statistics_tracker.py +234 -0
isa_model/core/models/model_storage.py +0 -1
isa_model/core/models/model_version_manager.py +959 -0
isa_model/core/models/system_models.py +857 -0
isa_model/core/pricing_manager.py +2 -249
isa_model/core/repositories/__init__.py +9 -0
isa_model/core/repositories/config_repository.py +912 -0
isa_model/core/resilience/circuit_breaker.py +366 -0
isa_model/core/security/secrets.py +358 -0
isa_model/core/services/__init__.py +2 -4
isa_model/core/services/intelligent_model_selector.py +479 -370
isa_model/core/storage/hf_storage.py +2 -2
isa_model/core/types.py +8 -0
isa_model/deployment/__init__.py +5 -48
isa_model/deployment/core/__init__.py +2 -31
isa_model/deployment/core/deployment_manager.py +1278 -368
isa_model/deployment/local/__init__.py +31 -0
isa_model/deployment/local/config.py +248 -0
isa_model/deployment/local/gpu_gateway.py +607 -0
isa_model/deployment/local/health_checker.py +428 -0
isa_model/deployment/local/provider.py +586 -0
isa_model/deployment/local/tensorrt_service.py +621 -0
isa_model/deployment/local/transformers_service.py +644 -0
isa_model/deployment/local/vllm_service.py +527 -0
isa_model/deployment/modal/__init__.py +8 -0
isa_model/deployment/modal/config.py +136 -0
isa_model/deployment/modal/deployer.py +894 -0
isa_model/deployment/modal/services/__init__.py +3 -0
isa_model/deployment/modal/services/audio/__init__.py +1 -0
isa_model/deployment/modal/services/audio/isa_audio_chatTTS_service.py +520 -0
isa_model/deployment/modal/services/audio/isa_audio_openvoice_service.py +758 -0
isa_model/deployment/modal/services/audio/isa_audio_service_v2.py +1044 -0
isa_model/deployment/modal/services/embedding/__init__.py +1 -0
isa_model/deployment/modal/services/embedding/isa_embed_rerank_service.py +296 -0
isa_model/deployment/modal/services/llm/__init__.py +1 -0
isa_model/deployment/modal/services/llm/isa_llm_service.py +424 -0
isa_model/deployment/modal/services/video/__init__.py +1 -0
isa_model/deployment/modal/services/video/isa_video_hunyuan_service.py +423 -0
isa_model/deployment/modal/services/vision/__init__.py +1 -0
isa_model/deployment/modal/services/vision/isa_vision_ocr_service.py +519 -0
isa_model/deployment/modal/services/vision/isa_vision_qwen25_service.py +709 -0
isa_model/deployment/modal/services/vision/isa_vision_table_service.py +676 -0
isa_model/deployment/modal/services/vision/isa_vision_ui_service.py +833 -0
isa_model/deployment/modal/services/vision/isa_vision_ui_service_optimized.py +660 -0
isa_model/deployment/models/org-org-acme-corp-tenant-a-service-llm-20250825-225822/tenant-a-service_modal_service.py +48 -0
isa_model/deployment/models/org-test-org-123-prefix-test-service-llm-20250825-225822/prefix-test-service_modal_service.py +48 -0
isa_model/deployment/models/test-llm-service-llm-20250825-204442/test-llm-service_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-212906/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-213009/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/storage/__init__.py +5 -0
isa_model/deployment/storage/deployment_repository.py +824 -0
isa_model/deployment/triton/__init__.py +10 -0
isa_model/deployment/triton/config.py +196 -0
isa_model/deployment/triton/configs/__init__.py +1 -0
isa_model/deployment/triton/provider.py +512 -0
isa_model/deployment/triton/scripts/__init__.py +1 -0
isa_model/deployment/triton/templates/__init__.py +1 -0
isa_model/inference/__init__.py +47 -1
isa_model/inference/ai_factory.py +179 -16
isa_model/inference/legacy_services/__init__.py +21 -0
isa_model/inference/legacy_services/model_evaluation.py +637 -0
isa_model/inference/legacy_services/model_service.py +573 -0
isa_model/inference/legacy_services/model_serving.py +717 -0
isa_model/inference/legacy_services/model_training.py +561 -0
isa_model/inference/models/__init__.py +21 -0
isa_model/inference/models/inference_config.py +551 -0
isa_model/inference/models/inference_record.py +675 -0
isa_model/inference/models/performance_models.py +714 -0
isa_model/inference/repositories/__init__.py +9 -0
isa_model/inference/repositories/inference_repository.py +828 -0
isa_model/inference/services/audio/__init__.py +21 -0
isa_model/inference/services/audio/base_realtime_service.py +225 -0
isa_model/inference/services/audio/base_stt_service.py +184 -11
isa_model/inference/services/audio/isa_tts_service.py +0 -0
isa_model/inference/services/audio/openai_realtime_service.py +320 -124
isa_model/inference/services/audio/openai_stt_service.py +53 -11
isa_model/inference/services/base_service.py +17 -1
isa_model/inference/services/custom_model_manager.py +277 -0
isa_model/inference/services/embedding/__init__.py +13 -0
isa_model/inference/services/embedding/base_embed_service.py +111 -8
isa_model/inference/services/embedding/isa_embed_service.py +305 -0
isa_model/inference/services/embedding/ollama_embed_service.py +15 -3
isa_model/inference/services/embedding/openai_embed_service.py +2 -4
isa_model/inference/services/embedding/resilient_embed_service.py +285 -0
isa_model/inference/services/embedding/tests/test_embedding.py +222 -0
isa_model/inference/services/img/__init__.py +2 -2
isa_model/inference/services/img/base_image_gen_service.py +24 -7
isa_model/inference/services/img/replicate_image_gen_service.py +84 -422
isa_model/inference/services/img/services/replicate_face_swap.py +193 -0
isa_model/inference/services/img/services/replicate_flux.py +226 -0
isa_model/inference/services/img/services/replicate_flux_kontext.py +219 -0
isa_model/inference/services/img/services/replicate_sticker_maker.py +249 -0
isa_model/inference/services/img/tests/test_img_client.py +297 -0
isa_model/inference/services/llm/__init__.py +10 -2
isa_model/inference/services/llm/base_llm_service.py +361 -26
isa_model/inference/services/llm/cerebras_llm_service.py +628 -0
isa_model/inference/services/llm/helpers/llm_adapter.py +71 -12
isa_model/inference/services/llm/helpers/llm_prompts.py +342 -0
isa_model/inference/services/llm/helpers/llm_utils.py +321 -23
isa_model/inference/services/llm/huggingface_llm_service.py +581 -0
isa_model/inference/services/llm/local_llm_service.py +747 -0
isa_model/inference/services/llm/ollama_llm_service.py +11 -3
isa_model/inference/services/llm/openai_llm_service.py +670 -56
isa_model/inference/services/llm/yyds_llm_service.py +10 -3
isa_model/inference/services/vision/__init__.py +27 -6
isa_model/inference/services/vision/base_vision_service.py +118 -185
isa_model/inference/services/vision/blip_vision_service.py +359 -0
isa_model/inference/services/vision/helpers/image_utils.py +19 -10
isa_model/inference/services/vision/isa_vision_service.py +634 -0
isa_model/inference/services/vision/openai_vision_service.py +19 -10
isa_model/inference/services/vision/tests/test_ocr_client.py +284 -0
isa_model/inference/services/vision/vgg16_vision_service.py +257 -0
isa_model/serving/api/cache_manager.py +245 -0
isa_model/serving/api/dependencies/__init__.py +1 -0
isa_model/serving/api/dependencies/auth.py +194 -0
isa_model/serving/api/dependencies/database.py +139 -0
isa_model/serving/api/error_handlers.py +284 -0
isa_model/serving/api/fastapi_server.py +240 -18
isa_model/serving/api/middleware/auth.py +317 -0
isa_model/serving/api/middleware/security.py +268 -0
isa_model/serving/api/middleware/tenant_context.py +414 -0
isa_model/serving/api/routes/analytics.py +489 -0
isa_model/serving/api/routes/config.py +645 -0
isa_model/serving/api/routes/deployment_billing.py +315 -0
isa_model/serving/api/routes/deployments.py +475 -0
isa_model/serving/api/routes/gpu_gateway.py +440 -0
isa_model/serving/api/routes/health.py +32 -12
isa_model/serving/api/routes/inference_monitoring.py +486 -0
isa_model/serving/api/routes/local_deployments.py +448 -0
isa_model/serving/api/routes/logs.py +430 -0
isa_model/serving/api/routes/settings.py +582 -0
isa_model/serving/api/routes/tenants.py +575 -0
isa_model/serving/api/routes/unified.py +992 -171
isa_model/serving/api/routes/webhooks.py +479 -0
isa_model/serving/api/startup.py +318 -0
isa_model/serving/modal_proxy_server.py +249 -0
isa_model/utils/gpu_utils.py +311 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/METADATA +76 -22
isa_model-0.4.3.dist-info/RECORD +193 -0
isa_model/deployment/cloud/__init__.py +0 -9
isa_model/deployment/cloud/modal/__init__.py +0 -10
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +0 -766
isa_model/deployment/cloud/modal/isa_vision_table_service.py +0 -532
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +0 -406
isa_model/deployment/cloud/modal/register_models.py +0 -321
isa_model/deployment/core/deployment_config.py +0 -356
isa_model/deployment/core/isa_deployment_service.py +0 -401
isa_model/deployment/gpu_int8_ds8/app/server.py +0 -66
isa_model/deployment/gpu_int8_ds8/scripts/test_client.py +0 -43
isa_model/deployment/gpu_int8_ds8/scripts/test_client_os.py +0 -35
isa_model/deployment/runtime/deployed_service.py +0 -338
isa_model/deployment/services/__init__.py +0 -9
isa_model/deployment/services/auto_deploy_vision_service.py +0 -538
isa_model/deployment/services/model_service.py +0 -332
isa_model/deployment/services/service_monitor.py +0 -356
isa_model/deployment/services/service_registry.py +0 -527
isa_model/eval/__init__.py +0 -92
isa_model/eval/benchmarks.py +0 -469
isa_model/eval/config/__init__.py +0 -10
isa_model/eval/config/evaluation_config.py +0 -108
isa_model/eval/evaluators/__init__.py +0 -18
isa_model/eval/evaluators/base_evaluator.py +0 -503
isa_model/eval/evaluators/llm_evaluator.py +0 -472
isa_model/eval/factory.py +0 -531
isa_model/eval/infrastructure/__init__.py +0 -24
isa_model/eval/infrastructure/experiment_tracker.py +0 -466
isa_model/eval/metrics.py +0 -798
isa_model/inference/adapter/unified_api.py +0 -248
isa_model/inference/services/helpers/stacked_config.py +0 -148
isa_model/inference/services/img/flux_professional_service.py +0 -603
isa_model/inference/services/img/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/others/table_transformer_service.py +0 -61
isa_model/inference/services/vision/doc_analysis_service.py +0 -640
isa_model/inference/services/vision/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/vision/ui_analysis_service.py +0 -823
isa_model/scripts/inference_tracker.py +0 -283
isa_model/scripts/mlflow_manager.py +0 -379
isa_model/scripts/model_registry.py +0 -465
isa_model/scripts/register_models.py +0 -370
isa_model/scripts/register_models_with_embeddings.py +0 -510
isa_model/scripts/start_mlflow.py +0 -95
isa_model/scripts/training_tracker.py +0 -257
isa_model/training/__init__.py +0 -74
isa_model/training/annotation/annotation_schema.py +0 -47
isa_model/training/annotation/processors/annotation_processor.py +0 -126
isa_model/training/annotation/storage/dataset_manager.py +0 -131
isa_model/training/annotation/storage/dataset_schema.py +0 -44
isa_model/training/annotation/tests/test_annotation_flow.py +0 -109
isa_model/training/annotation/tests/test_minio copy.py +0 -113
isa_model/training/annotation/tests/test_minio_upload.py +0 -43
isa_model/training/annotation/views/annotation_controller.py +0 -158
isa_model/training/cloud/__init__.py +0 -22
isa_model/training/cloud/job_orchestrator.py +0 -402
isa_model/training/cloud/runpod_trainer.py +0 -454
isa_model/training/cloud/storage_manager.py +0 -482
isa_model/training/core/__init__.py +0 -23
isa_model/training/core/config.py +0 -181
isa_model/training/core/dataset.py +0 -222
isa_model/training/core/trainer.py +0 -720
isa_model/training/core/utils.py +0 -213
isa_model/training/factory.py +0 -424
isa_model-0.3.91.dist-info/RECORD +0 -138
/isa_model/{core/storage/minio_storage.py → deployment/modal/services/audio/isa_audio_fish_service.py} +0 -0
/isa_model/deployment/{services → modal/services/vision}/simple_auto_deploy_vision_service.py +0 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/WHEEL +0 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/top_level.txt +0 -0

isa_model/deployment/local/provider.py ADDED Viewed

@@ -0,0 +1,586 @@
+"""
+Local GPU deployment provider
+Unified provider for local GPU model deployment with support for multiple backends:
+- vLLM for high-performance LLM inference
+- TensorRT-LLM for maximum optimization
+- HuggingFace Transformers for universal compatibility
+"""
+import os
+import json
+import logging
+import asyncio
+from typing import Dict, List, Optional, Any, Union
+from pathlib import Path
+from datetime import datetime
+from .config import LocalGPUConfig, LocalServiceType, LocalBackend
+from .vllm_service import VLLMService
+from .tensorrt_service import TensorRTLLMService
+from .transformers_service import TransformersService
+from .health_checker import get_health_checker, ServiceStatus
+from ...utils.gpu_utils import get_gpu_manager
+logger = logging.getLogger(__name__)
+class LocalGPUProvider:
+    """
+    Unified local GPU deployment provider.
+    This provider manages local GPU model deployments with support for:
+    - Multiple inference backends (vLLM, TensorRT-LLM, Transformers)
+    - Automatic GPU resource management
+    - Service health monitoring
+    - Performance optimization
+    Example:
+        ```python
+        from isa_model.deployment.local import LocalGPUProvider, create_vllm_config
+        # Initialize provider
+        provider = LocalGPUProvider()
+        # Create service configuration
+        config = create_vllm_config(
+            service_name="llama2-7b",
+            model_id="meta-llama/Llama-2-7b-chat-hf"
+        )
+        # Deploy service
+        result = await provider.deploy(config)
+        print(f"Service deployed: {result['service_url']}")
+        # Use the service
+        response = await provider.generate_text(
+            service_name="llama2-7b",
+            prompt="Hello, how are you?"
+        )
+        ```
+    """
+    def __init__(self, workspace_dir: str = "./local_deployments"):
+        """
+        Initialize local GPU provider.
+        Args:
+            workspace_dir: Directory for deployment artifacts and logs
+        """
+        self.workspace_dir = Path(workspace_dir)
+        self.workspace_dir.mkdir(parents=True, exist_ok=True)
+        # Component managers
+        self.gpu_manager = get_gpu_manager()
+        self.health_checker = get_health_checker()
+        # Service tracking
+        self.services: Dict[str, Any] = {}  # service_name -> service instance
+        self.configs: Dict[str, LocalGPUConfig] = {}  # service_name -> config
+        self.deployments: Dict[str, Dict[str, Any]] = {}  # deployment tracking
+        # Service registry file
+        self.registry_file = self.workspace_dir / "service_registry.json"
+        self._load_registry()
+        logger.info("Local GPU provider initialized")
+        logger.info(f"Workspace directory: {self.workspace_dir}")
+        logger.info(f"Available GPUs: {len(self.gpu_manager.gpus)}")
+    async def deploy(self, config: LocalGPUConfig) -> Dict[str, Any]:
+        """
+        Deploy a model service with the specified configuration.
+        Args:
+            config: Local GPU deployment configuration
+        Returns:
+            Deployment result with service information
+        """
+        service_name = config.service_name
+        logger.info("=" * 60)
+        logger.info(f"STARTING LOCAL DEPLOYMENT: {service_name}")
+        logger.info(f"MODEL: {config.model_id}")
+        logger.info(f"BACKEND: {config.backend.value}")
+        logger.info("=" * 60)
+        try:
+            # Check if service already exists
+            if service_name in self.services:
+                return {
+                    "success": False,
+                    "error": f"Service {service_name} already deployed",
+                    "existing_service": self.get_service_info(service_name)
+                }
+            # Validate configuration
+            validation_result = await self._validate_config(config)
+            if not validation_result["valid"]:
+                return {
+                    "success": False,
+                    "error": f"Configuration validation failed: {validation_result['error']}",
+                    "validation_details": validation_result
+                }
+            # Create service instance
+            service = await self._create_service(config)
+            if not service:
+                return {
+                    "success": False,
+                    "error": f"Failed to create service for backend: {config.backend.value}"
+                }
+            # Deploy based on backend type
+            deployment_start_time = datetime.now()
+            if config.backend == LocalBackend.VLLM:
+                deploy_result = await self._deploy_vllm_service(service, config)
+            elif config.backend == LocalBackend.TENSORRT_LLM:
+                deploy_result = await self._deploy_tensorrt_service(service, config)
+            elif config.backend == LocalBackend.TRANSFORMERS:
+                deploy_result = await self._deploy_transformers_service(service, config)
+            else:
+                return {
+                    "success": False,
+                    "error": f"Unsupported backend: {config.backend.value}"
+                }
+            if deploy_result["success"]:
+                # Register service
+                self.services[service_name] = service
+                self.configs[service_name] = config
+                # Track deployment
+                deployment_info = {
+                    "service_name": service_name,
+                    "config": config.to_dict(),
+                    "backend": config.backend.value,
+                    "deployed_at": deployment_start_time.isoformat(),
+                    "status": "deployed",
+                    **deploy_result
+                }
+                self.deployments[service_name] = deployment_info
+                # Register with health checker
+                self.health_checker.register_service(service_name, service)
+                await self.health_checker.start_monitoring(service_name)
+                # Save registry
+                self._save_registry()
+                logger.info("=" * 60)
+                logger.info("LOCAL DEPLOYMENT COMPLETED SUCCESSFULLY!")
+                logger.info("=" * 60)
+                logger.info(f"Service: {service_name}")
+                logger.info(f"Backend: {config.backend.value}")
+                return {
+                    "success": True,
+                    "service_name": service_name,
+                    "backend": config.backend.value,
+                    "deployment_info": deployment_info,
+                    **deploy_result
+                }
+            else:
+                return deploy_result
+        except Exception as e:
+            logger.error("=" * 60)
+            logger.error("LOCAL DEPLOYMENT FAILED!")
+            logger.error("=" * 60)
+            logger.error(f"Error: {e}")
+            return {
+                "success": False,
+                "error": str(e),
+                "service_name": service_name
+            }
+    async def undeploy(self, service_name: str) -> Dict[str, Any]:
+        """
+        Stop and remove a deployed service.
+        Args:
+            service_name: Name of service to undeploy
+        Returns:
+            Undeploy result
+        """
+        if service_name not in self.services:
+            return {
+                "success": False,
+                "error": f"Service {service_name} not found"
+            }
+        try:
+            logger.info(f"Undeploying service: {service_name}")
+            service = self.services[service_name]
+            # Stop monitoring
+            await self.health_checker.stop_monitoring(service_name)
+            self.health_checker.unregister_service(service_name)
+            # Stop service
+            if hasattr(service, 'stop'):
+                stop_result = await service.stop()
+            elif hasattr(service, 'unload_model'):
+                stop_result = await service.unload_model()
+            else:
+                stop_result = {"success": True}
+            # Clean up
+            if hasattr(service, 'cleanup'):
+                await service.cleanup()
+            # Remove from tracking
+            del self.services[service_name]
+            del self.configs[service_name]
+            if service_name in self.deployments:
+                del self.deployments[service_name]
+            # Save registry
+            self._save_registry()
+            logger.info(f"Service undeployed: {service_name}")
+            return {
+                "success": True,
+                "service_name": service_name,
+                "stop_result": stop_result
+            }
+        except Exception as e:
+            logger.error(f"Failed to undeploy service {service_name}: {e}")
+            return {
+                "success": False,
+                "error": str(e)
+            }
+    async def list_services(self) -> List[Dict[str, Any]]:
+        """List all deployed services"""
+        services = []
+        for service_name, service in self.services.items():
+            try:
+                config = self.configs[service_name]
+                health = await self.health_checker.check_service_health(service_name)
+                metrics = self.health_checker.get_service_metrics(service_name)
+                service_info = {
+                    "service_name": service_name,
+                    "model_id": config.model_id,
+                    "backend": config.backend.value,
+                    "service_type": config.service_type.value,
+                    "status": health.get("status", "unknown"),
+                    "healthy": health.get("healthy", False),
+                    "response_time_ms": health.get("response_time_ms"),
+                    "error_count": metrics.error_count if metrics else 0,
+                    "uptime_seconds": metrics.uptime_seconds if metrics else None,
+                    "deployed_at": self.deployments.get(service_name, {}).get("deployed_at")
+                }
+                # Add service-specific info
+                if hasattr(service, 'get_service_info'):
+                    service_info.update(service.get_service_info())
+                services.append(service_info)
+            except Exception as e:
+                logger.error(f"Error getting info for service {service_name}: {e}")
+                services.append({
+                    "service_name": service_name,
+                    "status": "error",
+                    "error": str(e)
+                })
+        return services
+    async def get_service_info(self, service_name: str) -> Optional[Dict[str, Any]]:
+        """Get detailed information about a specific service"""
+        if service_name not in self.services:
+            return None
+        try:
+            service = self.services[service_name]
+            config = self.configs[service_name]
+            health = await self.health_checker.check_service_health(service_name)
+            metrics = self.health_checker.get_service_metrics(service_name)
+            info = {
+                "service_name": service_name,
+                "config": config.to_dict(),
+                "health": health,
+                "metrics": {
+                    "status": metrics.status.value if metrics else "unknown",
+                    "last_check": metrics.last_check.isoformat() if metrics else None,
+                    "error_count": metrics.error_count if metrics else 0,
+                    "consecutive_failures": metrics.consecutive_failures if metrics else 0,
+                    "uptime_seconds": metrics.uptime_seconds if metrics else None,
+                    "last_error": metrics.last_error if metrics else None
+                } if metrics else {},
+                "deployment_info": self.deployments.get(service_name, {})
+            }
+            # Add service-specific info
+            if hasattr(service, 'get_service_info'):
+                info["service_details"] = service.get_service_info()
+            return info
+        except Exception as e:
+            logger.error(f"Error getting service info for {service_name}: {e}")
+            return {
+                "service_name": service_name,
+                "error": str(e)
+            }
+    async def generate_text(self, service_name: str, prompt: str, **kwargs) -> Dict[str, Any]:
+        """Generate text using a deployed service"""
+        if service_name not in self.services:
+            return {
+                "success": False,
+                "error": f"Service {service_name} not found"
+            }
+        try:
+            service = self.services[service_name]
+            # Check service health
+            health = await self.health_checker.check_service_health(service_name)
+            if not health.get("healthy", False):
+                return {
+                    "success": False,
+                    "error": f"Service {service_name} is not healthy: {health.get('error', 'Unknown error')}"
+                }
+            # Generate text
+            if hasattr(service, 'generate'):
+                return await service.generate(prompt, **kwargs)
+            elif hasattr(service, 'generate_text'):
+                return await service.generate_text(prompt, **kwargs)
+            else:
+                return {
+                    "success": False,
+                    "error": f"Service {service_name} does not support text generation"
+                }
+        except Exception as e:
+            logger.error(f"Text generation failed for service {service_name}: {e}")
+            return {
+                "success": False,
+                "error": str(e)
+            }
+    async def chat_completion(self, service_name: str, messages: List[Dict[str, str]], **kwargs) -> Dict[str, Any]:
+        """Generate chat completion using a deployed service"""
+        if service_name not in self.services:
+            return {
+                "success": False,
+                "error": f"Service {service_name} not found"
+            }
+        try:
+            service = self.services[service_name]
+            # Check service health
+            health = await self.health_checker.check_service_health(service_name)
+            if not health.get("healthy", False):
+                return {
+                    "success": False,
+                    "error": f"Service {service_name} is not healthy"
+                }
+            # Generate chat completion
+            if hasattr(service, 'chat_completions'):
+                return await service.chat_completions(messages, **kwargs)
+            elif hasattr(service, 'chat_completion'):
+                return await service.chat_completion(messages, **kwargs)
+            else:
+                return {
+                    "success": False,
+                    "error": f"Service {service_name} does not support chat completion"
+                }
+        except Exception as e:
+            logger.error(f"Chat completion failed for service {service_name}: {e}")
+            return {
+                "success": False,
+                "error": str(e)
+            }
+    async def get_system_status(self) -> Dict[str, Any]:
+        """Get overall system status"""
+        system_health = self.health_checker.get_system_health()
+        return {
+            **system_health,
+            "provider": "local_gpu",
+            "workspace_dir": str(self.workspace_dir),
+            "total_deployments": len(self.services),
+            "available_backends": [backend.value for backend in LocalBackend],
+            "gpu_status": {
+                "cuda_available": self.gpu_manager.cuda_available,
+                "nvidia_smi_available": self.gpu_manager.nvidia_smi_available,
+                "gpu_count": len(self.gpu_manager.gpus)
+            }
+        }
+    async def _validate_config(self, config: LocalGPUConfig) -> Dict[str, Any]:
+        """Validate deployment configuration"""
+        try:
+            # Check GPU requirements
+            compatibility = self.gpu_manager.check_gpu_compatibility(
+                config.model_id,
+                config.model_precision
+            )
+            if not compatibility[0]:
+                return {
+                    "valid": False,
+                    "error": f"GPU compatibility check failed: {', '.join(compatibility[1])}"
+                }
+            # Check backend availability
+            backend_available = await self._check_backend_availability(config.backend)
+            if not backend_available["available"]:
+                return {
+                    "valid": False,
+                    "error": f"Backend {config.backend.value} not available: {backend_available['error']}"
+                }
+            # Check port availability
+            if config.backend == LocalBackend.VLLM:
+                port_available = await self._check_port_available(config.port)
+                if not port_available:
+                    return {
+                        "valid": False,
+                        "error": f"Port {config.port} is not available"
+                    }
+            return {
+                "valid": True,
+                "gpu_compatibility": compatibility,
+                "backend_check": backend_available
+            }
+        except Exception as e:
+            return {
+                "valid": False,
+                "error": str(e)
+            }
+    async def _check_backend_availability(self, backend: LocalBackend) -> Dict[str, Any]:
+        """Check if a backend is available"""
+        try:
+            if backend == LocalBackend.VLLM:
+                try:
+                    import vllm
+                    return {"available": True}
+                except ImportError:
+                    return {"available": False, "error": "vLLM not installed"}
+            elif backend == LocalBackend.TENSORRT_LLM:
+                try:
+                    import tensorrt_llm
+                    return {"available": True}
+                except ImportError:
+                    return {"available": False, "error": "TensorRT-LLM not installed"}
+            elif backend == LocalBackend.TRANSFORMERS:
+                try:
+                    import transformers
+                    return {"available": True}
+                except ImportError:
+                    return {"available": False, "error": "Transformers not installed"}
+            else:
+                return {"available": False, "error": f"Unknown backend: {backend.value}"}
+        except Exception as e:
+            return {"available": False, "error": str(e)}
+    async def _check_port_available(self, port: int) -> bool:
+        """Check if a port is available"""
+        try:
+            import socket
+            with socket.socket(socket.AF_INET, socket.SOCK_STREAM) as s:
+                result = s.connect_ex(('127.0.0.1', port))
+                return result != 0  # Port is available if connection fails
+        except:
+            return False
+    async def _create_service(self, config: LocalGPUConfig) -> Optional[Any]:
+        """Create service instance based on backend"""
+        try:
+            if config.backend == LocalBackend.VLLM:
+                return VLLMService(config)
+            elif config.backend == LocalBackend.TENSORRT_LLM:
+                return TensorRTLLMService(config)
+            elif config.backend == LocalBackend.TRANSFORMERS:
+                return TransformersService(config)
+            else:
+                logger.error(f"Unsupported backend: {config.backend.value}")
+                return None
+        except Exception as e:
+            logger.error(f"Failed to create service: {e}")
+            return None
+    async def _deploy_vllm_service(self, service: VLLMService, config: LocalGPUConfig) -> Dict[str, Any]:
+        """Deploy vLLM service"""
+        result = await service.start()
+        if result["success"]:
+            return {
+                **result,
+                "service_url": f"http://{config.host}:{config.port}",
+                "api_base": f"http://{config.host}:{config.port}/v1"
+            }
+        return result
+    async def _deploy_tensorrt_service(self, service: TensorRTLLMService, config: LocalGPUConfig) -> Dict[str, Any]:
+        """Deploy TensorRT-LLM service"""
+        # Build engine first
+        build_result = await service.build_engine()
+        if not build_result["success"]:
+            return build_result
+        # Load model
+        load_result = await service.load_model()
+        return load_result
+    async def _deploy_transformers_service(self, service: TransformersService, config: LocalGPUConfig) -> Dict[str, Any]:
+        """Deploy Transformers service"""
+        return await service.load_model()
+    def _load_registry(self):
+        """Load service registry from file"""
+        if self.registry_file.exists():
+            try:
+                with open(self.registry_file, 'r') as f:
+                    registry_data = json.load(f)
+                # Note: We don't automatically reload services on startup
+                # This would require more complex state management
+                logger.info(f"Service registry loaded: {len(registry_data)} entries")
+            except Exception as e:
+                logger.warning(f"Failed to load service registry: {e}")
+    def _save_registry(self):
+        """Save service registry to file"""
+        try:
+            registry_data = {}
+            for service_name, deployment in self.deployments.items():
+                registry_data[service_name] = {
+                    "config": deployment["config"],
+                    "deployed_at": deployment["deployed_at"],
+                    "backend": deployment["backend"]
+                }
+            with open(self.registry_file, 'w') as f:
+                json.dump(registry_data, f, indent=2)
+        except Exception as e:
+            logger.error(f"Failed to save service registry: {e}")

isa-model 0.3.91__py3-none-any.whl → 0.4.3__py3-none-any.whl

isa-model 0.3.91py3-none-any.whl → 0.4.3py3-none-any.whl