PyPI - isa-model - Versions diffs - 0.4.0__py3-none-any.whl → 0.4.3__py3-none-any.whl - Mend

isa-model 0.4.0py3-none-any.whl → 0.4.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (199) hide show

isa_model/client.py +466 -43
isa_model/core/cache/redis_cache.py +12 -3
isa_model/core/config/config_manager.py +230 -3
isa_model/core/config.py +90 -0
isa_model/core/database/direct_db_client.py +114 -0
isa_model/core/database/migration_manager.py +563 -0
isa_model/core/database/migrations.py +21 -1
isa_model/core/database/supabase_client.py +154 -19
isa_model/core/dependencies.py +316 -0
isa_model/core/discovery/__init__.py +19 -0
isa_model/core/discovery/consul_discovery.py +190 -0
isa_model/core/logging/__init__.py +54 -0
isa_model/core/logging/influx_logger.py +523 -0
isa_model/core/logging/loki_logger.py +160 -0
isa_model/core/models/__init__.py +27 -18
isa_model/core/models/config_models.py +625 -0
isa_model/core/models/deployment_billing_tracker.py +430 -0
isa_model/core/models/model_manager.py +40 -17
isa_model/core/models/model_metadata.py +690 -0
isa_model/core/models/model_repo.py +174 -18
isa_model/core/models/system_models.py +857 -0
isa_model/core/repositories/__init__.py +9 -0
isa_model/core/repositories/config_repository.py +912 -0
isa_model/core/services/intelligent_model_selector.py +399 -21
isa_model/core/storage/hf_storage.py +1 -1
isa_model/core/types.py +1 -0
isa_model/deployment/__init__.py +5 -48
isa_model/deployment/core/__init__.py +2 -31
isa_model/deployment/core/deployment_manager.py +1278 -370
isa_model/deployment/local/__init__.py +31 -0
isa_model/deployment/local/config.py +248 -0
isa_model/deployment/local/gpu_gateway.py +607 -0
isa_model/deployment/local/health_checker.py +428 -0
isa_model/deployment/local/provider.py +586 -0
isa_model/deployment/local/tensorrt_service.py +621 -0
isa_model/deployment/local/transformers_service.py +644 -0
isa_model/deployment/local/vllm_service.py +527 -0
isa_model/deployment/modal/__init__.py +8 -0
isa_model/deployment/modal/config.py +136 -0
isa_model/deployment/{services/auto_hf_modal_deployer.py → modal/deployer.py} +1 -1
isa_model/deployment/modal/services/__init__.py +3 -0
isa_model/deployment/modal/services/audio/__init__.py +1 -0
isa_model/deployment/modal/services/embedding/__init__.py +1 -0
isa_model/deployment/modal/services/llm/__init__.py +1 -0
isa_model/deployment/modal/services/llm/isa_llm_service.py +424 -0
isa_model/deployment/modal/services/video/__init__.py +1 -0
isa_model/deployment/modal/services/vision/__init__.py +1 -0
isa_model/deployment/models/org-org-acme-corp-tenant-a-service-llm-20250825-225822/tenant-a-service_modal_service.py +48 -0
isa_model/deployment/models/org-test-org-123-prefix-test-service-llm-20250825-225822/prefix-test-service_modal_service.py +48 -0
isa_model/deployment/models/test-llm-service-llm-20250825-204442/test-llm-service_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-212906/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-213009/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/storage/__init__.py +5 -0
isa_model/deployment/storage/deployment_repository.py +824 -0
isa_model/deployment/triton/__init__.py +10 -0
isa_model/deployment/triton/config.py +196 -0
isa_model/deployment/triton/configs/__init__.py +1 -0
isa_model/deployment/triton/provider.py +512 -0
isa_model/deployment/triton/scripts/__init__.py +1 -0
isa_model/deployment/triton/templates/__init__.py +1 -0
isa_model/inference/__init__.py +47 -1
isa_model/inference/ai_factory.py +137 -10
isa_model/inference/legacy_services/__init__.py +21 -0
isa_model/inference/legacy_services/model_evaluation.py +637 -0
isa_model/inference/legacy_services/model_service.py +573 -0
isa_model/inference/legacy_services/model_serving.py +717 -0
isa_model/inference/legacy_services/model_training.py +561 -0
isa_model/inference/models/__init__.py +21 -0
isa_model/inference/models/inference_config.py +551 -0
isa_model/inference/models/inference_record.py +675 -0
isa_model/inference/models/performance_models.py +714 -0
isa_model/inference/repositories/__init__.py +9 -0
isa_model/inference/repositories/inference_repository.py +828 -0
isa_model/inference/services/audio/base_stt_service.py +184 -11
isa_model/inference/services/audio/openai_stt_service.py +22 -6
isa_model/inference/services/custom_model_manager.py +277 -0
isa_model/inference/services/embedding/ollama_embed_service.py +15 -3
isa_model/inference/services/embedding/resilient_embed_service.py +285 -0
isa_model/inference/services/llm/__init__.py +10 -2
isa_model/inference/services/llm/base_llm_service.py +335 -24
isa_model/inference/services/llm/cerebras_llm_service.py +628 -0
isa_model/inference/services/llm/helpers/llm_adapter.py +9 -4
isa_model/inference/services/llm/helpers/llm_prompts.py +342 -0
isa_model/inference/services/llm/helpers/llm_utils.py +321 -23
isa_model/inference/services/llm/huggingface_llm_service.py +581 -0
isa_model/inference/services/llm/local_llm_service.py +747 -0
isa_model/inference/services/llm/ollama_llm_service.py +9 -2
isa_model/inference/services/llm/openai_llm_service.py +33 -16
isa_model/inference/services/llm/yyds_llm_service.py +8 -2
isa_model/inference/services/vision/__init__.py +22 -1
isa_model/inference/services/vision/blip_vision_service.py +359 -0
isa_model/inference/services/vision/helpers/image_utils.py +8 -5
isa_model/inference/services/vision/isa_vision_service.py +65 -4
isa_model/inference/services/vision/openai_vision_service.py +19 -10
isa_model/inference/services/vision/vgg16_vision_service.py +257 -0
isa_model/serving/api/cache_manager.py +245 -0
isa_model/serving/api/dependencies/__init__.py +1 -0
isa_model/serving/api/dependencies/auth.py +194 -0
isa_model/serving/api/dependencies/database.py +139 -0
isa_model/serving/api/error_handlers.py +284 -0
isa_model/serving/api/fastapi_server.py +172 -22
isa_model/serving/api/middleware/auth.py +8 -2
isa_model/serving/api/middleware/security.py +23 -33
isa_model/serving/api/middleware/tenant_context.py +414 -0
isa_model/serving/api/routes/analytics.py +4 -1
isa_model/serving/api/routes/config.py +645 -0
isa_model/serving/api/routes/deployment_billing.py +315 -0
isa_model/serving/api/routes/deployments.py +138 -2
isa_model/serving/api/routes/gpu_gateway.py +440 -0
isa_model/serving/api/routes/health.py +32 -12
isa_model/serving/api/routes/inference_monitoring.py +486 -0
isa_model/serving/api/routes/local_deployments.py +448 -0
isa_model/serving/api/routes/tenants.py +575 -0
isa_model/serving/api/routes/unified.py +680 -18
isa_model/serving/api/routes/webhooks.py +479 -0
isa_model/serving/api/startup.py +68 -54
isa_model/utils/gpu_utils.py +311 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.3.dist-info}/METADATA +66 -24
isa_model-0.4.3.dist-info/RECORD +193 -0
isa_model/core/storage/minio_storage.py +0 -0
isa_model/deployment/cloud/__init__.py +0 -9
isa_model/deployment/cloud/modal/__init__.py +0 -10
isa_model/deployment/core/deployment_config.py +0 -356
isa_model/deployment/core/isa_deployment_service.py +0 -401
isa_model/deployment/gpu_int8_ds8/app/server.py +0 -66
isa_model/deployment/gpu_int8_ds8/scripts/test_client.py +0 -43
isa_model/deployment/gpu_int8_ds8/scripts/test_client_os.py +0 -35
isa_model/deployment/runtime/deployed_service.py +0 -338
isa_model/deployment/services/__init__.py +0 -9
isa_model/deployment/services/auto_deploy_vision_service.py +0 -538
isa_model/deployment/services/model_service.py +0 -332
isa_model/deployment/services/service_monitor.py +0 -356
isa_model/deployment/services/service_registry.py +0 -527
isa_model/eval/__init__.py +0 -92
isa_model/eval/benchmarks/__init__.py +0 -27
isa_model/eval/benchmarks/multimodal_datasets.py +0 -460
isa_model/eval/benchmarks.py +0 -701
isa_model/eval/config/__init__.py +0 -10
isa_model/eval/config/evaluation_config.py +0 -108
isa_model/eval/evaluators/__init__.py +0 -24
isa_model/eval/evaluators/audio_evaluator.py +0 -727
isa_model/eval/evaluators/base_evaluator.py +0 -503
isa_model/eval/evaluators/embedding_evaluator.py +0 -742
isa_model/eval/evaluators/llm_evaluator.py +0 -472
isa_model/eval/evaluators/vision_evaluator.py +0 -564
isa_model/eval/example_evaluation.py +0 -395
isa_model/eval/factory.py +0 -798
isa_model/eval/infrastructure/__init__.py +0 -24
isa_model/eval/infrastructure/experiment_tracker.py +0 -466
isa_model/eval/isa_benchmarks.py +0 -700
isa_model/eval/isa_integration.py +0 -582
isa_model/eval/metrics.py +0 -951
isa_model/eval/tests/unit/test_basic.py +0 -396
isa_model/serving/api/routes/evaluations.py +0 -579
isa_model/training/__init__.py +0 -168
isa_model/training/annotation/annotation_schema.py +0 -47
isa_model/training/annotation/processors/annotation_processor.py +0 -126
isa_model/training/annotation/storage/dataset_manager.py +0 -131
isa_model/training/annotation/storage/dataset_schema.py +0 -44
isa_model/training/annotation/tests/test_annotation_flow.py +0 -109
isa_model/training/annotation/tests/test_minio copy.py +0 -113
isa_model/training/annotation/tests/test_minio_upload.py +0 -43
isa_model/training/annotation/views/annotation_controller.py +0 -158
isa_model/training/cloud/__init__.py +0 -22
isa_model/training/cloud/job_orchestrator.py +0 -402
isa_model/training/cloud/runpod_trainer.py +0 -454
isa_model/training/cloud/storage_manager.py +0 -482
isa_model/training/core/__init__.py +0 -26
isa_model/training/core/config.py +0 -181
isa_model/training/core/dataset.py +0 -222
isa_model/training/core/trainer.py +0 -720
isa_model/training/core/utils.py +0 -213
isa_model/training/examples/intelligent_training_example.py +0 -281
isa_model/training/factory.py +0 -424
isa_model/training/intelligent/__init__.py +0 -25
isa_model/training/intelligent/decision_engine.py +0 -643
isa_model/training/intelligent/intelligent_factory.py +0 -888
isa_model/training/intelligent/knowledge_base.py +0 -751
isa_model/training/intelligent/resource_optimizer.py +0 -839
isa_model/training/intelligent/task_classifier.py +0 -576
isa_model/training/storage/__init__.py +0 -24
isa_model/training/storage/core_integration.py +0 -439
isa_model/training/storage/training_repository.py +0 -552
isa_model/training/storage/training_storage.py +0 -628
isa_model-0.4.0.dist-info/RECORD +0 -182
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_chatTTS_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_fish_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_openvoice_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_service_v2.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/embedding}/isa_embed_rerank_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/video}/isa_video_hunyuan_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ocr_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_qwen25_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_table_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ui_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ui_service_optimized.py +0 -0
/isa_model/deployment/{services → modal/services/vision}/simple_auto_deploy_vision_service.py +0 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.3.dist-info}/WHEEL +0 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.3.dist-info}/top_level.txt +0 -0

isa_model/serving/api/startup.py CHANGED Viewed

@@ -12,11 +12,9 @@ import logging
 import asyncio
 from typing import Dict, Any
 import json
-import psycopg2
 import os
 from ...core.config.config_manager import ConfigManager
-from ...core.database.migrations import run_environment_migrations
 from ...core.models.model_repo import ModelRegistry
 from ...core.types import ModelType, ModelCapability
@@ -27,67 +25,59 @@ class StartupInitializer:
     def __init__(self):
         self.config_manager = ConfigManager()
+        self._embedding_service = None
+        self._model_registry = None
     async def initialize_system(self):
         """Run complete system initialization"""
-        logger.info("🚀 Starting ISA Model system initialization...")
+        print("🚀 Starting ISA Model system initialization...")
         try:
-            # 1. Run database migrations
-            await self._run_migrations()
-            # 2. Populate model registry
+            # 1. Populate model registry
             await self._populate_models()
-            # 3. Generate embeddings
+            # 2. Generate embeddings
             await self._generate_embeddings()
-            # 4. Validate system
+            # 3. Validate system
             await self._validate_system()
-            logger.info("✅ System initialization completed successfully!")
+            print("✅ System initialization completed successfully!")
         except Exception as e:
             logger.error(f"❌ System initialization failed: {e}")
             raise
-    async def _run_migrations(self):
-        """Run database migrations"""
-        logger.info("📋 Running database migrations...")
-        try:
-            success = run_environment_migrations()
-            if success:
-                logger.info("✅ Database migrations completed")
-            else:
-                raise Exception("Database migrations failed")
-        except Exception as e:
-            logger.error(f"❌ Migration error: {e}")
-            raise
     async def _populate_models(self):
         """Populate model registry with all configured models"""
-        logger.info("📚 Populating model registry...")
+        print("📚 Populating model registry...")
         try:
             registry = ModelRegistry()
+            self._model_registry = registry  # Track for cleanup
+            # Check if models are already populated to avoid unnecessary database operations
+            try:
+                stats = registry.get_stats()
+                if stats and stats.get('total_models', 0) > 0:
+                    print(f"✅ Model registry already populated: {stats['total_models']} models")
+                    return
+            except Exception as e:
+                print(f"⚠️ Could not check existing models, proceeding with population: {e}")
             # Get all configured models
             all_models = self.config_manager.model_definitions
             if not all_models:
-                logger.warning("⚠️ No models configured in providers")
+                print("⚠️ No models configured in providers")
                 return
             registered_count = 0
             for model_id, model_data in all_models.items():
                 try:
-                    # Check if already registered
-                    existing = registry.get_model_info(model_id)
-                    if existing:
-                        logger.debug(f"Model {model_id} already registered, skipping")
-                        continue
+                    # Skip individual model check to avoid multiple database queries
+                    # We already checked if any models exist above
                     # Map model type
                     model_type_str = model_data.get('type', 'llm')
@@ -110,7 +100,6 @@ class StartupInitializer:
                     if success:
                         registered_count += 1
-                        logger.debug(f"Registered {model_id} ({provider})")
                     else:
                         logger.warning(f"Failed to register {model_id}")
@@ -118,7 +107,7 @@ class StartupInitializer:
                     logger.error(f"Error registering {model_id}: {e}")
                     continue
-            logger.info(f"✅ Model registry populated: {registered_count}/{len(all_models)} models")
+            print(f"✅ Model registry populated: {registered_count}/{len(all_models)} models")
         except Exception as e:
             logger.error(f"❌ Model population error: {e}")
@@ -126,16 +115,17 @@ class StartupInitializer:
     async def _generate_embeddings(self):
         """Generate embeddings for all registered models using OpenAI embedding service"""
-        logger.info("🧠 Generating model embeddings with OpenAI embedding service...")
+        print("🧠 Generating model embeddings...")
         try:
             # Initialize embedding service
             from ...inference.ai_factory import AIFactory
             factory = AIFactory.get_instance()
             embedding_service = factory.get_embed("text-embedding-3-small", "openai")
+            self._embedding_service = embedding_service  # Track for cleanup
             if not embedding_service:
-                logger.warning("⚠️ Could not initialize embedding service, skipping embedding generation")
+                print("⚠️ Could not initialize embedding service, skipping embedding generation")
                 return
             # Get all registered models
@@ -143,7 +133,7 @@ class StartupInitializer:
             models = registry.list_models()
             if not models:
-                logger.warning("⚠️ No models found in registry")
+                print("⚠️ No models found in registry")
                 return
             # Check existing embeddings using Supabase client
@@ -151,15 +141,12 @@ class StartupInitializer:
             existing_result = supabase_client.table("model_embeddings").select("model_id").execute()
             existing_embeddings = {row['model_id'] for row in existing_result.data}
-            logger.info(f"Found {len(existing_embeddings)} existing embeddings")
             processed = 0
             for model_id, model_data in models.items():
                 try:
                     # Skip if embedding already exists
                     if model_id in existing_embeddings:
-                        logger.debug(f"Embedding already exists for {model_id}, skipping")
                         continue
                     provider = model_data.get('provider', 'unknown')
@@ -178,7 +165,6 @@ class StartupInitializer:
                         search_text += f"Specialized for: {', '.join(specialized_tasks)}"
                     # Generate embedding using OpenAI service
-                    logger.debug(f"Generating embedding for {model_id}...")
                     embedding = await embedding_service.create_text_embedding(search_text)
                     # Store embedding in database
@@ -193,7 +179,6 @@ class StartupInitializer:
                     if result.data:
                         processed += 1
-                        logger.debug(f"Stored embedding for {model_id}")
                     else:
                         logger.warning(f"Failed to store embedding for {model_id}")
@@ -201,7 +186,7 @@ class StartupInitializer:
                     logger.error(f"Error creating embedding for {model_id}: {e}")
                     continue
-            logger.info(f"✅ Generated {processed}/{len(models)} new embeddings")
+            print(f"✅ Generated {processed}/{len(models)} new embeddings")
             # Close embedding service
             await embedding_service.close()
@@ -212,16 +197,16 @@ class StartupInitializer:
     async def _validate_system(self):
         """Validate system is working correctly"""
-        logger.info("🔍 Validating system...")
+        print("🔍 Validating system...")
         try:
             registry = ModelRegistry()
             stats = registry.get_stats()
-            logger.info(f"📊 System validation results:")
-            logger.info(f"   Models: {stats['total_models']}")
-            logger.info(f"   By type: {stats['models_by_type']}")
-            logger.info(f"   By capability: {stats['models_by_capability']}")
+            print(f"📊 System validation results:")
+            print(f"   Models: {stats['total_models']}")
+            print(f"   By type: {stats['models_by_type']}")
+            print(f"   By capability: {stats['models_by_capability']}")
             if stats['total_models'] == 0:
                 raise Exception("No models found in registry")
@@ -233,12 +218,12 @@ class StartupInitializer:
                 # Test basic functionality
                 available_models = await selector.get_available_models()
-                logger.info(f"   Available models for selection: {len(available_models)}")
+                print(f"   Available models for selection: {len(available_models)}")
             except Exception as e:
                 logger.warning(f"⚠️ Intelligent selector initialization failed: {e}")
-            logger.info("✅ System validation completed")
+            print("✅ System validation completed")
         except Exception as e:
             logger.error(f"❌ System validation error: {e}")
@@ -294,6 +279,35 @@ class StartupInitializer:
         return result
+    async def cleanup(self):
+        """Clean up startup resources"""
+        logger.info("🧹 Starting startup initializer cleanup...")
+        try:
+            # Clean up any persistent connections or resources
+            # Most cleanup is handled by individual services, but we can do some general cleanup here
+            # If we have any cached embedding services, clean them up
+            if hasattr(self, '_embedding_service') and self._embedding_service:
+                try:
+                    await self._embedding_service.close()
+                    logger.info("✅ Embedding service closed")
+                except Exception as e:
+                    logger.error(f"❌ Error closing embedding service: {e}")
+            # Clean up model registry connections if needed
+            if hasattr(self, '_model_registry'):
+                try:
+                    # ModelRegistry doesn't need explicit cleanup currently
+                    # but this is where we'd add it if needed
+                    pass
+                except Exception as e:
+                    logger.error(f"❌ Error cleaning up model registry: {e}")
+            logger.info("✅ Startup initializer cleanup completed")
+        except Exception as e:
+            logger.error(f"❌ Error during startup cleanup: {e}")
 # Global initializer instance

isa_model/utils/gpu_utils.py ADDED Viewed

@@ -0,0 +1,311 @@
+"""
+GPU detection and resource management utilities
+Provides functions for detecting and managing local GPU resources.
+"""
+import os
+import logging
+import subprocess
+from typing import Dict, List, Optional, Any, Tuple
+from dataclasses import dataclass
+import platform
+logger = logging.getLogger(__name__)
+@dataclass
+class GPUInfo:
+    """GPU information structure"""
+    gpu_id: int
+    name: str
+    memory_total: int  # MB
+    memory_free: int   # MB
+    memory_used: int   # MB
+    utilization: float  # %
+    temperature: Optional[int] = None  # Celsius
+    power_draw: Optional[float] = None  # Watts
+    driver_version: Optional[str] = None
+    cuda_version: Optional[str] = None
+class GPUManager:
+    """Local GPU resource manager"""
+    def __init__(self):
+        self.gpus: List[GPUInfo] = []
+        self.cuda_available = False
+        self.nvidia_smi_available = False
+        self._initialize()
+    def _initialize(self):
+        """Initialize GPU detection"""
+        self.cuda_available = self._check_cuda_availability()
+        self.nvidia_smi_available = self._check_nvidia_smi()
+        if self.nvidia_smi_available:
+            self.gpus = self._detect_nvidia_gpus()
+        elif self.cuda_available:
+            self.gpus = self._detect_cuda_gpus_fallback()
+        else:
+            logger.warning("No CUDA-capable GPUs detected")
+    def _check_cuda_availability(self) -> bool:
+        """Check if CUDA is available through PyTorch"""
+        try:
+            import torch
+            available = torch.cuda.is_available()
+            if available:
+                logger.info(f"CUDA detected: {torch.cuda.device_count()} devices")
+                logger.info(f"CUDA version: {torch.version.cuda}")
+            return available
+        except ImportError:
+            logger.warning("PyTorch not available for CUDA detection")
+            return False
+        except Exception as e:
+            logger.warning(f"CUDA detection failed: {e}")
+            return False
+    def _check_nvidia_smi(self) -> bool:
+        """Check if nvidia-smi is available"""
+        try:
+            result = subprocess.run(['nvidia-smi', '--version'],
+                                  capture_output=True, text=True, timeout=5)
+            return result.returncode == 0
+        except (subprocess.TimeoutExpired, FileNotFoundError, subprocess.SubprocessError):
+            return False
+    def _detect_nvidia_gpus(self) -> List[GPUInfo]:
+        """Detect GPUs using nvidia-smi"""
+        gpus = []
+        try:
+            # Get GPU information using nvidia-smi
+            cmd = [
+                'nvidia-smi',
+                '--query-gpu=index,name,memory.total,memory.free,memory.used,utilization.gpu,temperature.gpu,power.draw,driver_version',
+                '--format=csv,noheader,nounits'
+            ]
+            result = subprocess.run(cmd, capture_output=True, text=True, timeout=10)
+            if result.returncode == 0:
+                lines = result.stdout.strip().split('\n')
+                for line in lines:
+                    if line.strip():
+                        parts = [p.strip() for p in line.split(',')]
+                        if len(parts) >= 7:
+                            gpu_info = GPUInfo(
+                                gpu_id=int(parts[0]),
+                                name=parts[1],
+                                memory_total=int(parts[2]),
+                                memory_free=int(parts[3]),
+                                memory_used=int(parts[4]),
+                                utilization=float(parts[5]),
+                                temperature=int(parts[6]) if parts[6] != '[Not Supported]' else None,
+                                power_draw=float(parts[7]) if len(parts) > 7 and parts[7] != '[Not Supported]' else None,
+                                driver_version=parts[8] if len(parts) > 8 else None
+                            )
+                            gpus.append(gpu_info)
+            # Get CUDA version
+            try:
+                cuda_result = subprocess.run(['nvcc', '--version'],
+                                           capture_output=True, text=True, timeout=5)
+                if cuda_result.returncode == 0:
+                    for line in cuda_result.stdout.split('\n'):
+                        if 'release' in line.lower():
+                            cuda_version = line.split()[-1].rstrip(',')
+                            for gpu in gpus:
+                                gpu.cuda_version = cuda_version
+                            break
+            except (subprocess.TimeoutExpired, FileNotFoundError):
+                pass
+        except Exception as e:
+            logger.error(f"Failed to detect GPUs with nvidia-smi: {e}")
+        return gpus
+    def _detect_cuda_gpus_fallback(self) -> List[GPUInfo]:
+        """Fallback GPU detection using PyTorch"""
+        gpus = []
+        try:
+            import torch
+            if torch.cuda.is_available():
+                for i in range(torch.cuda.device_count()):
+                    props = torch.cuda.get_device_properties(i)
+                    # Get memory info
+                    torch.cuda.set_device(i)
+                    memory_total = torch.cuda.get_device_properties(i).total_memory // (1024**2)  # MB
+                    memory_free = (torch.cuda.get_device_properties(i).total_memory - torch.cuda.memory_allocated(i)) // (1024**2)
+                    memory_used = torch.cuda.memory_allocated(i) // (1024**2)
+                    gpu_info = GPUInfo(
+                        gpu_id=i,
+                        name=props.name,
+                        memory_total=memory_total,
+                        memory_free=memory_free,
+                        memory_used=memory_used,
+                        utilization=0.0,  # Cannot get utilization without nvidia-smi
+                        cuda_version=torch.version.cuda
+                    )
+                    gpus.append(gpu_info)
+        except Exception as e:
+            logger.error(f"Failed to detect GPUs with PyTorch: {e}")
+        return gpus
+    def get_gpu_info(self, gpu_id: Optional[int] = None) -> Optional[GPUInfo]:
+        """Get information for a specific GPU or best available GPU"""
+        if not self.gpus:
+            return None
+        if gpu_id is not None:
+            for gpu in self.gpus:
+                if gpu.gpu_id == gpu_id:
+                    return gpu
+            return None
+        # Return GPU with most free memory
+        return max(self.gpus, key=lambda x: x.memory_free)
+    def get_best_gpu(self, min_memory_mb: int = 1024) -> Optional[GPUInfo]:
+        """Get the best available GPU for model deployment"""
+        available_gpus = [gpu for gpu in self.gpus if gpu.memory_free >= min_memory_mb]
+        if not available_gpus:
+            return None
+        # Sort by free memory (descending) and utilization (ascending)
+        return sorted(available_gpus,
+                     key=lambda x: (-x.memory_free, x.utilization))[0]
+    def estimate_model_memory(self, model_id: str, precision: str = "float16") -> int:
+        """Estimate memory requirements for a model in MB"""
+        # Simple estimation based on model name and precision
+        memory_multipliers = {
+            "float32": 4,
+            "float16": 2,
+            "int8": 1,
+            "int4": 0.5
+        }
+        multiplier = memory_multipliers.get(precision, 2)
+        # Rough parameter estimates based on model names
+        if "7b" in model_id.lower():
+            params = 7_000_000_000
+        elif "13b" in model_id.lower():
+            params = 13_000_000_000
+        elif "70b" in model_id.lower():
+            params = 70_000_000_000
+        elif "large" in model_id.lower():
+            params = 1_000_000_000
+        elif "medium" in model_id.lower():
+            params = 350_000_000
+        elif "small" in model_id.lower():
+            params = 125_000_000
+        else:
+            params = 500_000_000  # Default estimate
+        # Memory = parameters * bytes_per_param + overhead
+        estimated_mb = int((params * multiplier + 1024**3) / (1024**2))  # +1GB overhead
+        return estimated_mb
+    def check_gpu_compatibility(self, model_id: str, precision: str = "float16") -> Tuple[bool, List[str]]:
+        """Check if local GPUs can handle the model"""
+        warnings = []
+        if not self.gpus:
+            return False, ["No CUDA-capable GPUs detected"]
+        estimated_memory = self.estimate_model_memory(model_id, precision)
+        best_gpu = self.get_best_gpu(estimated_memory)
+        if not best_gpu:
+            warnings.append(f"Insufficient GPU memory. Required: {estimated_memory}MB, Available: {max(gpu.memory_free for gpu in self.gpus)}MB")
+            return False, warnings
+        # Check compute capability for advanced features
+        if precision in ["int8", "int4"]:
+            warnings.append("Quantized precision may require specific GPU compute capability")
+        return True, warnings
+    def refresh(self):
+        """Refresh GPU information"""
+        if self.nvidia_smi_available:
+            self.gpus = self._detect_nvidia_gpus()
+        elif self.cuda_available:
+            self.gpus = self._detect_cuda_gpus_fallback()
+    def get_system_info(self) -> Dict[str, Any]:
+        """Get comprehensive system information"""
+        info = {
+            "platform": platform.system(),
+            "architecture": platform.machine(),
+            "cuda_available": self.cuda_available,
+            "nvidia_smi_available": self.nvidia_smi_available,
+            "gpu_count": len(self.gpus),
+            "gpus": [
+                {
+                    "id": gpu.gpu_id,
+                    "name": gpu.name,
+                    "memory_total_mb": gpu.memory_total,
+                    "memory_free_mb": gpu.memory_free,
+                    "memory_used_mb": gpu.memory_used,
+                    "utilization_percent": gpu.utilization,
+                    "temperature_c": gpu.temperature,
+                    "power_draw_w": gpu.power_draw,
+                    "driver_version": gpu.driver_version,
+                    "cuda_version": gpu.cuda_version
+                }
+                for gpu in self.gpus
+            ]
+        }
+        # Add Python environment info
+        try:
+            import torch
+            info["torch_version"] = torch.__version__
+            info["torch_cuda_version"] = torch.version.cuda
+        except ImportError:
+            pass
+        return info
+# Global GPU manager instance
+_gpu_manager = None
+def get_gpu_manager() -> GPUManager:
+    """Get global GPU manager instance"""
+    global _gpu_manager
+    if _gpu_manager is None:
+        _gpu_manager = GPUManager()
+    return _gpu_manager
+def detect_gpus() -> List[GPUInfo]:
+    """Convenience function to detect GPUs"""
+    return get_gpu_manager().gpus
+def get_best_gpu(min_memory_mb: int = 1024) -> Optional[GPUInfo]:
+    """Convenience function to get best available GPU"""
+    return get_gpu_manager().get_best_gpu(min_memory_mb)
+def check_cuda_availability() -> bool:
+    """Check if CUDA is available"""
+    return get_gpu_manager().cuda_available
+def estimate_model_memory(model_id: str, precision: str = "float16") -> int:
+    """Estimate model memory requirements"""
+    return get_gpu_manager().estimate_model_memory(model_id, precision)

{isa_model-0.4.0.dist-info → isa_model-0.4.3.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: isa_model
-Version: 0.4.0
+Version: 0.4.3
 Summary: Unified AI model serving framework
 Author: isA_Model Contributors
 Classifier: Development Status :: 3 - Alpha
@@ -10,45 +10,87 @@ Classifier: Programming Language :: Python :: 3
 Requires-Python: >=3.8
 Description-Content-Type: text/markdown
 Requires-Dist: fastapi>=0.95.0
-Requires-Dist: numpy>=1.20.0
-Requires-Dist: httpx>=0.23.0
-Requires-Dist: pydantic>=2.0.0
 Requires-Dist: uvicorn>=0.22.0
+Requires-Dist: pydantic>=2.0.0
+Requires-Dist: httpx>=0.23.0
 Requires-Dist: requests>=2.28.0
 Requires-Dist: aiohttp>=3.8.0
-Requires-Dist: transformers>=4.30.0
-Requires-Dist: langchain-core>=0.1.0
-Requires-Dist: huggingface-hub>=0.16.0
-Requires-Dist: kubernetes>=25.3.0
-Requires-Dist: mlflow>=2.4.0
-Requires-Dist: torch>=2.0.0
-Requires-Dist: openai>=1.10.0
-Requires-Dist: replicate>=0.23.0
 Requires-Dist: python-dotenv>=1.0.0
-Requires-Dist: ollama>=0.3.0
-Requires-Dist: runpod>=1.0.0
-Requires-Dist: boto3>=1.26.0
-Requires-Dist: google-cloud-storage>=2.7.0
-Requires-Dist: datasets>=2.10.0
-Requires-Dist: accelerate>=0.20.0
-Requires-Dist: bitsandbytes>=0.39.0
-Requires-Dist: peft>=0.4.0
-Requires-Dist: trl>=0.4.0
+Requires-Dist: numpy>=1.20.0
 Requires-Dist: supabase>=2.0.0
-Requires-Dist: pgvector>=0.2.0
 Requires-Dist: psycopg2-binary>=2.9.0
 Requires-Dist: asyncpg>=0.28.0
 Requires-Dist: slowapi>=0.1.8
-Requires-Dist: redis>=4.5.0
 Requires-Dist: circuitbreaker>=1.3.2
-Requires-Dist: prometheus-fastapi-instrumentator>=6.1.0
 Requires-Dist: structlog>=23.1.0
+Requires-Dist: psutil>=5.9.0
+Requires-Dist: redis>=4.5.0
+Requires-Dist: tenacity>=8.2.0
+Provides-Extra: cloud
+Requires-Dist: openai>=1.10.0; extra == "cloud"
+Requires-Dist: replicate>=0.23.0; extra == "cloud"
+Requires-Dist: cerebras-cloud-sdk>=1.0.0; extra == "cloud"
+Requires-Dist: modal>=0.63.0; extra == "cloud"
+Requires-Dist: grpclib>=0.4.7; extra == "cloud"
+Requires-Dist: python-logging-loki>=0.3.1; extra == "cloud"
+Requires-Dist: huggingface-hub>=0.16.0; extra == "cloud"
+Requires-Dist: docker>=6.0.0; extra == "cloud"
+Requires-Dist: influxdb-client>=1.36.0; extra == "cloud"
+Requires-Dist: tiktoken>=0.5.0; extra == "cloud"
+Provides-Extra: local
+Requires-Dist: torch>=2.0.0; extra == "local"
+Requires-Dist: transformers>=4.30.0; extra == "local"
+Requires-Dist: accelerate>=0.20.0; extra == "local"
+Requires-Dist: huggingface-hub>=0.16.0; extra == "local"
+Requires-Dist: safetensors>=0.4.1; extra == "local"
+Requires-Dist: sentencepiece>=0.1.99; extra == "local"
+Provides-Extra: training
+Requires-Dist: datasets>=2.10.0; extra == "training"
+Requires-Dist: peft>=0.4.0; extra == "training"
+Requires-Dist: trl>=0.4.0; extra == "training"
+Requires-Dist: bitsandbytes>=0.39.0; extra == "training"
+Provides-Extra: audio
+Requires-Dist: librosa>=0.10.1; extra == "audio"
+Requires-Dist: soundfile>=0.12.1; extra == "audio"
+Requires-Dist: numba>=0.57.0; extra == "audio"
+Provides-Extra: vision
+Requires-Dist: Pillow>=10.0.1; extra == "vision"
+Requires-Dist: torchvision>=0.15.2; extra == "vision"
+Provides-Extra: langchain
+Requires-Dist: langchain-core>=0.1.0; extra == "langchain"
+Requires-Dist: langchain-openai>=0.0.2; extra == "langchain"
+Provides-Extra: storage
+Requires-Dist: boto3>=1.26.0; extra == "storage"
+Requires-Dist: google-cloud-storage>=2.7.0; extra == "storage"
+Provides-Extra: monitoring
+Requires-Dist: mlflow>=2.4.0; extra == "monitoring"
+Requires-Dist: redis>=4.5.0; extra == "monitoring"
+Requires-Dist: prometheus-fastapi-instrumentator>=6.1.0; extra == "monitoring"
+Requires-Dist: influxdb-client>=1.36.0; extra == "monitoring"
+Requires-Dist: pgvector>=0.2.0; extra == "monitoring"
+Requires-Dist: python-logging-loki>=0.3.1; extra == "monitoring"
+Provides-Extra: k8s
+Requires-Dist: kubernetes>=25.3.0; extra == "k8s"
+Provides-Extra: gpu-cloud
+Requires-Dist: runpod>=1.0.0; extra == "gpu-cloud"
+Requires-Dist: ollama>=0.3.0; extra == "gpu-cloud"
 Provides-Extra: dev
 Requires-Dist: pytest>=7.0.0; extra == "dev"
 Requires-Dist: black>=22.0.0; extra == "dev"
 Requires-Dist: flake8>=4.0.0; extra == "dev"
 Requires-Dist: mypy>=0.991; extra == "dev"
 Requires-Dist: twine>=4.0.0; extra == "dev"
+Provides-Extra: api-only
+Requires-Dist: isa-model[cloud,langchain]; extra == "api-only"
+Provides-Extra: full-local
+Requires-Dist: isa-model[audio,langchain,local,training,vision]; extra == "full-local"
+Provides-Extra: production
+Requires-Dist: isa-model[cloud,k8s,monitoring,storage]; extra == "production"
+Provides-Extra: staging
+Requires-Dist: isa-model[cloud,langchain,monitoring,storage]; extra == "staging"
+Requires-Dist: python-consul>=1.1.0; extra == "staging"
+Provides-Extra: all
+Requires-Dist: isa-model[audio,cloud,gpu-cloud,k8s,langchain,local,monitoring,storage,training,vision]; extra == "all"
 # isa_model_sdk - Unified AI Model Serving Framework

isa-model 0.4.0__py3-none-any.whl → 0.4.3__py3-none-any.whl

isa-model 0.4.0py3-none-any.whl → 0.4.3py3-none-any.whl