PyPI - isa-model - Versions diffs - 0.3.5__py3-none-any.whl → 0.3.6__py3-none-any.whl - Mend

isa-model 0.3.5py3-none-any.whl → 0.3.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (87) hide show

isa_model/__init__.py +30 -1
isa_model/client.py +770 -0
isa_model/core/config/__init__.py +16 -0
isa_model/core/config/config_manager.py +514 -0
isa_model/core/config.py +426 -0
isa_model/core/models/model_billing_tracker.py +476 -0
isa_model/core/models/model_manager.py +399 -0
isa_model/core/{storage/supabase_storage.py → models/model_repo.py} +72 -73
isa_model/core/pricing_manager.py +426 -0
isa_model/core/services/__init__.py +19 -0
isa_model/core/services/intelligent_model_selector.py +547 -0
isa_model/core/types.py +291 -0
isa_model/deployment/__init__.py +2 -0
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +157 -3
isa_model/deployment/cloud/modal/isa_vision_table_service.py +532 -0
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +104 -3
isa_model/deployment/cloud/modal/register_models.py +321 -0
isa_model/deployment/runtime/deployed_service.py +338 -0
isa_model/deployment/services/__init__.py +9 -0
isa_model/deployment/services/auto_deploy_vision_service.py +537 -0
isa_model/deployment/services/model_service.py +332 -0
isa_model/deployment/services/service_monitor.py +356 -0
isa_model/deployment/services/service_registry.py +527 -0
isa_model/eval/__init__.py +80 -44
isa_model/eval/config/__init__.py +10 -0
isa_model/eval/config/evaluation_config.py +108 -0
isa_model/eval/evaluators/__init__.py +18 -0
isa_model/eval/evaluators/base_evaluator.py +503 -0
isa_model/eval/evaluators/llm_evaluator.py +472 -0
isa_model/eval/factory.py +417 -709
isa_model/eval/infrastructure/__init__.py +24 -0
isa_model/eval/infrastructure/experiment_tracker.py +466 -0
isa_model/eval/metrics.py +191 -21
isa_model/inference/ai_factory.py +181 -605
isa_model/inference/services/audio/base_stt_service.py +65 -1
isa_model/inference/services/audio/base_tts_service.py +75 -1
isa_model/inference/services/audio/openai_stt_service.py +189 -151
isa_model/inference/services/audio/openai_tts_service.py +12 -10
isa_model/inference/services/audio/replicate_tts_service.py +61 -56
isa_model/inference/services/base_service.py +55 -17
isa_model/inference/services/embedding/base_embed_service.py +65 -1
isa_model/inference/services/embedding/ollama_embed_service.py +103 -43
isa_model/inference/services/embedding/openai_embed_service.py +8 -10
isa_model/inference/services/helpers/stacked_config.py +148 -0
isa_model/inference/services/img/__init__.py +18 -0
isa_model/inference/services/{vision → img}/base_image_gen_service.py +80 -1
isa_model/inference/services/{stacked → img}/flux_professional_service.py +25 -1
isa_model/inference/services/{stacked → img/helpers}/base_stacked_service.py +40 -35
isa_model/inference/services/{vision → img}/replicate_image_gen_service.py +44 -31
isa_model/inference/services/llm/__init__.py +3 -3
isa_model/inference/services/llm/base_llm_service.py +492 -40
isa_model/inference/services/llm/helpers/llm_prompts.py +258 -0
isa_model/inference/services/llm/helpers/llm_utils.py +280 -0
isa_model/inference/services/llm/ollama_llm_service.py +51 -17
isa_model/inference/services/llm/openai_llm_service.py +70 -19
isa_model/inference/services/llm/yyds_llm_service.py +24 -23
isa_model/inference/services/vision/__init__.py +38 -4
isa_model/inference/services/vision/base_vision_service.py +218 -117
isa_model/inference/services/vision/{isA_vision_service.py → disabled/isA_vision_service.py} +98 -0
isa_model/inference/services/{stacked → vision}/doc_analysis_service.py +1 -1
isa_model/inference/services/vision/helpers/base_stacked_service.py +274 -0
isa_model/inference/services/vision/helpers/image_utils.py +272 -3
isa_model/inference/services/vision/helpers/vision_prompts.py +297 -0
isa_model/inference/services/vision/openai_vision_service.py +104 -307
isa_model/inference/services/vision/replicate_vision_service.py +140 -325
isa_model/inference/services/{stacked → vision}/ui_analysis_service.py +2 -498
isa_model/scripts/register_models.py +370 -0
isa_model/scripts/register_models_with_embeddings.py +510 -0
isa_model/serving/api/fastapi_server.py +6 -1
isa_model/serving/api/routes/unified.py +202 -0
{isa_model-0.3.5.dist-info → isa_model-0.3.6.dist-info}/METADATA +4 -1
{isa_model-0.3.5.dist-info → isa_model-0.3.6.dist-info}/RECORD +77 -53
isa_model/config/__init__.py +0 -9
isa_model/config/config_manager.py +0 -213
isa_model/core/model_manager.py +0 -213
isa_model/core/model_registry.py +0 -375
isa_model/core/vision_models_init.py +0 -116
isa_model/inference/billing_tracker.py +0 -406
isa_model/inference/services/llm/triton_llm_service.py +0 -481
isa_model/inference/services/stacked/__init__.py +0 -26
isa_model/inference/services/stacked/config.py +0 -426
isa_model/inference/services/vision/ollama_vision_service.py +0 -194
/isa_model/core/{model_storage.py → models/model_storage.py} +0 -0
/isa_model/inference/services/{vision → embedding}/helpers/text_splitter.py +0 -0
/isa_model/inference/services/llm/{llm_adapter.py → helpers/llm_adapter.py} +0 -0
{isa_model-0.3.5.dist-info → isa_model-0.3.6.dist-info}/WHEEL +0 -0
{isa_model-0.3.5.dist-info → isa_model-0.3.6.dist-info}/top_level.txt +0 -0

isa_model/core/models/model_billing_tracker.py ADDED Viewed

@@ -0,0 +1,476 @@
+#!/usr/bin/env python
+# -*- coding: utf-8 -*-
+"""
+Model Billing Tracker - Core billing and usage tracking for model lifecycle management
+This module tracks model usage, costs, and billing across all lifecycle stages:
+- Training costs
+- Evaluation costs
+- Deployment costs
+- Inference costs
+Integrates with ModelRegistry to store billing data in Supabase.
+"""
+from typing import Dict, List, Optional, Any, Union
+from datetime import datetime, timezone
+from dataclasses import dataclass, asdict
+import json
+import logging
+from pathlib import Path
+from enum import Enum
+import os
+logger = logging.getLogger(__name__)
+class ModelOperationType(Enum):
+    """Types of model operations that incur costs"""
+    TRAINING = "training"
+    EVALUATION = "evaluation"
+    DEPLOYMENT = "deployment"
+    INFERENCE = "inference"
+    STORAGE = "storage"
+class ServiceType(Enum):
+    """Types of AI services"""
+    LLM = "llm"
+    EMBEDDING = "embedding"
+    VISION = "vision"
+    IMAGE_GENERATION = "image_generation"
+    AUDIO_STT = "audio_stt"
+    AUDIO_TTS = "audio_tts"
+@dataclass
+class ModelUsageRecord:
+    """Record of model usage across its lifecycle"""
+    timestamp: str
+    model_id: str
+    operation_type: str  # ModelOperationType
+    provider: str
+    service_type: str   # ServiceType
+    operation: str      # Specific operation (e.g., 'chat', 'train', 'deploy')
+    input_tokens: Optional[int] = None
+    output_tokens: Optional[int] = None
+    total_tokens: Optional[int] = None
+    input_units: Optional[float] = None  # For non-token based services
+    output_units: Optional[float] = None
+    cost_usd: Optional[float] = None
+    metadata: Optional[Dict[str, Any]] = None
+    def to_dict(self) -> Dict[str, Any]:
+        """Convert to dictionary"""
+        return asdict(self)
+    @classmethod
+    def from_dict(cls, data: Dict[str, Any]) -> 'ModelUsageRecord':
+        """Create from dictionary, filtering out database-specific fields"""
+        # Filter out database fields that aren't part of the ModelUsageRecord
+        filtered_data = {
+            k: v for k, v in data.items()
+            if k in ['timestamp', 'model_id', 'operation_type', 'provider', 'service_type',
+                    'operation', 'input_tokens', 'output_tokens', 'total_tokens',
+                    'input_units', 'output_units', 'cost_usd', 'metadata']
+        }
+        return cls(**filtered_data)
+class ModelBillingTracker:
+    """
+    Core billing tracker for model lifecycle management
+    Integrates with ModelRegistry to store billing data in Supabase.
+    Provides unified cost tracking across training, evaluation, deployment, and inference.
+    """
+    def __init__(self, model_registry=None, storage_path: Optional[str] = None):
+        """
+        Initialize model billing tracker
+        Args:
+            model_registry: ModelRegistry instance for database storage
+            storage_path: Fallback local storage path
+        """
+        self.model_registry = model_registry
+        # Fallback to local storage if no registry provided
+        if storage_path is None:
+            project_root = Path(__file__).parent.parent.parent.parent  # Go up one more level to reach project root
+            self.storage_path = project_root / "model_billing_data.json"
+        else:
+            self.storage_path = Path(storage_path)
+        self.usage_records: List[ModelUsageRecord] = []
+        self.session_start = datetime.now(timezone.utc).isoformat()
+        # Load existing data
+        self._load_data()
+    def _load_data(self):
+        """Load existing billing data from registry or local storage"""
+        try:
+            if self.model_registry and hasattr(self.model_registry, 'supabase'):
+                # Load from Supabase
+                self._load_from_supabase()
+            else:
+                # Load from local storage
+                self._load_from_local()
+        except Exception as e:
+            logger.warning(f"Could not load billing data: {e}")
+            self.usage_records = []
+    def _load_from_supabase(self):
+        """Load billing data from Supabase"""
+        try:
+            if not self.model_registry or not hasattr(self.model_registry, 'supabase'):
+                logger.warning("No Supabase client available for billing data loading")
+                self.usage_records = []
+                return
+            # Query model_usage table for recent usage records (last 30 days)
+            from datetime import datetime, timedelta
+            thirty_days_ago = (datetime.now() - timedelta(days=30)).isoformat()
+            result = self.model_registry.supabase.table('model_usage').select('*').gte('timestamp', thirty_days_ago).order('timestamp', desc=True).execute()
+            if result.data:
+                self.usage_records = [
+                    ModelUsageRecord.from_dict(record)
+                    for record in result.data
+                ]
+                logger.info(f"Loaded {len(self.usage_records)} billing records from Supabase")
+            else:
+                self.usage_records = []
+                logger.info("No billing records found in Supabase")
+        except Exception as e:
+            logger.error(f"Failed to load billing data from Supabase: {e}")
+            # Fallback to empty records
+            self.usage_records = []
+    def _load_from_local(self):
+        """Load billing data from local JSON file"""
+        if self.storage_path.exists():
+            with open(self.storage_path, 'r') as f:
+                data = json.load(f)
+                self.usage_records = [
+                    ModelUsageRecord.from_dict(record)
+                    for record in data.get('usage_records', [])
+                ]
+            logger.info(f"Loaded {len(self.usage_records)} billing records from local storage")
+    def _save_data(self):
+        """Save billing data to registry or local storage"""
+        try:
+            if self.model_registry and hasattr(self.model_registry, 'supabase'):
+                self._save_to_supabase()
+            else:
+                self._save_to_local()
+        except Exception as e:
+            logger.error(f"Could not save billing data: {e}")
+    def _save_to_supabase(self):
+        """Save billing data to Supabase"""
+        try:
+            if not self.model_registry or not hasattr(self.model_registry, 'supabase'):
+                logger.warning("No Supabase client available for billing data saving")
+                return
+            if not self.usage_records:
+                logger.debug("No usage records to save")
+                return
+            # Convert usage records to dict format for Supabase
+            records_to_save = []
+            for record in self.usage_records:
+                record_dict = record.to_dict()
+                # Ensure all required fields are present and properly formatted
+                record_dict['created_at'] = record_dict.get('timestamp')
+                records_to_save.append(record_dict)
+            # Insert records into model_usage table (upsert to handle duplicates)
+            result = self.model_registry.supabase.table('model_usage').upsert(
+                records_to_save,
+                on_conflict='timestamp,model_id,operation'  # Avoid duplicates based on these fields
+            ).execute()
+            if result.data:
+                logger.info(f"Successfully saved {len(result.data)} billing records to Supabase")
+            else:
+                logger.warning("No records were saved to Supabase")
+        except Exception as e:
+            logger.error(f"Failed to save billing data to Supabase: {e}")
+            # Fallback to local storage on Supabase failure
+            logger.info("Falling back to local storage for billing data")
+            self._save_to_local()
+    def _save_to_local(self):
+        """Save billing data to local JSON file"""
+        self.storage_path.parent.mkdir(parents=True, exist_ok=True)
+        data = {
+            "session_start": self.session_start,
+            "last_updated": datetime.now(timezone.utc).isoformat(),
+            "usage_records": [record.to_dict() for record in self.usage_records]
+        }
+        with open(self.storage_path, 'w') as f:
+            json.dump(data, f, indent=2)
+    def track_model_usage(
+        self,
+        model_id: str,
+        operation_type: Union[str, ModelOperationType],
+        provider: str,
+        service_type: Union[str, ServiceType],
+        operation: str,
+        input_tokens: Optional[int] = None,
+        output_tokens: Optional[int] = None,
+        input_units: Optional[float] = None,
+        output_units: Optional[float] = None,
+        cost_usd: Optional[float] = None,
+        metadata: Optional[Dict[str, Any]] = None
+    ) -> ModelUsageRecord:
+        """
+        Track model usage across its lifecycle
+        Args:
+            model_id: Unique model identifier
+            operation_type: Type of operation (training, evaluation, deployment, inference)
+            provider: Provider name (openai, replicate, etc.)
+            service_type: Type of service
+            operation: Specific operation performed
+            input_tokens: Number of input tokens
+            output_tokens: Number of output tokens
+            input_units: Input units for non-token services
+            output_units: Output units for non-token services
+            cost_usd: Cost in USD for this operation
+            metadata: Additional metadata
+        Returns:
+            ModelUsageRecord object
+        """
+        # Convert enums to strings
+        if isinstance(operation_type, ModelOperationType):
+            operation_type = operation_type.value
+        if isinstance(service_type, ServiceType):
+            service_type = service_type.value
+        # Calculate total tokens
+        total_tokens = None
+        if input_tokens is not None or output_tokens is not None:
+            total_tokens = (input_tokens or 0) + (output_tokens or 0)
+        # Use provided cost_usd or calculate it
+        if cost_usd is None:
+            cost_usd = self._calculate_cost(
+                provider, model_id, operation_type,
+                input_tokens, output_tokens, input_units, output_units
+            )
+        # Create usage record
+        record = ModelUsageRecord(
+            timestamp=datetime.now(timezone.utc).isoformat(),
+            model_id=model_id,
+            operation_type=operation_type,
+            provider=provider,
+            service_type=service_type,
+            operation=operation,
+            input_tokens=input_tokens,
+            output_tokens=output_tokens,
+            total_tokens=total_tokens,
+            input_units=input_units,
+            output_units=output_units,
+            cost_usd=cost_usd,
+            metadata=metadata or {}
+        )
+        # Add to records and save
+        self.usage_records.append(record)
+        self._save_data()
+        logger.info(f"Tracked model usage: {model_id} - {operation_type} - ${cost_usd:.6f}")
+        return record
+    def _calculate_cost(
+        self,
+        provider: str,
+        model_id: str,
+        operation_type: str,
+        input_tokens: Optional[int] = None,
+        output_tokens: Optional[int] = None,
+        input_units: Optional[float] = None,
+        output_units: Optional[float] = None
+    ) -> float:
+        """Calculate cost for model usage"""
+        try:
+            # Import here to avoid circular imports
+            from .model_manager import ModelManager
+            # Get model info to determine provider model name
+            if self.model_registry:
+                model_info = self.model_registry.get_model_info(model_id)
+                if model_info and model_info.get('metadata'):
+                    provider_model_name = model_info['metadata'].get('provider_model_name')
+                    if provider_model_name:
+                        # Use ModelManager pricing
+                        pricing = ModelManager.MODEL_PRICING.get(provider, {}).get(provider_model_name)
+                        if pricing:
+                            cost = 0.0
+                            if input_tokens is not None and "input" in pricing:
+                                cost += (input_tokens / 1000000) * pricing["input"]
+                            if output_tokens is not None and "output" in pricing:
+                                cost += (output_tokens / 1000000) * pricing["output"]
+                            return cost
+            # Fallback to default pricing if model not found
+            return 0.0
+        except Exception as e:
+            logger.error(f"Error calculating cost for model {model_id}: {e}")
+            return 0.0
+    def get_model_usage_summary(self, model_id: str) -> Dict[str, Any]:
+        """Get usage summary for a specific model"""
+        model_records = [
+            record for record in self.usage_records
+            if record.model_id == model_id
+        ]
+        return self._generate_summary(model_records, f"Model {model_id} Usage")
+    def get_operation_summary(self, operation_type: Union[str, ModelOperationType]) -> Dict[str, Any]:
+        """Get usage summary for a specific operation type"""
+        if isinstance(operation_type, ModelOperationType):
+            operation_type = operation_type.value
+        operation_records = [
+            record for record in self.usage_records
+            if record.operation_type == operation_type
+        ]
+        return self._generate_summary(operation_records, f"{operation_type.title()} Operations")
+    def get_provider_summary(self, provider: str) -> Dict[str, Any]:
+        """Get usage summary for a specific provider"""
+        provider_records = [
+            record for record in self.usage_records
+            if record.provider == provider
+        ]
+        return self._generate_summary(provider_records, f"{provider.title()} Usage")
+    def _generate_summary(self, records: List[ModelUsageRecord], title: str) -> Dict[str, Any]:
+        """Generate usage summary from records"""
+        if not records:
+            return {
+                "title": title,
+                "total_cost": 0.0,
+                "total_requests": 0,
+                "operations": {},
+                "models": {},
+                "providers": {}
+            }
+        total_cost = sum(record.cost_usd or 0 for record in records)
+        total_requests = len(records)
+        # Group by operation type
+        operations = {}
+        for record in records:
+            if record.operation_type not in operations:
+                operations[record.operation_type] = {
+                    "cost": 0.0,
+                    "requests": 0
+                }
+            operations[record.operation_type]["cost"] += record.cost_usd or 0
+            operations[record.operation_type]["requests"] += 1
+        # Group by model
+        models = {}
+        for record in records:
+            if record.model_id not in models:
+                models[record.model_id] = {
+                    "cost": 0.0,
+                    "requests": 0,
+                    "total_tokens": 0
+                }
+            models[record.model_id]["cost"] += record.cost_usd or 0
+            models[record.model_id]["requests"] += 1
+            if record.total_tokens:
+                models[record.model_id]["total_tokens"] += record.total_tokens
+        # Group by provider
+        providers = {}
+        for record in records:
+            if record.provider not in providers:
+                providers[record.provider] = {
+                    "cost": 0.0,
+                    "requests": 0
+                }
+            providers[record.provider]["cost"] += record.cost_usd or 0
+            providers[record.provider]["requests"] += 1
+        return {
+            "title": title,
+            "total_cost": round(total_cost, 6),
+            "total_requests": total_requests,
+            "operations": operations,
+            "models": models,
+            "providers": providers,
+            "period": {
+                "start": records[0].timestamp if records else None,
+                "end": records[-1].timestamp if records else None
+            }
+        }
+    def print_model_summary(self, model_id: str):
+        """Print usage summary for a specific model"""
+        summary = self.get_model_usage_summary(model_id)
+        print(f"\n🤖 {summary['title']} Summary")
+        print("=" * 50)
+        print(f"💵 Total Cost: ${summary['total_cost']:.6f}")
+        print(f"📊 Total Operations: {summary['total_requests']}")
+        if summary['operations']:
+            print("\n📈 By Operation Type:")
+            for operation, data in summary['operations'].items():
+                print(f"  {operation}: ${data['cost']:.6f} ({data['requests']} operations)")
+        if summary['providers']:
+            print("\n🔧 By Provider:")
+            for provider, data in summary['providers'].items():
+                print(f"  {provider}: ${data['cost']:.6f} ({data['requests']} requests)")
+# Global model billing tracker instance
+_global_model_tracker: Optional[ModelBillingTracker] = None
+def get_model_billing_tracker() -> ModelBillingTracker:
+    """Get the global model billing tracker instance"""
+    global _global_model_tracker
+    if _global_model_tracker is None:
+        # Try to get ModelRegistry instance
+        try:
+            from .model_repo import ModelRegistry
+            registry = ModelRegistry()
+            _global_model_tracker = ModelBillingTracker(model_registry=registry)
+        except Exception:
+            _global_model_tracker = ModelBillingTracker()
+    return _global_model_tracker
+def track_model_usage(**kwargs) -> ModelUsageRecord:
+    """Convenience function to track model usage"""
+    return get_model_billing_tracker().track_model_usage(**kwargs)
+def print_model_billing_summary(model_id: str = None, operation_type: str = None):
+    """Convenience function to print billing summary"""
+    tracker = get_model_billing_tracker()
+    if model_id:
+        tracker.print_model_summary(model_id)
+    elif operation_type:
+        summary = tracker.get_operation_summary(operation_type)
+        print(f"\n💰 {summary['title']} Summary")
+        print("=" * 50)
+        print(f"💵 Total Cost: ${summary['total_cost']:.6f}")
+        print(f"📊 Total Operations: {summary['total_requests']}")

isa-model 0.3.5__py3-none-any.whl → 0.3.6__py3-none-any.whl

isa-model 0.3.5py3-none-any.whl → 0.3.6py3-none-any.whl