PyPI - isa-model - Versions diffs - 0.3.5__py3-none-any.whl → 0.3.7__py3-none-any.whl - Mend

isa-model 0.3.5py3-none-any.whl → 0.3.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (88) hide show

isa_model/__init__.py +30 -1
isa_model/client.py +937 -0
isa_model/core/config/__init__.py +16 -0
isa_model/core/config/config_manager.py +514 -0
isa_model/core/config.py +426 -0
isa_model/core/models/model_billing_tracker.py +476 -0
isa_model/core/models/model_manager.py +399 -0
isa_model/core/{storage/supabase_storage.py → models/model_repo.py} +72 -73
isa_model/core/pricing_manager.py +426 -0
isa_model/core/services/__init__.py +19 -0
isa_model/core/services/intelligent_model_selector.py +547 -0
isa_model/core/types.py +291 -0
isa_model/deployment/__init__.py +2 -0
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +157 -3
isa_model/deployment/cloud/modal/isa_vision_table_service.py +532 -0
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +104 -3
isa_model/deployment/cloud/modal/register_models.py +321 -0
isa_model/deployment/runtime/deployed_service.py +338 -0
isa_model/deployment/services/__init__.py +9 -0
isa_model/deployment/services/auto_deploy_vision_service.py +538 -0
isa_model/deployment/services/model_service.py +332 -0
isa_model/deployment/services/service_monitor.py +356 -0
isa_model/deployment/services/service_registry.py +527 -0
isa_model/deployment/services/simple_auto_deploy_vision_service.py +275 -0
isa_model/eval/__init__.py +80 -44
isa_model/eval/config/__init__.py +10 -0
isa_model/eval/config/evaluation_config.py +108 -0
isa_model/eval/evaluators/__init__.py +18 -0
isa_model/eval/evaluators/base_evaluator.py +503 -0
isa_model/eval/evaluators/llm_evaluator.py +472 -0
isa_model/eval/factory.py +417 -709
isa_model/eval/infrastructure/__init__.py +24 -0
isa_model/eval/infrastructure/experiment_tracker.py +466 -0
isa_model/eval/metrics.py +191 -21
isa_model/inference/ai_factory.py +257 -601
isa_model/inference/services/audio/base_stt_service.py +65 -1
isa_model/inference/services/audio/base_tts_service.py +75 -1
isa_model/inference/services/audio/openai_stt_service.py +189 -151
isa_model/inference/services/audio/openai_tts_service.py +12 -10
isa_model/inference/services/audio/replicate_tts_service.py +61 -56
isa_model/inference/services/base_service.py +55 -17
isa_model/inference/services/embedding/base_embed_service.py +65 -1
isa_model/inference/services/embedding/ollama_embed_service.py +103 -43
isa_model/inference/services/embedding/openai_embed_service.py +8 -10
isa_model/inference/services/helpers/stacked_config.py +148 -0
isa_model/inference/services/img/__init__.py +18 -0
isa_model/inference/services/{vision → img}/base_image_gen_service.py +80 -1
isa_model/inference/services/{stacked → img}/flux_professional_service.py +25 -1
isa_model/inference/services/{stacked → img/helpers}/base_stacked_service.py +40 -35
isa_model/inference/services/{vision → img}/replicate_image_gen_service.py +44 -31
isa_model/inference/services/llm/__init__.py +3 -3
isa_model/inference/services/llm/base_llm_service.py +492 -40
isa_model/inference/services/llm/helpers/llm_prompts.py +258 -0
isa_model/inference/services/llm/helpers/llm_utils.py +280 -0
isa_model/inference/services/llm/ollama_llm_service.py +51 -17
isa_model/inference/services/llm/openai_llm_service.py +70 -19
isa_model/inference/services/llm/yyds_llm_service.py +24 -23
isa_model/inference/services/vision/__init__.py +38 -4
isa_model/inference/services/vision/base_vision_service.py +218 -117
isa_model/inference/services/vision/{isA_vision_service.py → disabled/isA_vision_service.py} +98 -0
isa_model/inference/services/{stacked → vision}/doc_analysis_service.py +1 -1
isa_model/inference/services/vision/helpers/base_stacked_service.py +274 -0
isa_model/inference/services/vision/helpers/image_utils.py +272 -3
isa_model/inference/services/vision/helpers/vision_prompts.py +297 -0
isa_model/inference/services/vision/openai_vision_service.py +104 -307
isa_model/inference/services/vision/replicate_vision_service.py +140 -325
isa_model/inference/services/{stacked → vision}/ui_analysis_service.py +2 -498
isa_model/scripts/register_models.py +370 -0
isa_model/scripts/register_models_with_embeddings.py +510 -0
isa_model/serving/api/fastapi_server.py +6 -1
isa_model/serving/api/routes/unified.py +274 -0
{isa_model-0.3.5.dist-info → isa_model-0.3.7.dist-info}/METADATA +4 -1
{isa_model-0.3.5.dist-info → isa_model-0.3.7.dist-info}/RECORD +78 -53
isa_model/config/__init__.py +0 -9
isa_model/config/config_manager.py +0 -213
isa_model/core/model_manager.py +0 -213
isa_model/core/model_registry.py +0 -375
isa_model/core/vision_models_init.py +0 -116
isa_model/inference/billing_tracker.py +0 -406
isa_model/inference/services/llm/triton_llm_service.py +0 -481
isa_model/inference/services/stacked/__init__.py +0 -26
isa_model/inference/services/stacked/config.py +0 -426
isa_model/inference/services/vision/ollama_vision_service.py +0 -194
/isa_model/core/{model_storage.py → models/model_storage.py} +0 -0
/isa_model/inference/services/{vision → embedding}/helpers/text_splitter.py +0 -0
/isa_model/inference/services/llm/{llm_adapter.py → helpers/llm_adapter.py} +0 -0
{isa_model-0.3.5.dist-info → isa_model-0.3.7.dist-info}/WHEEL +0 -0
{isa_model-0.3.5.dist-info → isa_model-0.3.7.dist-info}/top_level.txt +0 -0

isa_model/inference/ai_factory.py CHANGED Viewed

@@ -3,28 +3,27 @@
 """
 Simplified AI Factory for creating inference services
-Uses the new service architecture with proper base classes and centralized API key management
+Uses the new unified service architecture with centralized managers
 """
-from typing import Dict, Type, Any, Optional, Tuple, List, TYPE_CHECKING, cast
+from typing import Dict, Any, Optional, TYPE_CHECKING
 import logging
-from isa_model.inference.providers.base_provider import BaseProvider
 from isa_model.inference.services.base_service import BaseService
-from isa_model.inference.base import ModelType
-from isa_model.inference.services.vision.base_vision_service import BaseVisionService
-from isa_model.inference.services.vision.base_image_gen_service import BaseImageGenService
-from isa_model.inference.services.stacked import UIAnalysisService, BaseStackedService, DocAnalysisStackedService, FluxProfessionalService
+from isa_model.core.models.model_manager import ModelManager
+from isa_model.core.config import ConfigManager
 if TYPE_CHECKING:
     from isa_model.inference.services.audio.base_stt_service import BaseSTTService
     from isa_model.inference.services.audio.base_tts_service import BaseTTSService
+    from isa_model.inference.services.vision.base_vision_service import BaseVisionService
+    from isa_model.inference.services.img.base_image_gen_service import BaseImageGenService
 logger = logging.getLogger(__name__)
 class AIFactory:
     """
-    Simplified Factory for creating AI services with proper inheritance hierarchy
-    API key management is handled by individual providers
+    Modernized AI Factory using centralized ModelManager and ConfigManager
+    Provides unified interface with only 6 core methods: get_llm, get_vision, get_img, get_stt, get_tts, get_embed
     """
     _instance = None
@@ -38,184 +37,31 @@ class AIFactory:
     def __init__(self):
         """Initialize the AI Factory."""
         if not self._is_initialized:
-            self._providers: Dict[str, Type[BaseProvider]] = {}
-            self._services: Dict[Tuple[str, ModelType], Type[BaseService]] = {}
+            # Use centralized managers
+            self.model_manager = ModelManager()
+            self.config_manager = ConfigManager()
             self._cached_services: Dict[str, BaseService] = {}
-            self._initialize_services()
-            AIFactory._is_initialized = True
-    def _initialize_services(self):
-        """Initialize available providers and services"""
-        try:
-            # Register Ollama services
-            self._register_ollama_services()
-            # Register OpenAI services
-            self._register_openai_services()
-            # Register Replicate services
-            self._register_replicate_services()
-            # Register ISA Modal services
-            self._register_isa_services()
-            # Register YYDS services
-            self._register_yyds_services()
-            logger.info("AI Factory initialized with centralized provider API key management")
-        except Exception as e:
-            logger.error(f"Error initializing services: {e}")
-            logger.warning("Some services may not be available")
-    def _register_ollama_services(self):
-        """Register Ollama provider and services"""
-        try:
-            from isa_model.inference.providers.ollama_provider import OllamaProvider
-            from isa_model.inference.services.llm.ollama_llm_service import OllamaLLMService
-            from isa_model.inference.services.embedding.ollama_embed_service import OllamaEmbedService
-            from isa_model.inference.services.vision.ollama_vision_service import OllamaVisionService
-            self.register_provider('ollama', OllamaProvider)
-            self.register_service('ollama', ModelType.LLM, OllamaLLMService)
-            self.register_service('ollama', ModelType.EMBEDDING, OllamaEmbedService)
-            self.register_service('ollama', ModelType.VISION, OllamaVisionService)
-            logger.info("Ollama services registered successfully")
-        except ImportError as e:
-            logger.warning(f"Ollama services not available: {e}")
-    def _register_openai_services(self):
-        """Register OpenAI provider and services"""
-        try:
-            from isa_model.inference.providers.openai_provider import OpenAIProvider
-            from isa_model.inference.services.llm.openai_llm_service import OpenAILLMService
-            from isa_model.inference.services.audio.openai_tts_service import OpenAITTSService
-            from isa_model.inference.services.audio.openai_stt_service import OpenAISTTService
-            from isa_model.inference.services.embedding.openai_embed_service import OpenAIEmbedService
-            from isa_model.inference.services.vision.openai_vision_service import OpenAIVisionService
-            self.register_provider('openai', OpenAIProvider)
-            self.register_service('openai', ModelType.LLM, OpenAILLMService)
-            self.register_service('openai', ModelType.AUDIO, OpenAITTSService)
-            self.register_service('openai', ModelType.EMBEDDING, OpenAIEmbedService)
-            self.register_service('openai', ModelType.VISION, OpenAIVisionService)
-            logger.info("OpenAI services registered successfully")
-        except ImportError as e:
-            logger.warning(f"OpenAI services not available: {e}")
-    def _register_replicate_services(self):
-        """Register Replicate provider and services"""
-        try:
-            from isa_model.inference.providers.replicate_provider import ReplicateProvider
-            from isa_model.inference.services.vision.replicate_image_gen_service import ReplicateImageGenService
-            from isa_model.inference.services.vision.replicate_vision_service import ReplicateVisionService
-            from isa_model.inference.services.audio.replicate_tts_service import ReplicateTTSService
-            self.register_provider('replicate', ReplicateProvider)
-            # Register vision service for general vision tasks
-            self.register_service('replicate', ModelType.VISION, ReplicateVisionService)
-            # Register image generation service for FLUX, ControlNet, LoRA, Upscaling
-            # Note: Using VISION type as IMAGE_GEN is not defined in ModelType
-            # ReplicateImageGenService will be accessed through get_img() methods
-            # Register audio service
-            self.register_service('replicate', ModelType.AUDIO, ReplicateTTSService)
-            logger.info("Replicate services registered successfully")
-        except ImportError as e:
-            logger.warning(f"Replicate services not available: {e}")
-    def _register_isa_services(self):
-        """Register ISA Modal provider and services"""
-        try:
-            from isa_model.inference.services.vision.isA_vision_service import ISAVisionService
-            from isa_model.inference.providers.modal_provider import ModalProvider
-            self.register_provider('modal', ModalProvider)
-            self.register_service('modal', ModelType.VISION, ISAVisionService)
-            logger.info("ISA Modal services registered successfully")
-        except ImportError as e:
-            logger.warning(f"ISA Modal services not available: {e}")
-    def _register_yyds_services(self):
-        """Register YYDS provider and services"""
-        try:
-            from isa_model.inference.providers.yyds_provider import YydsProvider
-            from isa_model.inference.services.llm.yyds_llm_service import YydsLLMService
-            self.register_provider('yyds', YydsProvider)
-            self.register_service('yyds', ModelType.LLM, YydsLLMService)
-            logger.info("YYDS services registered successfully")
-        except ImportError as e:
-            logger.warning(f"YYDS services not available: {e}")
-    def register_provider(self, name: str, provider_class: Type[BaseProvider]) -> None:
-        """Register an AI provider"""
-        self._providers[name] = provider_class
-    def register_service(self, provider_name: str, model_type: ModelType,
-                        service_class: Type[BaseService]) -> None:
-        """Register a service type with its provider"""
-        self._services[(provider_name, model_type)] = service_class
-    def create_service(self, provider_name: str, model_type: ModelType,
-                      model_name: str, config: Optional[Dict[str, Any]] = None) -> BaseService:
-        """Create a service instance with provider-managed configuration"""
-        try:
-            cache_key = f"{provider_name}_{model_type}_{model_name}"
-            if cache_key in self._cached_services:
-                return self._cached_services[cache_key]
-            # Get provider and service classes
-            provider_class = self._providers.get(provider_name)
-            service_class = self._services.get((provider_name, model_type))
-            if not provider_class:
-                raise ValueError(f"No provider registered for '{provider_name}'")
-            if not service_class:
-                raise ValueError(
-                    f"No service registered for provider '{provider_name}' and model type '{model_type}'"
-                )
-            # Create provider with user config (provider handles .env loading)
-            provider = provider_class(config=config)
-            service = service_class(provider=provider, model_name=model_name)
-            self._cached_services[cache_key] = service
-            return service
-        except Exception as e:
-            logger.error(f"Error creating service: {e}")
-            raise
+            logger.info("AI Factory initialized with centralized ModelManager and ConfigManager")
+            AIFactory._is_initialized = True
-    # Convenient methods for common services with updated defaults
-    def get_llm_service(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                       config: Optional[Dict[str, Any]] = None) -> BaseService:
+    # Core service methods using centralized architecture
+    def get_llm(self, model_name: Optional[str] = None, provider: Optional[str] = None,
+                config: Optional[Dict[str, Any]] = None) -> BaseService:
         """
         Get a LLM service instance with automatic defaults
         Args:
-            model_name: Name of the model to use (defaults: OpenAI="gpt-4.1-nano", Ollama="llama3.2:3b", YYDS="claude-sonnet-4-20250514")
+            model_name: Name of the model to use (defaults: OpenAI="gpt-4.1-mini", Ollama="llama3.2:3b", YYDS="claude-sonnet-4-20250514")
             provider: Provider name (defaults to 'openai' for production, 'ollama' for dev)
-            config: Optional configuration dictionary (auto-loads from .env if not provided)
-                   Can include: streaming=True/False, temperature, max_tokens, etc.
+            config: Optional configuration dictionary
         Returns:
             LLM service instance
         """
         # Set defaults based on provider
         if provider == "openai":
-            final_model_name = model_name or "gpt-4.1-nano"
+            final_model_name = model_name or "gpt-4.1-mini"
             final_provider = provider
         elif provider == "ollama":
             final_model_name = model_name or "llama3.2:3b-instruct-fp16"
@@ -227,137 +73,99 @@ class AIFactory:
             # Default provider selection - OpenAI with cheapest model
             final_provider = provider or "openai"
             if final_provider == "openai":
-                final_model_name = model_name or "gpt-4.1-nano"
-            else:
+                final_model_name = model_name or "gpt-4.1-mini"
+            elif final_provider == "ollama":
                 final_model_name = model_name or "llama3.2:3b-instruct-fp16"
+            else:
+                final_model_name = model_name or "gpt-4.1-mini"
-        return self.create_service(final_provider, ModelType.LLM, final_model_name, config)
-    def get_embedding_service(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                             config: Optional[Dict[str, Any]] = None) -> BaseService:
-        """
-        Get an embedding service instance with automatic defaults
-        Args:
-            model_name: Name of the model to use (defaults: OpenAI="text-embedding-3-small", Ollama="bge-m3")
-            provider: Provider name (defaults to 'openai' for production, 'ollama' for dev)
-            config: Optional configuration dictionary (auto-loads from .env if not provided)
-        Returns:
-            Embedding service instance
-        """
-        # Set defaults based on provider
-        if provider == "openai":
-            final_model_name = model_name or "text-embedding-3-small"
-            final_provider = provider
-        elif provider == "ollama":
-            final_model_name = model_name or "bge-m3"
-            final_provider = provider
-        else:
-            # Default provider selection
-            final_provider = provider or "openai"
+        # Create service using new centralized approach
+        try:
             if final_provider == "openai":
-                final_model_name = model_name or "text-embedding-3-small"
+                from isa_model.inference.services.llm.openai_llm_service import OpenAILLMService
+                return OpenAILLMService(provider_name=final_provider, model_name=final_model_name,
+                                      model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "ollama":
+                from isa_model.inference.services.llm.ollama_llm_service import OllamaLLMService
+                return OllamaLLMService(provider_name=final_provider, model_name=final_model_name,
+                                      model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "yyds":
+                from isa_model.inference.services.llm.yyds_llm_service import YydsLLMService
+                return YydsLLMService(provider_name=final_provider, model_name=final_model_name,
+                                    model_manager=self.model_manager, config_manager=self.config_manager)
             else:
-                final_model_name = model_name or "bge-m3"
-        return self.create_service(final_provider, ModelType.EMBEDDING, final_model_name, config)
+                raise ValueError(f"Unsupported LLM provider: {final_provider}")
+        except Exception as e:
+            logger.error(f"Failed to create LLM service: {e}")
+            raise
-    def get_vision_service(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                          config: Optional[Dict[str, Any]] = None) -> BaseVisionService:
+    def get_vision(
+        self,
+        model_name: Optional[str] = None,
+        provider: Optional[str] = None,
+        config: Optional[Dict[str, Any]] = None
+    ) -> 'BaseVisionService':
         """
-        Get a vision service instance with automatic defaults
+        Get vision service with automatic defaults
         Args:
-            model_name: Name of the model to use (defaults: OpenAI="gpt-4.1-mini", Ollama="gemma3:4b")
-            provider: Provider name (defaults to 'openai' for production, 'ollama' for dev)
-            config: Optional configuration dictionary (auto-loads from .env if not provided)
+            model_name: Model name. Special names:
+                       - "isa_vision_table": Table extraction service
+                       - "isa_vision_ui": UI detection service
+                       - "isa_vision_doc": Document analysis service
+                       - Default: "gpt-4.1-mini"
+            provider: Provider name (auto-detected for ISA services)
+            config: Optional configuration override
         Returns:
             Vision service instance
         """
-        # Set defaults based on provider
+        # Handle special ISA vision services
+        if model_name in ["isa_vision_table", "isa_vision_ui", "isa_vision_doc"]:
+            try:
+                from isa_model.deployment.services.simple_auto_deploy_vision_service import SimpleAutoDeployVisionService
+                logger.info(f"Creating auto-deploy service wrapper for {model_name}")
+                return SimpleAutoDeployVisionService(model_name, config)
+            except Exception as e:
+                logger.error(f"Failed to create ISA vision service: {e}")
+                raise
+        # Set defaults for regular services
         if provider == "openai":
             final_model_name = model_name or "gpt-4.1-mini"
             final_provider = provider
         elif provider == "ollama":
             final_model_name = model_name or "llama3.2-vision:latest"
             final_provider = provider
+        elif provider == "replicate":
+            final_model_name = model_name or "meta/llama-2-70b-chat"
+            final_provider = provider
         else:
             # Default provider selection
             final_provider = provider or "openai"
             if final_provider == "openai":
                 final_model_name = model_name or "gpt-4.1-mini"
-            else:
+            elif final_provider == "ollama":
                 final_model_name = model_name or "llama3.2-vision:latest"
+            else:
+                final_model_name = model_name or "gpt-4.1-mini"
-        return cast(BaseVisionService, self.create_service(final_provider, ModelType.VISION, final_model_name, config))
-    def get_image_gen(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                     config: Optional[Dict[str, Any]] = None) -> 'BaseImageGenService':
-        """
-        Get an image generation service instance with automatic defaults
-        Args:
-            model_name: Name of the model to use. Supports:
-                - FLUX models: "flux-pro", "flux-schnell", "flux-dev"
-                - ControlNet: "flux-controlnet", "xlabs-ai/flux-dev-controlnet"
-                - LoRA: "flux-lora", "flux-dev-lora"
-                - InstantID: "instant-id", "zsxkib/instant-id"
-                - Character: "consistent-character", "fofr/consistent-character"
-                - Upscaling: "ultimate-upscaler", "ultimate-sd-upscale"
-                - Detail: "adetailer"
-            provider: Provider name (defaults to 'replicate')
-            config: Optional configuration dictionary
-        Returns:
-            Image generation service instance with FLUX, ControlNet, LoRA, InstantID, Upscaling support
-        """
-        # Set defaults based on provider
-        final_provider = provider or "replicate"
-        # Default model selection
-        if not model_name:
-            final_model_name = "black-forest-labs/flux-schnell"
-        else:
-            # Map short names to full Replicate model names
-            model_mapping = {
-                "flux-pro": "black-forest-labs/flux-pro",
-                "flux-schnell": "black-forest-labs/flux-schnell",
-                "flux-dev": "black-forest-labs/flux-dev",
-                "flux-controlnet": "xlabs-ai/flux-dev-controlnet",
-                "flux-lora": "xlabs-ai/flux-lora",
-                "instant-id": "zsxkib/instant-id",
-                "consistent-character": "fofr/consistent-character",
-                "ultimate-upscaler": "philz1337x/clarity-upscaler",
-                "ultimate-sd-upscale": "philz1337x/clarity-upscaler",
-                "adetailer": "sczhou/codeformer"
-            }
-            final_model_name = model_mapping.get(model_name, model_name)
-        # Create ReplicateImageGenService directly for image generation
+        # Create service using new centralized approach
         try:
-            from isa_model.inference.services.vision.replicate_image_gen_service import ReplicateImageGenService
-            from isa_model.inference.providers.replicate_provider import ReplicateProvider
-            # Create provider with config
-            provider_instance = ReplicateProvider(config=config)
-            service = ReplicateImageGenService(provider=provider_instance, model_name=final_model_name)
-            return service
-        except ImportError as e:
-            logger.error(f"Failed to import ReplicateImageGenService: {e}")
-            raise ValueError(f"Image generation service not available: {e}")
+            if final_provider == "openai":
+                from isa_model.inference.services.vision.openai_vision_service import OpenAIVisionService
+                return OpenAIVisionService(provider_name=final_provider, model_name=final_model_name,
+                                         model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "replicate":
+                from isa_model.inference.services.vision.replicate_vision_service import ReplicateVisionService
+                return ReplicateVisionService(provider_name=final_provider, model_name=final_model_name,
+                                            model_manager=self.model_manager, config_manager=self.config_manager)
+            else:
+                raise ValueError(f"Unsupported vision provider: {final_provider}")
         except Exception as e:
-            logger.error(f"Failed to create image generation service: {e}")
+            logger.error(f"Failed to create vision service: {e}")
             raise
-    def get_image_generation_service(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                                   config: Optional[Dict[str, Any]] = None) -> 'BaseImageGenService':
-        """Alias for get_image_gen() method"""
-        return self.get_image_gen(model_name, provider, config)
     def get_img(self, type: str = "t2i", model_name: Optional[str] = None, provider: Optional[str] = None,
                 config: Optional[Dict[str, Any]] = None) -> 'BaseImageGenService':
         """
@@ -397,112 +205,138 @@ class AIFactory:
         else:
             raise ValueError(f"Unknown image generation type: {type}. Use 't2i' or 'i2i'")
-        # Use the new get_image_gen method
-        return self.get_image_gen(final_model_name, final_provider, config)
-    def get_audio_service(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                         config: Optional[Dict[str, Any]] = None) -> BaseService:
+        # Create service using new centralized architecture
+        try:
+            if final_provider == "replicate":
+                from isa_model.inference.services.img.replicate_image_gen_service import ReplicateImageGenService
+                return ReplicateImageGenService(provider_name=final_provider, model_name=final_model_name,
+                                              model_manager=self.model_manager, config_manager=self.config_manager)
+            else:
+                raise ValueError(f"Unsupported image generation provider: {final_provider}")
+        except Exception as e:
+            logger.error(f"Failed to create image generation service: {e}")
+            raise
+    def get_stt(self, model_name: Optional[str] = None, provider: Optional[str] = None,
+                config: Optional[Dict[str, Any]] = None) -> 'BaseSTTService':
         """
-        Get an audio service instance (TTS) with automatic defaults
+        Get Speech-to-Text service with automatic defaults
         Args:
-            model_name: Name of the model to use (defaults: OpenAI="tts-1")
+            model_name: Name of the model to use (defaults: "whisper-1")
             provider: Provider name (defaults to 'openai')
-            config: Optional configuration dictionary (auto-loads from .env if not provided)
+            config: Optional configuration dictionary
         Returns:
-            Audio service instance
+            STT service instance
         """
-        # Set defaults based on provider
+        # Set defaults
         final_provider = provider or "openai"
-        if final_provider == "openai":
-            final_model_name = model_name or "tts-1"
-        else:
-            final_model_name = model_name or "tts-1"
+        final_model_name = model_name or "whisper-1"
-        return self.create_service(final_provider, ModelType.AUDIO, final_model_name, config)
-    def get_tts_service(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                       config: Optional[Dict[str, Any]] = None) -> 'BaseTTSService':
+        # Create service using new centralized approach
+        try:
+            if final_provider == "openai":
+                from isa_model.inference.services.audio.openai_stt_service import OpenAISTTService
+                return OpenAISTTService(provider_name=final_provider, model_name=final_model_name,
+                                      model_manager=self.model_manager, config_manager=self.config_manager)
+            else:
+                raise ValueError(f"Unsupported STT provider: {final_provider}")
+        except Exception as e:
+            logger.error(f"Failed to create STT service: {e}")
+            raise
+    def get_tts(self, model_name: Optional[str] = None, provider: Optional[str] = None,
+                config: Optional[Dict[str, Any]] = None) -> 'BaseTTSService':
         """
-        Get a Text-to-Speech service instance with automatic defaults
+        Get Text-to-Speech service with automatic defaults
         Args:
             model_name: Name of the model to use (defaults: Replicate="kokoro-82m", OpenAI="tts-1")
             provider: Provider name (defaults to 'replicate' for production, 'openai' for dev)
-            config: Optional configuration dictionary (auto-loads from .env if not provided)
+            config: Optional configuration dictionary
         Returns:
             TTS service instance
         """
         # Set defaults based on provider
         if provider == "replicate":
-            model_name = model_name or "kokoro-82m"
+            final_model_name = model_name or "kokoro-82m"
+            final_provider = provider
         elif provider == "openai":
-            model_name = model_name or "tts-1"
+            final_model_name = model_name or "tts-1"
+            final_provider = provider
         else:
             # Default provider selection
-            provider = provider or "replicate"
-            if provider == "replicate":
-                model_name = model_name or "kokoro-82m"
+            final_provider = provider or "replicate"
+            if final_provider == "replicate":
+                final_model_name = model_name or "kokoro-82m"
             else:
-                model_name = model_name or "tts-1"
-        # Ensure model_name is never None
-        if model_name is None:
-            model_name = "tts-1"
+                final_model_name = model_name or "tts-1"
-        if provider == "replicate":
-            from isa_model.inference.services.audio.replicate_tts_service import ReplicateTTSService
-            from isa_model.inference.providers.replicate_provider import ReplicateProvider
-            # Use full model name for Replicate
-            if model_name == "kokoro-82m":
-                model_name = "jaaari/kokoro-82m:f559560eb822dc509045f3921a1921234918b91739db4bf3daab2169b71c7a13"
-            provider_instance = ReplicateProvider(config=config)
-            return ReplicateTTSService(provider=provider_instance, model_name=model_name)
-        else:
-            return cast('BaseTTSService', self.get_audio_service(model_name, provider, config))
+        # Create service using new centralized approach
+        try:
+            if final_provider == "replicate":
+                from isa_model.inference.services.audio.replicate_tts_service import ReplicateTTSService
+                # Use full model name for Replicate
+                if final_model_name == "kokoro-82m":
+                    final_model_name = "jaaari/kokoro-82m:f559560eb822dc509045f3921a1921234918b91739db4bf3daab2169b71c7a13"
+                return ReplicateTTSService(provider_name=final_provider, model_name=final_model_name,
+                                         model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "openai":
+                from isa_model.inference.services.audio.openai_tts_service import OpenAITTSService
+                return OpenAITTSService(provider_name=final_provider, model_name=final_model_name,
+                                      model_manager=self.model_manager, config_manager=self.config_manager)
+            else:
+                raise ValueError(f"Unsupported TTS provider: {final_provider}")
+        except Exception as e:
+            logger.error(f"Failed to create TTS service: {e}")
+            raise
-    def get_stt_service(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                       config: Optional[Dict[str, Any]] = None) -> 'BaseSTTService':
+    def get_embed(self, model_name: Optional[str] = None, provider: Optional[str] = None,
+                     config: Optional[Dict[str, Any]] = None) -> BaseService:
         """
-        Get a Speech-to-Text service instance with automatic defaults
+        Get embedding service with automatic defaults
         Args:
-            model_name: Name of the model to use (defaults: "whisper-1")
-            provider: Provider name (defaults to 'openai')
-            config: Optional configuration dictionary (auto-loads from .env if not provided)
+            model_name: Name of the model to use (defaults: OpenAI="text-embedding-3-small", Ollama="bge-m3")
+            provider: Provider name (defaults to 'openai' for production)
+            config: Optional configuration dictionary
         Returns:
-            STT service instance
+            Embedding service instance
         """
         # Set defaults based on provider
-        provider = provider or "openai"
         if provider == "openai":
-            model_name = model_name or "whisper-1"
-        # Ensure model_name is never None
-        if model_name is None:
-            model_name = "whisper-1"
-        from isa_model.inference.services.audio.openai_stt_service import OpenAISTTService
-        from isa_model.inference.providers.openai_provider import OpenAIProvider
+            final_model_name = model_name or "text-embedding-3-small"
+            final_provider = provider
+        elif provider == "ollama":
+            final_model_name = model_name or "bge-m3"
+            final_provider = provider
+        else:
+            # Default provider selection
+            final_provider = provider or "openai"
+            if final_provider == "openai":
+                final_model_name = model_name or "text-embedding-3-small"
+            else:
+                final_model_name = model_name or "bge-m3"
-        # Create provider and service directly with config
-        provider_instance = OpenAIProvider(config=config)
-        return OpenAISTTService(provider=provider_instance, model_name=model_name)
-    def get_available_services(self) -> Dict[str, List[str]]:
-        """Get information about available services"""
-        services = {}
-        for (provider, model_type), service_class in self._services.items():
-            if provider not in services:
-                services[provider] = []
-            services[provider].append(f"{model_type.value}: {service_class.__name__}")
-        return services
+        # Create service using new centralized approach
+        try:
+            if final_provider == "openai":
+                from isa_model.inference.services.embedding.openai_embed_service import OpenAIEmbedService
+                return OpenAIEmbedService(provider_name=final_provider, model_name=final_model_name,
+                                        model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "ollama":
+                from isa_model.inference.services.embedding.ollama_embed_service import OllamaEmbedService
+                return OllamaEmbedService(provider_name=final_provider, model_name=final_model_name,
+                                        model_manager=self.model_manager, config_manager=self.config_manager)
+            else:
+                raise ValueError(f"Unsupported embedding provider: {final_provider}")
+        except Exception as e:
+            logger.error(f"Failed to create embedding service: {e}")
+            raise
     def clear_cache(self):
         """Clear the service cache"""
         self._cached_services.clear()
@@ -515,260 +349,82 @@ class AIFactory:
             cls._instance = cls()
         return cls._instance
-    # Alias method for cleaner API
-    def get_llm(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                config: Optional[Dict[str, Any]] = None) -> BaseService:
-        """
-        Alias for get_llm_service with cleaner naming
-        Usage:
-            llm = AIFactory().get_llm()  # Uses gpt-4.1-nano by default
-            llm = AIFactory().get_llm(model_name="llama3.2", provider="ollama")
-            llm = AIFactory().get_llm(provider="yyds")  # Uses claude-sonnet-4-20250514 by default
-            llm = AIFactory().get_llm(model_name="gpt-4.1-mini", provider="openai", config={"streaming": True})
-        """
-        return self.get_llm_service(model_name, provider, config)
-    def get_embed(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                     config: Optional[Dict[str, Any]] = None) -> BaseService:
-        """
-        Get embedding service with automatic defaults
-        Args:
-            model_name: Name of the model to use (defaults: OpenAI="text-embedding-3-small", Ollama="bge-m3")
-            provider: Provider name (defaults to 'openai' for production)
-            config: Optional configuration dictionary (auto-loads from .env if not provided)
-        Returns:
-            Embedding service instance
-        Usage:
-            # Default (OpenAI text-embedding-3-small)
-            embed = AIFactory().get_embed()
-            # Custom model
-            embed = AIFactory().get_embed(model_name="text-embedding-3-large", provider="openai")
-            # Development (Ollama)
-            embed = AIFactory().get_embed(provider="ollama")
-        """
-        return self.get_embedding_service(model_name, provider, config)
-    def get_stt(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                config: Optional[Dict[str, Any]] = None) -> 'BaseSTTService':
-        """
-        Get Speech-to-Text service with automatic defaults
-        Args:
-            model_name: Name of the model to use (defaults: "whisper-1")
-            provider: Provider name (defaults to 'openai')
-            config: Optional configuration dictionary (auto-loads from .env if not provided)
-        Returns:
-            STT service instance
-        Usage:
-            # Default (OpenAI whisper-1)
-            stt = AIFactory().get_stt()
-            # Custom configuration
-            stt = AIFactory().get_stt(model_name="whisper-1", provider="openai")
-        """
-        return self.get_stt_service(model_name, provider, config)
-    def get_tts(self, model_name: Optional[str] = None, provider: Optional[str] = None,
-                config: Optional[Dict[str, Any]] = None) -> 'BaseTTSService':
-        """
-        Get Text-to-Speech service with automatic defaults
-        Args:
-            model_name: Name of the model to use (defaults: Replicate="kokoro-82m", OpenAI="tts-1")
-            provider: Provider name (defaults to 'replicate' for production, 'openai' for dev)
-            config: Optional configuration dictionary (auto-loads from .env if not provided)
-        Returns:
-            TTS service instance
-        Usage:
-            # Default (Replicate kokoro-82m)
-            tts = AIFactory().get_tts()
-            # Development (OpenAI tts-1)
-            tts = AIFactory().get_tts(provider="openai")
-            # Custom model
-            tts = AIFactory().get_tts(model_name="tts-1-hd", provider="openai")
-        """
-        return self.get_tts_service(model_name, provider, config)
-    def get_vision_model(self, model_name: str, provider: str,
-                        config: Optional[Dict[str, Any]] = None) -> BaseService:
-        """Alias for get_vision_service and get_image_generation_service"""
-        if provider == "replicate":
-            return self.get_image_generation_service(model_name, provider, config)
-        else:
-            return self.get_vision_service(model_name, provider, config)
-    def get_vision(
-        self,
-        model_name: Optional[str] = None,
-        provider: Optional[str] = None,
-        config: Optional[Dict[str, Any]] = None
-    ) -> 'BaseVisionService':
-        """
-        Get vision service with automatic defaults
-        Args:
-            model_name: Model name (default: gpt-4.1-nano)
-            provider: Provider name (default: openai)
-            config: Optional configuration override
-        Returns:
-            Vision service instance
-        """
-        # Set defaults
-        if provider is None:
-            provider = "openai"
-        if model_name is None:
-            model_name = "gpt-4.1-nano"
-        return self.get_vision_service(
-            model_name=model_name,
-            provider=provider,
-            config=config
-        )
-    def get_provider(self, provider_name: str, config: Optional[Dict[str, Any]] = None) -> BaseProvider:
-        """
-        Get a provider instance
-        Args:
-            provider_name: Name of the provider ('openai', 'ollama', 'replicate')
-            config: Optional configuration override
-        Returns:
-            Provider instance
-        """
-        if provider_name not in self._providers:
-            raise ValueError(f"No provider registered for '{provider_name}'")
-        provider_class = self._providers[provider_name]
-        return provider_class(config=config)
-    def get_stacked(
-        self,
-        service_name: str,
-        config: Optional[Dict[str, Any]] = None
-    ) -> BaseStackedService:
-        """
-        Get a stacked service by name with automatic defaults
-        Args:
-            service_name: Name of the stacked service ('ui_analysis', etc.)
-            config: Optional configuration override
-        Returns:
-            Stacked service instance
-        Usage:
-            ui_service = AIFactory().get_stacked("ui_analysis", {"task_type": "search"})
-        """
-        if service_name == "ui_analysis":
-            return UIAnalysisService(self, config)
-        elif service_name == "search_analysis":
-            if config is None:
-                config = {}
-            config["task_type"] = "search"
-            return UIAnalysisService(self, config)
-        elif service_name == "content_analysis":
-            if config is None:
-                config = {}
-            config["task_type"] = "content"
-            return UIAnalysisService(self, config)
-        elif service_name == "navigation_analysis":
-            if config is None:
-                config = {}
-            config["task_type"] = "navigation"
-            return UIAnalysisService(self, config)
-        elif service_name == "doc_analysis":
-            return DocAnalysisStackedService(self, config)
-        elif service_name == "flux_professional":
-            return FluxProfessionalService(self)
-        else:
-            raise ValueError(f"Unknown stacked service: {service_name}. Available: ui_analysis, search_analysis, content_analysis, navigation_analysis, doc_analysis, flux_professional")
-    def get_ui_analysis(
-        self,
-        task_type: str = "login",
-        config: Optional[Dict[str, Any]] = None
-    ) -> UIAnalysisService:
-        """
-        Get UI Analysis service with task-specific configuration
-        Args:
-            task_type: Type of UI task ('login', 'search', 'content', 'navigation')
-            config: Optional configuration override
-        Usage:
-            # For login pages (default)
-            ui_service = AIFactory().get_ui_analysis()
-            # For search pages
-            ui_service = AIFactory().get_ui_analysis(task_type="search")
-            # For content extraction
-            ui_service = AIFactory().get_ui_analysis(task_type="content")
-        """
-        if config is None:
-            config = {}
-        config["task_type"] = task_type
-        return cast(UIAnalysisService, self.get_stacked("ui_analysis", config))
-    def get_doc_analysis(
-        self,
-        config: Optional[Dict[str, Any]] = None
-    ) -> DocAnalysisStackedService:
-        """
-        Get Document Analysis service with 5-step pipeline
-        Args:
-            config: Optional configuration override
-        Usage:
-            # Basic document analysis
-            doc_service = AIFactory().get_doc_analysis()
-            # Analyze a document image
-            result = await doc_service.analyze_document("document.png")
-            # Get structured data ready for business mapping
-            structured_data = result["final_output"]["final_structured_data"]
-        """
-        return cast(DocAnalysisStackedService, self.get_stacked("doc_analysis", config))
+    # Modal service deployment methods for AutoDeployVisionService
+    def _get_modal_app_name(self, model_name: str) -> str:
+        """Get Modal app name for a given model"""
+        app_mapping = {
+            "isa_vision_table": "qwen-vision-table",
+            "isa_vision_ui": "isa-vision-ui",
+            "isa_vision_doc": "isa-vision-doc"
+        }
+        return app_mapping.get(model_name, f"unknown-{model_name}")
+    def _check_modal_service_availability(self, app_name: str) -> bool:
+        """Check if Modal service is available and running"""
+        try:
+            import modal
+            # Try to lookup the app
+            app = modal.App.lookup(app_name)
+            return True
+        except Exception as e:
+            logger.debug(f"Modal service {app_name} not available: {e}")
+            return False
-    def get_flux_professional(
-        self,
-        config: Optional[Dict[str, Any]] = None
-    ) -> FluxProfessionalService:
-        """
-        Get FLUX Professional Pipeline service for multi-stage image generation
-        Args:
-            config: Optional configuration override
-        Usage:
-            # Basic professional image generation
-            flux_service = AIFactory().get_flux_professional()
-            # Generate professional image with character consistency
-            result = await flux_service.invoke({
-                "prompt": "portrait of a warrior in fantasy armor",
-                "face_image": "reference_face.jpg",  # For character consistency
-                "lora_style": "realism",
-                "upscale_factor": 4
-            })
+    def _auto_deploy_modal_service(self, model_name: str) -> bool:
+        """Auto-deploy Modal service for given model"""
+        try:
+            import subprocess
+            import os
+            from pathlib import Path
+            # Get the Modal service file path
+            service_files = {
+                "isa_vision_table": "isa_vision_table_service.py",
+                "isa_vision_ui": "isa_vision_ui_service.py",
+                "isa_vision_doc": "isa_vision_doc_service.py"
+            }
-            # Get final high-quality image
-            final_image_url = result["final_output"]["image_url"]
-        """
-        return cast(FluxProfessionalService, self.get_stacked("flux_professional", config))
+            if model_name not in service_files:
+                logger.error(f"No Modal service file found for {model_name}")
+                return False
+            # Get the service file path
+            service_file = service_files[model_name]
+            modal_dir = Path(__file__).parent.parent / "deployment" / "cloud" / "modal"
+            service_path = modal_dir / service_file
+            if not service_path.exists():
+                logger.error(f"Modal service file not found: {service_path}")
+                return False
+            logger.info(f"Deploying Modal service: {service_file}")
+            # Run modal deploy command
+            result = subprocess.run(
+                ["modal", "deploy", str(service_path)],
+                capture_output=True,
+                text=True,
+                timeout=600,  # 10 minute timeout
+                cwd=str(modal_dir)
+            )
+            if result.returncode == 0:
+                logger.info(f"Successfully deployed {model_name} Modal service")
+                return True
+            else:
+                logger.error(f"Failed to deploy {model_name}: {result.stderr}")
+                return False
+        except subprocess.TimeoutExpired:
+            logger.error(f"Deployment timeout for {model_name}")
+            return False
+        except Exception as e:
+            logger.error(f"Exception during {model_name} deployment: {e}")
+            return False
+    def _shutdown_modal_service(self, model_name: str):
+        """Shutdown Modal service (optional - Modal handles auto-scaling)"""
+        # Modal services auto-scale to zero, so explicit shutdown isn't required
+        # This method is here for compatibility with AutoDeployVisionService
+        logger.info(f"Modal service {model_name} will auto-scale to zero when idle")
+        pass

isa-model 0.3.5__py3-none-any.whl → 0.3.7__py3-none-any.whl

isa-model 0.3.5py3-none-any.whl → 0.3.7py3-none-any.whl