PyPI - isa-model - Versions diffs - 0.3.91__py3-none-any.whl → 0.4.3__py3-none-any.whl - Mend

isa-model 0.3.91py3-none-any.whl → 0.4.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (228) hide show

isa_model/client.py +1166 -584
isa_model/core/cache/redis_cache.py +410 -0
isa_model/core/config/config_manager.py +282 -12
isa_model/core/config.py +91 -1
isa_model/core/database/__init__.py +1 -0
isa_model/core/database/direct_db_client.py +114 -0
isa_model/core/database/migration_manager.py +563 -0
isa_model/core/database/migrations.py +297 -0
isa_model/core/database/supabase_client.py +258 -0
isa_model/core/dependencies.py +316 -0
isa_model/core/discovery/__init__.py +19 -0
isa_model/core/discovery/consul_discovery.py +190 -0
isa_model/core/logging/__init__.py +54 -0
isa_model/core/logging/influx_logger.py +523 -0
isa_model/core/logging/loki_logger.py +160 -0
isa_model/core/models/__init__.py +46 -0
isa_model/core/models/config_models.py +625 -0
isa_model/core/models/deployment_billing_tracker.py +430 -0
isa_model/core/models/model_billing_tracker.py +60 -88
isa_model/core/models/model_manager.py +66 -25
isa_model/core/models/model_metadata.py +690 -0
isa_model/core/models/model_repo.py +217 -55
isa_model/core/models/model_statistics_tracker.py +234 -0
isa_model/core/models/model_storage.py +0 -1
isa_model/core/models/model_version_manager.py +959 -0
isa_model/core/models/system_models.py +857 -0
isa_model/core/pricing_manager.py +2 -249
isa_model/core/repositories/__init__.py +9 -0
isa_model/core/repositories/config_repository.py +912 -0
isa_model/core/resilience/circuit_breaker.py +366 -0
isa_model/core/security/secrets.py +358 -0
isa_model/core/services/__init__.py +2 -4
isa_model/core/services/intelligent_model_selector.py +479 -370
isa_model/core/storage/hf_storage.py +2 -2
isa_model/core/types.py +8 -0
isa_model/deployment/__init__.py +5 -48
isa_model/deployment/core/__init__.py +2 -31
isa_model/deployment/core/deployment_manager.py +1278 -368
isa_model/deployment/local/__init__.py +31 -0
isa_model/deployment/local/config.py +248 -0
isa_model/deployment/local/gpu_gateway.py +607 -0
isa_model/deployment/local/health_checker.py +428 -0
isa_model/deployment/local/provider.py +586 -0
isa_model/deployment/local/tensorrt_service.py +621 -0
isa_model/deployment/local/transformers_service.py +644 -0
isa_model/deployment/local/vllm_service.py +527 -0
isa_model/deployment/modal/__init__.py +8 -0
isa_model/deployment/modal/config.py +136 -0
isa_model/deployment/modal/deployer.py +894 -0
isa_model/deployment/modal/services/__init__.py +3 -0
isa_model/deployment/modal/services/audio/__init__.py +1 -0
isa_model/deployment/modal/services/audio/isa_audio_chatTTS_service.py +520 -0
isa_model/deployment/modal/services/audio/isa_audio_openvoice_service.py +758 -0
isa_model/deployment/modal/services/audio/isa_audio_service_v2.py +1044 -0
isa_model/deployment/modal/services/embedding/__init__.py +1 -0
isa_model/deployment/modal/services/embedding/isa_embed_rerank_service.py +296 -0
isa_model/deployment/modal/services/llm/__init__.py +1 -0
isa_model/deployment/modal/services/llm/isa_llm_service.py +424 -0
isa_model/deployment/modal/services/video/__init__.py +1 -0
isa_model/deployment/modal/services/video/isa_video_hunyuan_service.py +423 -0
isa_model/deployment/modal/services/vision/__init__.py +1 -0
isa_model/deployment/modal/services/vision/isa_vision_ocr_service.py +519 -0
isa_model/deployment/modal/services/vision/isa_vision_qwen25_service.py +709 -0
isa_model/deployment/modal/services/vision/isa_vision_table_service.py +676 -0
isa_model/deployment/modal/services/vision/isa_vision_ui_service.py +833 -0
isa_model/deployment/modal/services/vision/isa_vision_ui_service_optimized.py +660 -0
isa_model/deployment/models/org-org-acme-corp-tenant-a-service-llm-20250825-225822/tenant-a-service_modal_service.py +48 -0
isa_model/deployment/models/org-test-org-123-prefix-test-service-llm-20250825-225822/prefix-test-service_modal_service.py +48 -0
isa_model/deployment/models/test-llm-service-llm-20250825-204442/test-llm-service_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-212906/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-213009/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/storage/__init__.py +5 -0
isa_model/deployment/storage/deployment_repository.py +824 -0
isa_model/deployment/triton/__init__.py +10 -0
isa_model/deployment/triton/config.py +196 -0
isa_model/deployment/triton/configs/__init__.py +1 -0
isa_model/deployment/triton/provider.py +512 -0
isa_model/deployment/triton/scripts/__init__.py +1 -0
isa_model/deployment/triton/templates/__init__.py +1 -0
isa_model/inference/__init__.py +47 -1
isa_model/inference/ai_factory.py +179 -16
isa_model/inference/legacy_services/__init__.py +21 -0
isa_model/inference/legacy_services/model_evaluation.py +637 -0
isa_model/inference/legacy_services/model_service.py +573 -0
isa_model/inference/legacy_services/model_serving.py +717 -0
isa_model/inference/legacy_services/model_training.py +561 -0
isa_model/inference/models/__init__.py +21 -0
isa_model/inference/models/inference_config.py +551 -0
isa_model/inference/models/inference_record.py +675 -0
isa_model/inference/models/performance_models.py +714 -0
isa_model/inference/repositories/__init__.py +9 -0
isa_model/inference/repositories/inference_repository.py +828 -0
isa_model/inference/services/audio/__init__.py +21 -0
isa_model/inference/services/audio/base_realtime_service.py +225 -0
isa_model/inference/services/audio/base_stt_service.py +184 -11
isa_model/inference/services/audio/isa_tts_service.py +0 -0
isa_model/inference/services/audio/openai_realtime_service.py +320 -124
isa_model/inference/services/audio/openai_stt_service.py +53 -11
isa_model/inference/services/base_service.py +17 -1
isa_model/inference/services/custom_model_manager.py +277 -0
isa_model/inference/services/embedding/__init__.py +13 -0
isa_model/inference/services/embedding/base_embed_service.py +111 -8
isa_model/inference/services/embedding/isa_embed_service.py +305 -0
isa_model/inference/services/embedding/ollama_embed_service.py +15 -3
isa_model/inference/services/embedding/openai_embed_service.py +2 -4
isa_model/inference/services/embedding/resilient_embed_service.py +285 -0
isa_model/inference/services/embedding/tests/test_embedding.py +222 -0
isa_model/inference/services/img/__init__.py +2 -2
isa_model/inference/services/img/base_image_gen_service.py +24 -7
isa_model/inference/services/img/replicate_image_gen_service.py +84 -422
isa_model/inference/services/img/services/replicate_face_swap.py +193 -0
isa_model/inference/services/img/services/replicate_flux.py +226 -0
isa_model/inference/services/img/services/replicate_flux_kontext.py +219 -0
isa_model/inference/services/img/services/replicate_sticker_maker.py +249 -0
isa_model/inference/services/img/tests/test_img_client.py +297 -0
isa_model/inference/services/llm/__init__.py +10 -2
isa_model/inference/services/llm/base_llm_service.py +361 -26
isa_model/inference/services/llm/cerebras_llm_service.py +628 -0
isa_model/inference/services/llm/helpers/llm_adapter.py +71 -12
isa_model/inference/services/llm/helpers/llm_prompts.py +342 -0
isa_model/inference/services/llm/helpers/llm_utils.py +321 -23
isa_model/inference/services/llm/huggingface_llm_service.py +581 -0
isa_model/inference/services/llm/local_llm_service.py +747 -0
isa_model/inference/services/llm/ollama_llm_service.py +11 -3
isa_model/inference/services/llm/openai_llm_service.py +670 -56
isa_model/inference/services/llm/yyds_llm_service.py +10 -3
isa_model/inference/services/vision/__init__.py +27 -6
isa_model/inference/services/vision/base_vision_service.py +118 -185
isa_model/inference/services/vision/blip_vision_service.py +359 -0
isa_model/inference/services/vision/helpers/image_utils.py +19 -10
isa_model/inference/services/vision/isa_vision_service.py +634 -0
isa_model/inference/services/vision/openai_vision_service.py +19 -10
isa_model/inference/services/vision/tests/test_ocr_client.py +284 -0
isa_model/inference/services/vision/vgg16_vision_service.py +257 -0
isa_model/serving/api/cache_manager.py +245 -0
isa_model/serving/api/dependencies/__init__.py +1 -0
isa_model/serving/api/dependencies/auth.py +194 -0
isa_model/serving/api/dependencies/database.py +139 -0
isa_model/serving/api/error_handlers.py +284 -0
isa_model/serving/api/fastapi_server.py +240 -18
isa_model/serving/api/middleware/auth.py +317 -0
isa_model/serving/api/middleware/security.py +268 -0
isa_model/serving/api/middleware/tenant_context.py +414 -0
isa_model/serving/api/routes/analytics.py +489 -0
isa_model/serving/api/routes/config.py +645 -0
isa_model/serving/api/routes/deployment_billing.py +315 -0
isa_model/serving/api/routes/deployments.py +475 -0
isa_model/serving/api/routes/gpu_gateway.py +440 -0
isa_model/serving/api/routes/health.py +32 -12
isa_model/serving/api/routes/inference_monitoring.py +486 -0
isa_model/serving/api/routes/local_deployments.py +448 -0
isa_model/serving/api/routes/logs.py +430 -0
isa_model/serving/api/routes/settings.py +582 -0
isa_model/serving/api/routes/tenants.py +575 -0
isa_model/serving/api/routes/unified.py +992 -171
isa_model/serving/api/routes/webhooks.py +479 -0
isa_model/serving/api/startup.py +318 -0
isa_model/serving/modal_proxy_server.py +249 -0
isa_model/utils/gpu_utils.py +311 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/METADATA +76 -22
isa_model-0.4.3.dist-info/RECORD +193 -0
isa_model/deployment/cloud/__init__.py +0 -9
isa_model/deployment/cloud/modal/__init__.py +0 -10
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +0 -766
isa_model/deployment/cloud/modal/isa_vision_table_service.py +0 -532
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +0 -406
isa_model/deployment/cloud/modal/register_models.py +0 -321
isa_model/deployment/core/deployment_config.py +0 -356
isa_model/deployment/core/isa_deployment_service.py +0 -401
isa_model/deployment/gpu_int8_ds8/app/server.py +0 -66
isa_model/deployment/gpu_int8_ds8/scripts/test_client.py +0 -43
isa_model/deployment/gpu_int8_ds8/scripts/test_client_os.py +0 -35
isa_model/deployment/runtime/deployed_service.py +0 -338
isa_model/deployment/services/__init__.py +0 -9
isa_model/deployment/services/auto_deploy_vision_service.py +0 -538
isa_model/deployment/services/model_service.py +0 -332
isa_model/deployment/services/service_monitor.py +0 -356
isa_model/deployment/services/service_registry.py +0 -527
isa_model/eval/__init__.py +0 -92
isa_model/eval/benchmarks.py +0 -469
isa_model/eval/config/__init__.py +0 -10
isa_model/eval/config/evaluation_config.py +0 -108
isa_model/eval/evaluators/__init__.py +0 -18
isa_model/eval/evaluators/base_evaluator.py +0 -503
isa_model/eval/evaluators/llm_evaluator.py +0 -472
isa_model/eval/factory.py +0 -531
isa_model/eval/infrastructure/__init__.py +0 -24
isa_model/eval/infrastructure/experiment_tracker.py +0 -466
isa_model/eval/metrics.py +0 -798
isa_model/inference/adapter/unified_api.py +0 -248
isa_model/inference/services/helpers/stacked_config.py +0 -148
isa_model/inference/services/img/flux_professional_service.py +0 -603
isa_model/inference/services/img/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/others/table_transformer_service.py +0 -61
isa_model/inference/services/vision/doc_analysis_service.py +0 -640
isa_model/inference/services/vision/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/vision/ui_analysis_service.py +0 -823
isa_model/scripts/inference_tracker.py +0 -283
isa_model/scripts/mlflow_manager.py +0 -379
isa_model/scripts/model_registry.py +0 -465
isa_model/scripts/register_models.py +0 -370
isa_model/scripts/register_models_with_embeddings.py +0 -510
isa_model/scripts/start_mlflow.py +0 -95
isa_model/scripts/training_tracker.py +0 -257
isa_model/training/__init__.py +0 -74
isa_model/training/annotation/annotation_schema.py +0 -47
isa_model/training/annotation/processors/annotation_processor.py +0 -126
isa_model/training/annotation/storage/dataset_manager.py +0 -131
isa_model/training/annotation/storage/dataset_schema.py +0 -44
isa_model/training/annotation/tests/test_annotation_flow.py +0 -109
isa_model/training/annotation/tests/test_minio copy.py +0 -113
isa_model/training/annotation/tests/test_minio_upload.py +0 -43
isa_model/training/annotation/views/annotation_controller.py +0 -158
isa_model/training/cloud/__init__.py +0 -22
isa_model/training/cloud/job_orchestrator.py +0 -402
isa_model/training/cloud/runpod_trainer.py +0 -454
isa_model/training/cloud/storage_manager.py +0 -482
isa_model/training/core/__init__.py +0 -23
isa_model/training/core/config.py +0 -181
isa_model/training/core/dataset.py +0 -222
isa_model/training/core/trainer.py +0 -720
isa_model/training/core/utils.py +0 -213
isa_model/training/factory.py +0 -424
isa_model-0.3.91.dist-info/RECORD +0 -138
/isa_model/{core/storage/minio_storage.py → deployment/modal/services/audio/isa_audio_fish_service.py} +0 -0
/isa_model/deployment/{services → modal/services/vision}/simple_auto_deploy_vision_service.py +0 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/WHEEL +0 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/top_level.txt +0 -0

isa_model/inference/ai_factory.py CHANGED Viewed

@@ -36,12 +36,13 @@ class AIFactory:
     def __init__(self):
         """Initialize the AI Factory."""
-        if not self._is_initialized:
+        # Check if this specific instance has been initialized (not class-level flag)
+        if not hasattr(self, 'model_manager'):
             # Use centralized managers
             self.model_manager = ModelManager()
             self.config_manager = ConfigManager()
             self._cached_services: Dict[str, BaseService] = {}
             logger.info("AI Factory initialized with centralized ModelManager and ConfigManager")
             AIFactory._is_initialized = True
@@ -52,8 +53,8 @@ class AIFactory:
         Get a LLM service instance with automatic defaults
         Args:
-            model_name: Name of the model to use (defaults: OpenAI="gpt-4.1-mini", Ollama="llama3.2:3b", YYDS="claude-sonnet-4-20250514")
-            provider: Provider name (defaults to 'openai' for production, 'ollama' for dev)
+            model_name: Name of the model to use (defaults: OpenAI="gpt-4.1-mini", Ollama="llama3.2:3b", YYDS="claude-sonnet-4-20250514", Cerebras="gpt-oss-120b", ISA="isa-llm-service")
+            provider: Provider name (defaults to 'openai' for production, 'ollama' for dev, 'cerebras' for ultra-fast inference, 'isa' for custom models, 'huggingface' for HF models)
             config: Optional configuration dictionary
         Returns:
@@ -69,6 +70,15 @@ class AIFactory:
         elif provider == "yyds":
             final_model_name = model_name or "claude-sonnet-4-20250514"
             final_provider = provider
+        elif provider == "cerebras":
+            final_model_name = model_name or "gpt-oss-120b"
+            final_provider = provider
+        elif provider == "isa":
+            final_model_name = model_name or "isa-llm-service"
+            final_provider = provider
+        elif provider == "huggingface":
+            final_model_name = model_name or "xenobordom/dialogpt-isa-trained-1755493402"
+            final_provider = provider
         else:
             # Default provider selection - OpenAI with cheapest model
             final_provider = provider or "openai"
@@ -76,6 +86,12 @@ class AIFactory:
                 final_model_name = model_name or "gpt-4.1-mini"
             elif final_provider == "ollama":
                 final_model_name = model_name or "llama3.2:3b-instruct-fp16"
+            elif final_provider == "cerebras":
+                final_model_name = model_name or "gpt-oss-120b"
+            elif final_provider == "isa":
+                final_model_name = model_name or "isa-llm-service"
+            elif final_provider == "huggingface":
+                final_model_name = model_name or "xenobordom/dialogpt-isa-trained-1755493402"
             else:
                 final_model_name = model_name or "gpt-4.1-mini"
@@ -93,6 +109,18 @@ class AIFactory:
                 from isa_model.inference.services.llm.yyds_llm_service import YydsLLMService
                 return YydsLLMService(provider_name=final_provider, model_name=final_model_name,
                                     model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "cerebras":
+                from isa_model.inference.services.llm.cerebras_llm_service import CerebrasLLMService
+                return CerebrasLLMService(provider_name=final_provider, model_name=final_model_name,
+                                        model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "isa":
+                from isa_model.inference.services.llm.huggingface_llm_service import ISALLMService
+                return ISALLMService(provider_name=final_provider, model_name=final_model_name,
+                                   model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "huggingface":
+                from isa_model.inference.services.llm.huggingface_llm_service import ISALLMService
+                return ISALLMService(provider_name="isa", model_name=final_model_name,
+                                   model_manager=self.model_manager, config_manager=self.config_manager)
             else:
                 raise ValueError(f"Unsupported LLM provider: {final_provider}")
         except Exception as e:
@@ -110,6 +138,7 @@ class AIFactory:
         Args:
             model_name: Model name. Special names:
+                       - "hybrid": Unified UI/Document analysis service (RECOMMENDED)
                        - "isa_vision_table": Table extraction service
                        - "isa_vision_ui": UI detection service
                        - "isa_vision_doc": Document analysis service
@@ -120,18 +149,27 @@ class AIFactory:
         Returns:
             Vision service instance
         """
-        # Handle special ISA vision services
-        if model_name in ["isa_vision_table", "isa_vision_ui", "isa_vision_doc"]:
+        # Handle special vision services
+        if model_name == "hybrid":
+            # Hybrid vision service has been deprecated, use OpenAI as fallback
+            logger.warning("HybridVisionService is deprecated, using OpenAI vision service as fallback")
+            final_provider = "openai"
+            final_model_name = "gpt-4.1-nano"
+        elif model_name in ["isa_vision_table", "isa_vision_ui", "isa_vision_doc"]:
             try:
-                from isa_model.deployment.services.simple_auto_deploy_vision_service import SimpleAutoDeployVisionService
+                from isa_model.deployment.modal.services.vision.simple_auto_deploy_vision_service import SimpleAutoDeployVisionService
                 logger.info(f"Creating auto-deploy service wrapper for {model_name}")
                 return SimpleAutoDeployVisionService(model_name, config)
             except Exception as e:
                 logger.error(f"Failed to create ISA vision service: {e}")
-                raise
+                # Fallback to ISA service
+                logger.warning(f"Auto-deploy service failed, using ISA vision service as fallback")
+                final_provider = "isa"
+                final_model_name = "isa-omniparser-ui-detection"
         # Set defaults for regular services
-        if provider == "openai":
+        elif provider == "openai":
             final_model_name = model_name or "gpt-4.1-mini"
             final_provider = provider
         elif provider == "ollama":
@@ -140,6 +178,9 @@ class AIFactory:
         elif provider == "replicate":
             final_model_name = model_name or "meta/llama-2-70b-chat"
             final_provider = provider
+        elif provider == "isa":
+            final_model_name = model_name or "isa-omniparser-ui-detection"
+            final_provider = provider
         else:
             # Default provider selection
             final_provider = provider or "openai"
@@ -147,6 +188,8 @@ class AIFactory:
                 final_model_name = model_name or "gpt-4.1-mini"
             elif final_provider == "ollama":
                 final_model_name = model_name or "llama3.2-vision:latest"
+            elif final_provider == "isa":
+                final_model_name = model_name or "isa-omniparser-ui-detection"
             else:
                 final_model_name = model_name or "gpt-4.1-mini"
@@ -160,6 +203,10 @@ class AIFactory:
                 from isa_model.inference.services.vision.replicate_vision_service import ReplicateVisionService
                 return ReplicateVisionService(provider_name=final_provider, model_name=final_model_name,
                                             model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "isa":
+                from isa_model.inference.services.vision.isa_vision_service import ISAVisionService
+                logger.info(f"Creating ISA Vision Service with model: {final_model_name}")
+                return ISAVisionService()
             else:
                 raise ValueError(f"Unsupported vision provider: {final_provider}")
         except Exception as e:
@@ -293,6 +340,40 @@ class AIFactory:
             logger.error(f"Failed to create TTS service: {e}")
             raise
+    def get_realtime(self, model_name: Optional[str] = None, provider: Optional[str] = None,
+                     config: Optional[Dict[str, Any]] = None) -> BaseService:
+        """
+        Get realtime audio service with automatic defaults
+        Args:
+            model_name: Name of the model to use (defaults: OpenAI="gpt-4o-realtime-preview-2024-10-01")
+            provider: Provider name (defaults to 'openai')
+            config: Optional configuration dictionary
+        Returns:
+            Realtime service instance
+        """
+        # Set defaults based on provider
+        if provider == "openai":
+            final_model_name = model_name or "gpt-4o-realtime-preview-2024-10-01"
+            final_provider = provider
+        else:
+            # Default provider selection - only OpenAI supports realtime currently
+            final_provider = provider or "openai"
+            final_model_name = model_name or "gpt-4o-realtime-preview-2024-10-01"
+        # Create service using new centralized approach
+        try:
+            if final_provider == "openai":
+                from isa_model.inference.services.audio.openai_realtime_service import OpenAIRealtimeService
+                return OpenAIRealtimeService(provider_name=final_provider, model_name=final_model_name,
+                                           model_manager=self.model_manager, config_manager=self.config_manager)
+            else:
+                raise ValueError(f"Unsupported realtime provider: {final_provider}")
+        except Exception as e:
+            logger.error(f"Failed to create realtime service: {e}")
+            raise
     def get_embed(self, model_name: Optional[str] = None, provider: Optional[str] = None,
                      config: Optional[Dict[str, Any]] = None) -> BaseService:
         """
@@ -322,20 +403,61 @@ class AIFactory:
                 final_model_name = model_name or "bge-m3"
         # Create service using new centralized approach
+        # Create cache key
+        cache_key = f"embed_{final_provider}_{final_model_name}"
+        # Check cache first
+        if cache_key in self._cached_services:
+            logger.debug(f"Using cached embedding service: {cache_key}")
+            return self._cached_services[cache_key]
         try:
             if final_provider == "openai":
-                from isa_model.inference.services.embedding.openai_embed_service import OpenAIEmbedService
-                return OpenAIEmbedService(provider_name=final_provider, model_name=final_model_name,
-                                        model_manager=self.model_manager, config_manager=self.config_manager)
+                # Use resilient embedding service for OpenAI (with fallback)
+                from isa_model.inference.services.embedding.resilient_embed_service import ResilientEmbedService
+                service = ResilientEmbedService(provider_name=final_provider, model_name=final_model_name,
+                                              model_manager=self.model_manager, config_manager=self.config_manager)
             elif final_provider == "ollama":
                 from isa_model.inference.services.embedding.ollama_embed_service import OllamaEmbedService
-                return OllamaEmbedService(provider_name=final_provider, model_name=final_model_name,
-                                        model_manager=self.model_manager, config_manager=self.config_manager)
+                service = OllamaEmbedService(provider_name=final_provider, model_name=final_model_name,
+                                           model_manager=self.model_manager, config_manager=self.config_manager)
+            elif final_provider == "isa":
+                from isa_model.inference.services.embedding.isa_embed_service import ISAEmbedService
+                service = ISAEmbedService()  # ISA service doesn't use model_manager/config_manager yet
             else:
                 raise ValueError(f"Unsupported embedding provider: {final_provider}")
+            # Cache the service
+            self._cached_services[cache_key] = service
+            logger.debug(f"Created and cached embedding service: {cache_key}")
+            return service
         except Exception as e:
             logger.error(f"Failed to create embedding service: {e}")
-            raise
+            # As a last resort, try the resilient service
+            try:
+                logger.info("Attempting to create resilient embedding service as fallback")
+                from isa_model.inference.services.embedding.resilient_embed_service import ResilientEmbedService
+                service = ResilientEmbedService(provider_name="openai", model_name="text-embedding-3-small",
+                                              model_manager=self.model_manager, config_manager=self.config_manager)
+                self._cached_services[cache_key] = service
+                logger.info("Successfully created fallback embedding service")
+                return service
+            except Exception as fallback_error:
+                logger.error(f"Even fallback embedding service failed: {fallback_error}")
+                # Create a more informative error
+                error_details = {
+                    "primary_error": str(e),
+                    "fallback_error": str(fallback_error),
+                    "provider": final_provider,
+                    "model": final_model_name,
+                    "suggestions": [
+                        "检查OpenAI API密钥配置",
+                        "确认网络连接正常",
+                        "尝试使用其他嵌入提供商如ollama"
+                    ]
+                }
+                raise ValueError(f"嵌入服务创建失败: {str(e)}。详细信息: {error_details}")
     def clear_cache(self):
         """Clear the service cache"""
@@ -427,4 +549,45 @@ class AIFactory:
         # Modal services auto-scale to zero, so explicit shutdown isn't required
         # This method is here for compatibility with AutoDeployVisionService
         logger.info(f"Modal service {model_name} will auto-scale to zero when idle")
-        pass
+        pass
+    async def cleanup(self):
+        """Clean up all cached services and resources"""
+        logger.info("🧹 Starting AIFactory cleanup...")
+        cleanup_tasks = []
+        for service_key, service in self._cached_services.items():
+            try:
+                if hasattr(service, 'close') and callable(service.close):
+                    cleanup_tasks.append(service.close())
+                    logger.debug(f"Scheduled cleanup for service: {service_key}")
+            except Exception as e:
+                logger.error(f"Error scheduling cleanup for service {service_key}: {e}")
+        # Wait for all cleanup tasks to complete
+        if cleanup_tasks:
+            import asyncio
+            try:
+                await asyncio.gather(*cleanup_tasks, return_exceptions=True)
+                logger.info(f"✅ Cleaned up {len(cleanup_tasks)} services")
+            except Exception as e:
+                logger.error(f"❌ Error during service cleanup: {e}")
+        # Clear the cached services
+        self._cached_services.clear()
+        # Clean up model manager if it has cleanup method
+        if hasattr(self.model_manager, 'cleanup') and callable(self.model_manager.cleanup):
+            try:
+                await self.model_manager.cleanup()
+                logger.info("✅ Model manager cleaned up")
+            except Exception as e:
+                logger.error(f"❌ Error cleaning up model manager: {e}")
+        logger.info("✅ AIFactory cleanup completed")
+    @classmethod
+    def reset_instance(cls):
+        """Reset the singleton instance (useful for testing)"""
+        cls._instance = None
+        cls._is_initialized = False

isa_model/inference/legacy_services/__init__.py ADDED Viewed

@@ -0,0 +1,21 @@
+"""
+Model Service Suite Package
+"""
+from .model_training import ModelTrainingService, TrainingConfig, TrainingResult
+from .model_evaluation import ModelEvaluationService, EvaluationResult
+from .model_serving import ModelServingService, ServingResult
+from .model_service import ModelService, ModelConfig, ModelResult
+__all__ = [
+    'ModelTrainingService',
+    'TrainingConfig',
+    'TrainingResult',
+    'ModelEvaluationService',
+    'EvaluationResult',
+    'ModelServingService',
+    'ServingResult',
+    'ModelService',
+    'ModelConfig',
+    'ModelResult'
+]

isa-model 0.3.91__py3-none-any.whl → 0.4.3__py3-none-any.whl

isa-model 0.3.91py3-none-any.whl → 0.4.3py3-none-any.whl