PyPI - isa-model - Versions diffs - 0.4.0__py3-none-any.whl → 0.4.4__py3-none-any.whl - Mend

isa-model 0.4.0py3-none-any.whl → 0.4.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (189) hide show

isa_model/client.py +466 -43
isa_model/core/cache/redis_cache.py +12 -3
isa_model/core/config/config_manager.py +230 -3
isa_model/core/config.py +90 -0
isa_model/core/database/direct_db_client.py +114 -0
isa_model/core/database/migration_manager.py +563 -0
isa_model/core/database/migrations.py +21 -1
isa_model/core/database/supabase_client.py +154 -19
isa_model/core/dependencies.py +316 -0
isa_model/core/discovery/__init__.py +19 -0
isa_model/core/discovery/consul_discovery.py +190 -0
isa_model/core/logging/__init__.py +54 -0
isa_model/core/logging/influx_logger.py +523 -0
isa_model/core/logging/loki_logger.py +160 -0
isa_model/core/models/__init__.py +27 -18
isa_model/core/models/config_models.py +625 -0
isa_model/core/models/deployment_billing_tracker.py +430 -0
isa_model/core/models/model_manager.py +35 -80
isa_model/core/models/model_metadata.py +690 -0
isa_model/core/models/model_repo.py +174 -18
isa_model/core/models/system_models.py +857 -0
isa_model/core/repositories/__init__.py +9 -0
isa_model/core/repositories/config_repository.py +912 -0
isa_model/core/services/intelligent_model_selector.py +399 -21
isa_model/core/types.py +1 -0
isa_model/deployment/__init__.py +5 -48
isa_model/deployment/core/__init__.py +2 -31
isa_model/deployment/core/deployment_manager.py +1278 -370
isa_model/deployment/modal/__init__.py +8 -0
isa_model/deployment/modal/config.py +136 -0
isa_model/deployment/{services/auto_hf_modal_deployer.py → modal/deployer.py} +1 -1
isa_model/deployment/modal/services/__init__.py +3 -0
isa_model/deployment/modal/services/audio/__init__.py +1 -0
isa_model/deployment/modal/services/embedding/__init__.py +1 -0
isa_model/deployment/modal/services/llm/__init__.py +1 -0
isa_model/deployment/modal/services/llm/isa_llm_service.py +424 -0
isa_model/deployment/modal/services/video/__init__.py +1 -0
isa_model/deployment/modal/services/vision/__init__.py +1 -0
isa_model/deployment/models/org-org-acme-corp-tenant-a-service-llm-20250825-225822/tenant-a-service_modal_service.py +48 -0
isa_model/deployment/models/org-test-org-123-prefix-test-service-llm-20250825-225822/prefix-test-service_modal_service.py +48 -0
isa_model/deployment/models/test-llm-service-llm-20250825-204442/test-llm-service_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-212906/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-213009/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/storage/__init__.py +5 -0
isa_model/deployment/storage/deployment_repository.py +824 -0
isa_model/deployment/triton/__init__.py +10 -0
isa_model/deployment/triton/config.py +196 -0
isa_model/deployment/triton/configs/__init__.py +1 -0
isa_model/deployment/triton/provider.py +512 -0
isa_model/deployment/triton/scripts/__init__.py +1 -0
isa_model/deployment/triton/templates/__init__.py +1 -0
isa_model/inference/__init__.py +47 -1
isa_model/inference/ai_factory.py +137 -10
isa_model/inference/legacy_services/__init__.py +21 -0
isa_model/inference/legacy_services/model_evaluation.py +637 -0
isa_model/inference/legacy_services/model_service.py +573 -0
isa_model/inference/legacy_services/model_serving.py +717 -0
isa_model/inference/legacy_services/model_training.py +561 -0
isa_model/inference/models/__init__.py +21 -0
isa_model/inference/models/inference_config.py +551 -0
isa_model/inference/models/inference_record.py +675 -0
isa_model/inference/models/performance_models.py +714 -0
isa_model/inference/repositories/__init__.py +9 -0
isa_model/inference/repositories/inference_repository.py +828 -0
isa_model/inference/services/audio/base_stt_service.py +184 -11
isa_model/inference/services/audio/openai_stt_service.py +22 -6
isa_model/inference/services/embedding/ollama_embed_service.py +15 -3
isa_model/inference/services/embedding/resilient_embed_service.py +285 -0
isa_model/inference/services/llm/__init__.py +10 -2
isa_model/inference/services/llm/base_llm_service.py +335 -24
isa_model/inference/services/llm/cerebras_llm_service.py +628 -0
isa_model/inference/services/llm/helpers/llm_adapter.py +9 -4
isa_model/inference/services/llm/helpers/llm_prompts.py +342 -0
isa_model/inference/services/llm/helpers/llm_utils.py +321 -23
isa_model/inference/services/llm/huggingface_llm_service.py +581 -0
isa_model/inference/services/llm/ollama_llm_service.py +9 -2
isa_model/inference/services/llm/openai_llm_service.py +33 -16
isa_model/inference/services/llm/yyds_llm_service.py +8 -2
isa_model/inference/services/vision/__init__.py +22 -1
isa_model/inference/services/vision/helpers/image_utils.py +8 -5
isa_model/inference/services/vision/isa_vision_service.py +65 -4
isa_model/inference/services/vision/openai_vision_service.py +19 -10
isa_model/inference/services/vision/vgg16_vision_service.py +257 -0
isa_model/serving/api/cache_manager.py +245 -0
isa_model/serving/api/dependencies/__init__.py +1 -0
isa_model/serving/api/dependencies/auth.py +194 -0
isa_model/serving/api/dependencies/database.py +139 -0
isa_model/serving/api/error_handlers.py +284 -0
isa_model/serving/api/fastapi_server.py +172 -22
isa_model/serving/api/middleware/auth.py +8 -2
isa_model/serving/api/middleware/security.py +23 -33
isa_model/serving/api/middleware/tenant_context.py +414 -0
isa_model/serving/api/routes/analytics.py +4 -1
isa_model/serving/api/routes/config.py +645 -0
isa_model/serving/api/routes/deployment_billing.py +315 -0
isa_model/serving/api/routes/deployments.py +138 -2
isa_model/serving/api/routes/gpu_gateway.py +440 -0
isa_model/serving/api/routes/health.py +32 -12
isa_model/serving/api/routes/inference_monitoring.py +486 -0
isa_model/serving/api/routes/local_deployments.py +448 -0
isa_model/serving/api/routes/tenants.py +575 -0
isa_model/serving/api/routes/unified.py +680 -18
isa_model/serving/api/routes/webhooks.py +479 -0
isa_model/serving/api/startup.py +68 -54
isa_model/utils/gpu_utils.py +311 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.4.dist-info}/METADATA +71 -24
isa_model-0.4.4.dist-info/RECORD +180 -0
isa_model/core/security/secrets.py +0 -358
isa_model/core/storage/hf_storage.py +0 -419
isa_model/core/storage/minio_storage.py +0 -0
isa_model/deployment/cloud/__init__.py +0 -9
isa_model/deployment/cloud/modal/__init__.py +0 -10
isa_model/deployment/core/deployment_config.py +0 -356
isa_model/deployment/core/isa_deployment_service.py +0 -401
isa_model/deployment/gpu_int8_ds8/app/server.py +0 -66
isa_model/deployment/gpu_int8_ds8/scripts/test_client.py +0 -43
isa_model/deployment/gpu_int8_ds8/scripts/test_client_os.py +0 -35
isa_model/deployment/runtime/deployed_service.py +0 -338
isa_model/deployment/services/__init__.py +0 -9
isa_model/deployment/services/auto_deploy_vision_service.py +0 -538
isa_model/deployment/services/model_service.py +0 -332
isa_model/deployment/services/service_monitor.py +0 -356
isa_model/deployment/services/service_registry.py +0 -527
isa_model/eval/__init__.py +0 -92
isa_model/eval/benchmarks/__init__.py +0 -27
isa_model/eval/benchmarks/multimodal_datasets.py +0 -460
isa_model/eval/benchmarks.py +0 -701
isa_model/eval/config/__init__.py +0 -10
isa_model/eval/config/evaluation_config.py +0 -108
isa_model/eval/evaluators/__init__.py +0 -24
isa_model/eval/evaluators/audio_evaluator.py +0 -727
isa_model/eval/evaluators/base_evaluator.py +0 -503
isa_model/eval/evaluators/embedding_evaluator.py +0 -742
isa_model/eval/evaluators/llm_evaluator.py +0 -472
isa_model/eval/evaluators/vision_evaluator.py +0 -564
isa_model/eval/example_evaluation.py +0 -395
isa_model/eval/factory.py +0 -798
isa_model/eval/infrastructure/__init__.py +0 -24
isa_model/eval/infrastructure/experiment_tracker.py +0 -466
isa_model/eval/isa_benchmarks.py +0 -700
isa_model/eval/isa_integration.py +0 -582
isa_model/eval/metrics.py +0 -951
isa_model/eval/tests/unit/test_basic.py +0 -396
isa_model/serving/api/routes/evaluations.py +0 -579
isa_model/training/__init__.py +0 -168
isa_model/training/annotation/annotation_schema.py +0 -47
isa_model/training/annotation/processors/annotation_processor.py +0 -126
isa_model/training/annotation/storage/dataset_manager.py +0 -131
isa_model/training/annotation/storage/dataset_schema.py +0 -44
isa_model/training/annotation/tests/test_annotation_flow.py +0 -109
isa_model/training/annotation/tests/test_minio copy.py +0 -113
isa_model/training/annotation/tests/test_minio_upload.py +0 -43
isa_model/training/annotation/views/annotation_controller.py +0 -158
isa_model/training/cloud/__init__.py +0 -22
isa_model/training/cloud/job_orchestrator.py +0 -402
isa_model/training/cloud/runpod_trainer.py +0 -454
isa_model/training/cloud/storage_manager.py +0 -482
isa_model/training/core/__init__.py +0 -26
isa_model/training/core/config.py +0 -181
isa_model/training/core/dataset.py +0 -222
isa_model/training/core/trainer.py +0 -720
isa_model/training/core/utils.py +0 -213
isa_model/training/examples/intelligent_training_example.py +0 -281
isa_model/training/factory.py +0 -424
isa_model/training/intelligent/__init__.py +0 -25
isa_model/training/intelligent/decision_engine.py +0 -643
isa_model/training/intelligent/intelligent_factory.py +0 -888
isa_model/training/intelligent/knowledge_base.py +0 -751
isa_model/training/intelligent/resource_optimizer.py +0 -839
isa_model/training/intelligent/task_classifier.py +0 -576
isa_model/training/storage/__init__.py +0 -24
isa_model/training/storage/core_integration.py +0 -439
isa_model/training/storage/training_repository.py +0 -552
isa_model/training/storage/training_storage.py +0 -628
isa_model-0.4.0.dist-info/RECORD +0 -182
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_chatTTS_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_fish_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_openvoice_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_service_v2.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/embedding}/isa_embed_rerank_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/video}/isa_video_hunyuan_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ocr_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_qwen25_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_table_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ui_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ui_service_optimized.py +0 -0
/isa_model/deployment/{services → modal/services/vision}/simple_auto_deploy_vision_service.py +0 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.4.dist-info}/WHEEL +0 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.4.dist-info}/top_level.txt +0 -0

isa_model/inference/services/llm/huggingface_llm_service.py ADDED Viewed

@@ -0,0 +1,581 @@
+#!/usr/bin/env python
+# -*- coding: utf-8 -*-
+"""
+ISA LLM Service - Inference client for Modal-deployed HuggingFace models
+Supports custom trained models deployed on Modal infrastructure
+"""
+import logging
+import os
+from typing import Dict, Any, Optional, List
+try:
+    import modal
+    MODAL_AVAILABLE = True
+except ImportError:
+    MODAL_AVAILABLE = False
+    modal = None
+from isa_model.inference.services.base_service import BaseService
+from isa_model.core.models.model_manager import ModelManager
+from isa_model.core.config import ConfigManager
+logger = logging.getLogger(__name__)
+class ISALLMService(BaseService):
+    """
+    ISA LLM Service - Client for Modal-deployed HuggingFace models
+    Calls ISA's own deployed LLM inference services on Modal
+    """
+    def __init__(
+        self,
+        provider_name: str = "isa",
+        model_name: str = None,
+        model_manager: ModelManager = None,
+        config_manager: ConfigManager = None,
+        modal_app_name: str = "isa-llm-inference",
+        timeout: int = 60,
+        **kwargs
+    ):
+        # Skip BaseService init to avoid config validation for now
+        self.provider_name = provider_name
+        self.model_name = model_name or "isa-llm-service"
+        self.modal_app_name = modal_app_name
+        self.timeout = timeout
+        # Initialize Modal client
+        if MODAL_AVAILABLE:
+            try:
+                # Get deployed Modal app
+                self.modal_app = modal.App.lookup(modal_app_name)
+                logger.info(f"Connected to Modal LLM app: {modal_app_name}")
+                self.modal_service = True
+                logger.info("Modal LLM service connection established")
+            except Exception as e:
+                logger.warning(f"Failed to connect to Modal LLM app: {e}")
+                self.modal_app = None
+                self.modal_service = None
+        else:
+            logger.warning("Modal SDK not available")
+            self.modal_app = None
+            self.modal_service = None
+        # Service statistics
+        self.request_count = 0
+        self.total_cost = 0.0
+        # Fallback mode for when Modal is not available
+        self.fallback_mode = not MODAL_AVAILABLE or not self.modal_service
+    async def _fallback_response(self, method_name: str, **kwargs) -> Dict[str, Any]:
+        """
+        Provide fallback responses when Modal service is not available
+        """
+        import time
+        import random
+        if method_name == "generate_text":
+            prompt = kwargs.get("prompt", "")
+            # Simple rule-based responses for demo purposes
+            responses = [
+                "这是一个模拟的ISA LLM响应。",
+                "抱歉，Modal服务当前不可用，这是一个fallback响应。",
+                "ISA模型正在维护中，请稍后再试。",
+                f"您说：{prompt}。我理解了，但当前模型不可用。"
+            ]
+            generated_text = random.choice(responses)
+            return {
+                "success": True,
+                "text": generated_text,
+                "full_text": prompt + " " + generated_text,
+                "prompt": prompt,
+                "model_id": kwargs.get("model_id", "isa-llm-fallback"),
+                "provider": "ISA",
+                "service": "isa-llm",
+                "fallback": True,
+                "generation_config": kwargs.get("generation_config", {}),
+                "metadata": {
+                    "processing_time": random.uniform(0.5, 2.0),
+                    "device": "cpu",
+                    "input_tokens": len(prompt.split()),
+                    "output_tokens": len(generated_text.split()),
+                    "note": "This is a fallback response - Modal service not available"
+                }
+            }
+        elif method_name == "chat_completion":
+            messages = kwargs.get("messages", [])
+            user_message = ""
+            if messages:
+                user_message = messages[-1].get("content", "")
+            chat_responses = [
+                "很抱歉，ISA模型当前不可用，这是一个模拟响应。",
+                "我是ISA模型的fallback版本，功能有限。",
+                f"我听到您说：{user_message}，但现在无法提供完整的回复。",
+                "Modal服务正在重启中，请稍后再试完整的ISA模型功能。"
+            ]
+            response_text = random.choice(chat_responses)
+            return {
+                "success": True,
+                "text": response_text,
+                "role": "assistant",
+                "messages": messages,
+                "model_id": kwargs.get("model_id", "isa-llm-fallback"),
+                "provider": "ISA",
+                "service": "isa-llm",
+                "fallback": True,
+                "metadata": {
+                    "processing_time": random.uniform(0.3, 1.5),
+                    "device": "cpu",
+                    "note": "This is a fallback response - Modal service not available"
+                }
+            }
+        elif method_name == "get_model_info":
+            return {
+                "success": True,
+                "model_id": kwargs.get("model_id", "isa-llm-fallback"),
+                "provider": "ISA",
+                "service": "isa-llm",
+                "architecture": "unknown (fallback mode)",
+                "fallback": True,
+                "note": "Modal service not available - showing fallback info"
+            }
+        elif method_name == "health_check":
+            return {
+                "success": True,
+                "status": "fallback",
+                "service": "isa-llm",
+                "provider": "ISA",
+                "device": "cpu",
+                "fallback": True,
+                "message": "Modal service not available - running in fallback mode"
+            }
+        else:
+            return {
+                "success": False,
+                "error": f"Method {method_name} not supported in fallback mode",
+                "fallback": True
+            }
+    async def _call_modal_llm_service(
+        self,
+        method_name: str,
+        **kwargs
+    ) -> Dict[str, Any]:
+        """
+        Call Modal LLM service via SDK with improved error handling and fallback
+        """
+        # If in fallback mode, use fallback response immediately
+        if self.fallback_mode:
+            logger.info(f"Using fallback mode for {method_name}")
+            return await self._fallback_response(method_name, **kwargs)
+        try:
+            if not MODAL_AVAILABLE:
+                logger.warning("Modal SDK not available, switching to fallback mode")
+                self.fallback_mode = True
+                return await self._fallback_response(method_name, **kwargs)
+            if not self.modal_app or not self.modal_service:
+                logger.warning("Modal app/service not available, switching to fallback mode")
+                self.fallback_mode = True
+                return await self._fallback_response(method_name, **kwargs)
+            logger.info(f"Calling Modal LLM service method: {method_name}")
+            try:
+                # Use Modal SDK to call the service
+                ISALLMServiceCls = modal.Cls.from_name(
+                    app_name=self.modal_app_name,
+                    name="ISALLMService"
+                )
+                # Create instance and call method
+                instance = ISALLMServiceCls()
+                method = getattr(instance, method_name)
+                result = method.remote(**kwargs)
+                logger.info("✅ Modal LLM service call successful")
+                return result
+            except modal.exception.NotFoundError:
+                logger.warning(f"Modal app not found, switching to fallback mode")
+                self.fallback_mode = True
+                return await self._fallback_response(method_name, **kwargs)
+            except modal.exception.ConnectionError:
+                logger.warning(f"Modal connection error, switching to fallback mode")
+                self.fallback_mode = True
+                return await self._fallback_response(method_name, **kwargs)
+        except Exception as e:
+            logger.error(f"Modal LLM service call failed: {e}, switching to fallback mode")
+            self.fallback_mode = True
+            return await self._fallback_response(method_name, **kwargs)
+    async def complete(
+        self,
+        prompt: str,
+        model_id: str = None,
+        max_length: Optional[int] = 50,
+        temperature: float = 0.7,
+        do_sample: bool = True,
+        top_p: float = 0.9,
+        repetition_penalty: float = 1.1,
+        **kwargs
+    ) -> Dict[str, Any]:
+        """
+        Generate completion using Modal-deployed LLM service
+        Args:
+            prompt: Input text prompt
+            model_id: HuggingFace model ID to use
+            max_length: Maximum length of generated text
+            temperature: Sampling temperature
+            do_sample: Whether to use sampling
+            top_p: Top-p sampling parameter
+            repetition_penalty: Repetition penalty
+            **kwargs: Additional generation parameters
+        Returns:
+            Dictionary containing generated text and metadata
+        """
+        try:
+            # Get HF token from environment
+            hf_token = os.getenv("HF_TOKEN")
+            # Use provided model_id or default trained model
+            target_model = model_id or "xenobordom/dialogpt-isa-trained-1755493402"
+            # Call Modal service
+            result = await self._call_modal_llm_service(
+                method_name="generate_text",
+                prompt=prompt,
+                model_id=target_model,
+                hf_token=hf_token,
+                max_length=max_length,
+                temperature=temperature,
+                do_sample=do_sample,
+                top_p=top_p,
+                repetition_penalty=repetition_penalty,
+                **kwargs
+            )
+            if result and result.get('success', False):
+                self.request_count += 1
+                # Add cost tracking if available
+                if 'billing' in result:
+                    cost = result['billing'].get('estimated_cost_usd', 0)
+                    self.total_cost += cost
+                return result
+            else:
+                return {
+                    'success': False,
+                    'provider': 'ISA',
+                    'service': 'isa-llm',
+                    'error': f'Modal LLM service returned error: {result.get("error", "Unknown error") if result else "No response"}',
+                    'details': result
+                }
+        except Exception as e:
+            logger.error(f"ISA LLM completion failed: {e}")
+            return {
+                'success': False,
+                'provider': 'ISA',
+                'service': 'isa-llm',
+                'error': str(e)
+            }
+    async def chat(
+        self,
+        messages: List[Dict[str, str]],
+        model_id: str = None,
+        **kwargs
+    ) -> Dict[str, Any]:
+        """
+        Chat completion using Modal-deployed LLM service
+        Args:
+            messages: List of message dictionaries with 'role' and 'content'
+            model_id: HuggingFace model ID to use
+            **kwargs: Additional generation parameters
+        Returns:
+            Dictionary containing generated response and metadata
+        """
+        try:
+            # Get HF token from environment
+            hf_token = os.getenv("HF_TOKEN")
+            # Use provided model_id or default trained model
+            target_model = model_id or "xenobordom/dialogpt-isa-trained-1755493402"
+            # Call Modal service
+            result = await self._call_modal_llm_service(
+                method_name="chat_completion",
+                messages=messages,
+                model_id=target_model,
+                hf_token=hf_token,
+                **kwargs
+            )
+            if result and result.get('success', False):
+                self.request_count += 1
+                # Add cost tracking if available
+                if 'billing' in result:
+                    cost = result['billing'].get('estimated_cost_usd', 0)
+                    self.total_cost += cost
+                return result
+            else:
+                return {
+                    'success': False,
+                    'provider': 'ISA',
+                    'service': 'isa-llm',
+                    'error': f'Modal LLM service returned error: {result.get("error", "Unknown error") if result else "No response"}',
+                    'details': result
+                }
+        except Exception as e:
+            logger.error(f"ISA LLM chat completion failed: {e}")
+            return {
+                'success': False,
+                'provider': 'ISA',
+                'service': 'isa-llm',
+                'error': str(e)
+            }
+    async def get_model_info(self, model_id: str = None) -> Dict[str, Any]:
+        """Get information about the model via Modal service"""
+        try:
+            # Get HF token from environment
+            hf_token = os.getenv("HF_TOKEN")
+            # Use provided model_id or default trained model
+            target_model = model_id or "xenobordom/dialogpt-isa-trained-1755493402"
+            # Call Modal service
+            result = await self._call_modal_llm_service(
+                method_name="get_model_info",
+                model_id=target_model,
+                hf_token=hf_token
+            )
+            if result and result.get('success', False):
+                return result
+            else:
+                return {
+                    'success': False,
+                    'provider': 'ISA',
+                    'service': 'isa-llm',
+                    'error': f'Modal LLM service returned error: {result.get("error", "Unknown error") if result else "No response"}'
+                }
+        except Exception as e:
+            logger.error(f"Error getting model info: {e}")
+            return {
+                'success': False,
+                'error': str(e)
+            }
+    async def health_check(self) -> Dict[str, Any]:
+        """Check ISA LLM service health"""
+        try:
+            # Call Modal service health check
+            result = await self._call_modal_llm_service(
+                method_name="health_check"
+            )
+            if result and result.get('success', False):
+                return {
+                    'success': True,
+                    'provider': 'ISA',
+                    'service': 'isa-llm',
+                    'status': 'healthy',
+                    'modal_service': result,
+                    'usage_stats': {
+                        'total_requests': self.request_count,
+                        'total_cost_usd': round(self.total_cost, 6)
+                    }
+                }
+            else:
+                return {
+                    'success': False,
+                    'provider': 'ISA',
+                    'service': 'isa-llm',
+                    'status': 'error',
+                    'error': f'Modal service error: {result.get("error", "Unknown error") if result else "No response"}'
+                }
+        except Exception as e:
+            return {
+                'success': False,
+                'provider': 'ISA',
+                'service': 'isa-llm',
+                'status': 'error',
+                'error': str(e)
+            }
+    def get_supported_tasks(self) -> List[str]:
+        """Get supported task list"""
+        return [
+            'generate',     # Text generation
+            'chat',         # Chat completion
+            'complete'      # Text completion
+        ]
+    def get_supported_models(self) -> List[str]:
+        """Get supported model types"""
+        return [
+            'dialogpt',     # DialoGPT models
+            'gpt2',         # GPT-2 models
+            'custom'        # Custom trained models
+        ]
+    async def invoke(self, input_data: str, task: str = "chat", **kwargs) -> Dict[str, Any]:
+        """
+        Unified invoke method for ISA LLM service compatibility
+        Required by the ISA Model client interface
+        """
+        try:
+            if task in ["chat", "generate", "complete"]:
+                # Handle chat tasks by converting to message format
+                if task == "chat":
+                    if isinstance(input_data, str):
+                        messages = [{"role": "user", "content": input_data}]
+                    elif isinstance(input_data, list):
+                        messages = input_data
+                    else:
+                        messages = [{"role": "user", "content": str(input_data)}]
+                    result = await self.chat(messages, **kwargs)
+                    # Convert result to unified format
+                    if result.get('success'):
+                        response_text = ""
+                        if 'response' in result and isinstance(result['response'], dict):
+                            response_text = result['response'].get('generated_text', '')
+                        elif 'generated_text' in result:
+                            response_text = result['generated_text']
+                        elif 'content' in result:
+                            response_text = result['content']
+                        return {
+                            'success': True,
+                            'result': {
+                                'content': response_text,
+                                'tool_calls': [],
+                                'response_metadata': result.get('metadata', {})
+                            },
+                            'error': None,
+                            'metadata': {
+                                'model_used': self.model_name,
+                                'provider': self.provider_name,
+                                'task': task,
+                                'service_type': 'text',
+                                'processing_time': result.get('processing_time', 0)
+                            }
+                        }
+                    else:
+                        return {
+                            'success': False,
+                            'result': None,
+                            'error': result.get('error', 'Unknown error'),
+                            'metadata': {
+                                'model_used': self.model_name,
+                                'provider': self.provider_name,
+                                'task': task,
+                                'service_type': 'text'
+                            }
+                        }
+                elif task in ["generate", "complete"]:
+                    result = await self.complete(input_data, **kwargs)
+                    # Convert result to unified format
+                    if result.get('success'):
+                        response_text = ""
+                        if 'response' in result and isinstance(result['response'], dict):
+                            response_text = result['response'].get('generated_text', '')
+                        elif 'generated_text' in result:
+                            response_text = result['generated_text']
+                        elif 'content' in result:
+                            response_text = result['content']
+                        return {
+                            'success': True,
+                            'result': {
+                                'content': response_text,
+                                'response_metadata': result.get('metadata', {})
+                            },
+                            'error': None,
+                            'metadata': {
+                                'model_used': self.model_name,
+                                'provider': self.provider_name,
+                                'task': task,
+                                'service_type': 'text',
+                                'processing_time': result.get('processing_time', 0)
+                            }
+                        }
+                    else:
+                        return {
+                            'success': False,
+                            'result': None,
+                            'error': result.get('error', 'Unknown error'),
+                            'metadata': {
+                                'model_used': self.model_name,
+                                'provider': self.provider_name,
+                                'task': task,
+                                'service_type': 'text'
+                            }
+                        }
+            else:
+                return {
+                    'success': False,
+                    'result': None,
+                    'error': f'Unsupported task: {task}. Supported tasks: {self.get_supported_tasks()}',
+                    'metadata': {
+                        'model_used': self.model_name,
+                        'provider': self.provider_name,
+                        'task': task,
+                        'service_type': 'text'
+                    }
+                }
+        except Exception as e:
+            logger.error(f"ISA LLM invoke failed: {e}")
+            return {
+                'success': False,
+                'result': None,
+                'error': str(e),
+                'metadata': {
+                    'model_used': self.model_name,
+                    'provider': self.provider_name,
+                    'task': task,
+                    'service_type': 'text'
+                }
+            }
+# Backward compatibility aliases
+class HuggingFaceLLMService(ISALLMService):
+    """Alias for backward compatibility with AIFactory naming convention"""
+    pass
+class HuggingFaceInferenceService(ISALLMService):
+    """Alias for backward compatibility"""
+    pass

isa_model/inference/services/llm/ollama_llm_service.py CHANGED Viewed

@@ -3,6 +3,7 @@ import httpx
 import json
 from typing import Dict, Any, List, Union, AsyncGenerator, Optional, Callable
 from isa_model.inference.services.llm.base_llm_service import BaseLLMService
+from isa_model.core.config.config_manager import ConfigManager
 logger = logging.getLogger(__name__)
@@ -16,7 +17,10 @@ class OllamaLLMService(BaseLLMService):
         provider_config = self.get_provider_config()
         # Create HTTP client for Ollama API
-        base_url = provider_config.get("base_url", "http://localhost:11434")
+        config_manager = ConfigManager()
+        # Use Consul discovery with fallback
+        default_base_url = config_manager.get_ollama_url()
+        base_url = provider_config.get("base_url", default_base_url)
         timeout = provider_config.get("timeout", 60)
         self.client = httpx.AsyncClient(
@@ -34,7 +38,10 @@ class OllamaLLMService(BaseLLMService):
         """Ensure the HTTP client is available and not closed"""
         if not hasattr(self, 'client') or not self.client or self.client.is_closed:
             provider_config = self.get_provider_config()
-            base_url = provider_config.get("base_url", "http://localhost:11434")
+            config_manager = ConfigManager()
+            # Use Consul discovery with fallback
+            default_base_url = config_manager.get_ollama_url()
+            base_url = provider_config.get("base_url", default_base_url)
             timeout = provider_config.get("timeout", 60)
             self.client = httpx.AsyncClient(base_url=base_url, timeout=timeout)

isa-model 0.4.0__py3-none-any.whl → 0.4.4__py3-none-any.whl

isa-model 0.4.0py3-none-any.whl → 0.4.4py3-none-any.whl