PyPI - isa-model - Versions diffs - 0.3.91__py3-none-any.whl → 0.4.3__py3-none-any.whl - Mend

isa-model 0.3.91py3-none-any.whl → 0.4.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (228) hide show

isa_model/client.py +1166 -584
isa_model/core/cache/redis_cache.py +410 -0
isa_model/core/config/config_manager.py +282 -12
isa_model/core/config.py +91 -1
isa_model/core/database/__init__.py +1 -0
isa_model/core/database/direct_db_client.py +114 -0
isa_model/core/database/migration_manager.py +563 -0
isa_model/core/database/migrations.py +297 -0
isa_model/core/database/supabase_client.py +258 -0
isa_model/core/dependencies.py +316 -0
isa_model/core/discovery/__init__.py +19 -0
isa_model/core/discovery/consul_discovery.py +190 -0
isa_model/core/logging/__init__.py +54 -0
isa_model/core/logging/influx_logger.py +523 -0
isa_model/core/logging/loki_logger.py +160 -0
isa_model/core/models/__init__.py +46 -0
isa_model/core/models/config_models.py +625 -0
isa_model/core/models/deployment_billing_tracker.py +430 -0
isa_model/core/models/model_billing_tracker.py +60 -88
isa_model/core/models/model_manager.py +66 -25
isa_model/core/models/model_metadata.py +690 -0
isa_model/core/models/model_repo.py +217 -55
isa_model/core/models/model_statistics_tracker.py +234 -0
isa_model/core/models/model_storage.py +0 -1
isa_model/core/models/model_version_manager.py +959 -0
isa_model/core/models/system_models.py +857 -0
isa_model/core/pricing_manager.py +2 -249
isa_model/core/repositories/__init__.py +9 -0
isa_model/core/repositories/config_repository.py +912 -0
isa_model/core/resilience/circuit_breaker.py +366 -0
isa_model/core/security/secrets.py +358 -0
isa_model/core/services/__init__.py +2 -4
isa_model/core/services/intelligent_model_selector.py +479 -370
isa_model/core/storage/hf_storage.py +2 -2
isa_model/core/types.py +8 -0
isa_model/deployment/__init__.py +5 -48
isa_model/deployment/core/__init__.py +2 -31
isa_model/deployment/core/deployment_manager.py +1278 -368
isa_model/deployment/local/__init__.py +31 -0
isa_model/deployment/local/config.py +248 -0
isa_model/deployment/local/gpu_gateway.py +607 -0
isa_model/deployment/local/health_checker.py +428 -0
isa_model/deployment/local/provider.py +586 -0
isa_model/deployment/local/tensorrt_service.py +621 -0
isa_model/deployment/local/transformers_service.py +644 -0
isa_model/deployment/local/vllm_service.py +527 -0
isa_model/deployment/modal/__init__.py +8 -0
isa_model/deployment/modal/config.py +136 -0
isa_model/deployment/modal/deployer.py +894 -0
isa_model/deployment/modal/services/__init__.py +3 -0
isa_model/deployment/modal/services/audio/__init__.py +1 -0
isa_model/deployment/modal/services/audio/isa_audio_chatTTS_service.py +520 -0
isa_model/deployment/modal/services/audio/isa_audio_openvoice_service.py +758 -0
isa_model/deployment/modal/services/audio/isa_audio_service_v2.py +1044 -0
isa_model/deployment/modal/services/embedding/__init__.py +1 -0
isa_model/deployment/modal/services/embedding/isa_embed_rerank_service.py +296 -0
isa_model/deployment/modal/services/llm/__init__.py +1 -0
isa_model/deployment/modal/services/llm/isa_llm_service.py +424 -0
isa_model/deployment/modal/services/video/__init__.py +1 -0
isa_model/deployment/modal/services/video/isa_video_hunyuan_service.py +423 -0
isa_model/deployment/modal/services/vision/__init__.py +1 -0
isa_model/deployment/modal/services/vision/isa_vision_ocr_service.py +519 -0
isa_model/deployment/modal/services/vision/isa_vision_qwen25_service.py +709 -0
isa_model/deployment/modal/services/vision/isa_vision_table_service.py +676 -0
isa_model/deployment/modal/services/vision/isa_vision_ui_service.py +833 -0
isa_model/deployment/modal/services/vision/isa_vision_ui_service_optimized.py +660 -0
isa_model/deployment/models/org-org-acme-corp-tenant-a-service-llm-20250825-225822/tenant-a-service_modal_service.py +48 -0
isa_model/deployment/models/org-test-org-123-prefix-test-service-llm-20250825-225822/prefix-test-service_modal_service.py +48 -0
isa_model/deployment/models/test-llm-service-llm-20250825-204442/test-llm-service_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-212906/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-213009/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/storage/__init__.py +5 -0
isa_model/deployment/storage/deployment_repository.py +824 -0
isa_model/deployment/triton/__init__.py +10 -0
isa_model/deployment/triton/config.py +196 -0
isa_model/deployment/triton/configs/__init__.py +1 -0
isa_model/deployment/triton/provider.py +512 -0
isa_model/deployment/triton/scripts/__init__.py +1 -0
isa_model/deployment/triton/templates/__init__.py +1 -0
isa_model/inference/__init__.py +47 -1
isa_model/inference/ai_factory.py +179 -16
isa_model/inference/legacy_services/__init__.py +21 -0
isa_model/inference/legacy_services/model_evaluation.py +637 -0
isa_model/inference/legacy_services/model_service.py +573 -0
isa_model/inference/legacy_services/model_serving.py +717 -0
isa_model/inference/legacy_services/model_training.py +561 -0
isa_model/inference/models/__init__.py +21 -0
isa_model/inference/models/inference_config.py +551 -0
isa_model/inference/models/inference_record.py +675 -0
isa_model/inference/models/performance_models.py +714 -0
isa_model/inference/repositories/__init__.py +9 -0
isa_model/inference/repositories/inference_repository.py +828 -0
isa_model/inference/services/audio/__init__.py +21 -0
isa_model/inference/services/audio/base_realtime_service.py +225 -0
isa_model/inference/services/audio/base_stt_service.py +184 -11
isa_model/inference/services/audio/isa_tts_service.py +0 -0
isa_model/inference/services/audio/openai_realtime_service.py +320 -124
isa_model/inference/services/audio/openai_stt_service.py +53 -11
isa_model/inference/services/base_service.py +17 -1
isa_model/inference/services/custom_model_manager.py +277 -0
isa_model/inference/services/embedding/__init__.py +13 -0
isa_model/inference/services/embedding/base_embed_service.py +111 -8
isa_model/inference/services/embedding/isa_embed_service.py +305 -0
isa_model/inference/services/embedding/ollama_embed_service.py +15 -3
isa_model/inference/services/embedding/openai_embed_service.py +2 -4
isa_model/inference/services/embedding/resilient_embed_service.py +285 -0
isa_model/inference/services/embedding/tests/test_embedding.py +222 -0
isa_model/inference/services/img/__init__.py +2 -2
isa_model/inference/services/img/base_image_gen_service.py +24 -7
isa_model/inference/services/img/replicate_image_gen_service.py +84 -422
isa_model/inference/services/img/services/replicate_face_swap.py +193 -0
isa_model/inference/services/img/services/replicate_flux.py +226 -0
isa_model/inference/services/img/services/replicate_flux_kontext.py +219 -0
isa_model/inference/services/img/services/replicate_sticker_maker.py +249 -0
isa_model/inference/services/img/tests/test_img_client.py +297 -0
isa_model/inference/services/llm/__init__.py +10 -2
isa_model/inference/services/llm/base_llm_service.py +361 -26
isa_model/inference/services/llm/cerebras_llm_service.py +628 -0
isa_model/inference/services/llm/helpers/llm_adapter.py +71 -12
isa_model/inference/services/llm/helpers/llm_prompts.py +342 -0
isa_model/inference/services/llm/helpers/llm_utils.py +321 -23
isa_model/inference/services/llm/huggingface_llm_service.py +581 -0
isa_model/inference/services/llm/local_llm_service.py +747 -0
isa_model/inference/services/llm/ollama_llm_service.py +11 -3
isa_model/inference/services/llm/openai_llm_service.py +670 -56
isa_model/inference/services/llm/yyds_llm_service.py +10 -3
isa_model/inference/services/vision/__init__.py +27 -6
isa_model/inference/services/vision/base_vision_service.py +118 -185
isa_model/inference/services/vision/blip_vision_service.py +359 -0
isa_model/inference/services/vision/helpers/image_utils.py +19 -10
isa_model/inference/services/vision/isa_vision_service.py +634 -0
isa_model/inference/services/vision/openai_vision_service.py +19 -10
isa_model/inference/services/vision/tests/test_ocr_client.py +284 -0
isa_model/inference/services/vision/vgg16_vision_service.py +257 -0
isa_model/serving/api/cache_manager.py +245 -0
isa_model/serving/api/dependencies/__init__.py +1 -0
isa_model/serving/api/dependencies/auth.py +194 -0
isa_model/serving/api/dependencies/database.py +139 -0
isa_model/serving/api/error_handlers.py +284 -0
isa_model/serving/api/fastapi_server.py +240 -18
isa_model/serving/api/middleware/auth.py +317 -0
isa_model/serving/api/middleware/security.py +268 -0
isa_model/serving/api/middleware/tenant_context.py +414 -0
isa_model/serving/api/routes/analytics.py +489 -0
isa_model/serving/api/routes/config.py +645 -0
isa_model/serving/api/routes/deployment_billing.py +315 -0
isa_model/serving/api/routes/deployments.py +475 -0
isa_model/serving/api/routes/gpu_gateway.py +440 -0
isa_model/serving/api/routes/health.py +32 -12
isa_model/serving/api/routes/inference_monitoring.py +486 -0
isa_model/serving/api/routes/local_deployments.py +448 -0
isa_model/serving/api/routes/logs.py +430 -0
isa_model/serving/api/routes/settings.py +582 -0
isa_model/serving/api/routes/tenants.py +575 -0
isa_model/serving/api/routes/unified.py +992 -171
isa_model/serving/api/routes/webhooks.py +479 -0
isa_model/serving/api/startup.py +318 -0
isa_model/serving/modal_proxy_server.py +249 -0
isa_model/utils/gpu_utils.py +311 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/METADATA +76 -22
isa_model-0.4.3.dist-info/RECORD +193 -0
isa_model/deployment/cloud/__init__.py +0 -9
isa_model/deployment/cloud/modal/__init__.py +0 -10
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +0 -766
isa_model/deployment/cloud/modal/isa_vision_table_service.py +0 -532
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +0 -406
isa_model/deployment/cloud/modal/register_models.py +0 -321
isa_model/deployment/core/deployment_config.py +0 -356
isa_model/deployment/core/isa_deployment_service.py +0 -401
isa_model/deployment/gpu_int8_ds8/app/server.py +0 -66
isa_model/deployment/gpu_int8_ds8/scripts/test_client.py +0 -43
isa_model/deployment/gpu_int8_ds8/scripts/test_client_os.py +0 -35
isa_model/deployment/runtime/deployed_service.py +0 -338
isa_model/deployment/services/__init__.py +0 -9
isa_model/deployment/services/auto_deploy_vision_service.py +0 -538
isa_model/deployment/services/model_service.py +0 -332
isa_model/deployment/services/service_monitor.py +0 -356
isa_model/deployment/services/service_registry.py +0 -527
isa_model/eval/__init__.py +0 -92
isa_model/eval/benchmarks.py +0 -469
isa_model/eval/config/__init__.py +0 -10
isa_model/eval/config/evaluation_config.py +0 -108
isa_model/eval/evaluators/__init__.py +0 -18
isa_model/eval/evaluators/base_evaluator.py +0 -503
isa_model/eval/evaluators/llm_evaluator.py +0 -472
isa_model/eval/factory.py +0 -531
isa_model/eval/infrastructure/__init__.py +0 -24
isa_model/eval/infrastructure/experiment_tracker.py +0 -466
isa_model/eval/metrics.py +0 -798
isa_model/inference/adapter/unified_api.py +0 -248
isa_model/inference/services/helpers/stacked_config.py +0 -148
isa_model/inference/services/img/flux_professional_service.py +0 -603
isa_model/inference/services/img/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/others/table_transformer_service.py +0 -61
isa_model/inference/services/vision/doc_analysis_service.py +0 -640
isa_model/inference/services/vision/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/vision/ui_analysis_service.py +0 -823
isa_model/scripts/inference_tracker.py +0 -283
isa_model/scripts/mlflow_manager.py +0 -379
isa_model/scripts/model_registry.py +0 -465
isa_model/scripts/register_models.py +0 -370
isa_model/scripts/register_models_with_embeddings.py +0 -510
isa_model/scripts/start_mlflow.py +0 -95
isa_model/scripts/training_tracker.py +0 -257
isa_model/training/__init__.py +0 -74
isa_model/training/annotation/annotation_schema.py +0 -47
isa_model/training/annotation/processors/annotation_processor.py +0 -126
isa_model/training/annotation/storage/dataset_manager.py +0 -131
isa_model/training/annotation/storage/dataset_schema.py +0 -44
isa_model/training/annotation/tests/test_annotation_flow.py +0 -109
isa_model/training/annotation/tests/test_minio copy.py +0 -113
isa_model/training/annotation/tests/test_minio_upload.py +0 -43
isa_model/training/annotation/views/annotation_controller.py +0 -158
isa_model/training/cloud/__init__.py +0 -22
isa_model/training/cloud/job_orchestrator.py +0 -402
isa_model/training/cloud/runpod_trainer.py +0 -454
isa_model/training/cloud/storage_manager.py +0 -482
isa_model/training/core/__init__.py +0 -23
isa_model/training/core/config.py +0 -181
isa_model/training/core/dataset.py +0 -222
isa_model/training/core/trainer.py +0 -720
isa_model/training/core/utils.py +0 -213
isa_model/training/factory.py +0 -424
isa_model-0.3.91.dist-info/RECORD +0 -138
/isa_model/{core/storage/minio_storage.py → deployment/modal/services/audio/isa_audio_fish_service.py} +0 -0
/isa_model/deployment/{services → modal/services/vision}/simple_auto_deploy_vision_service.py +0 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/WHEEL +0 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/top_level.txt +0 -0

isa_model/inference/services/audio/openai_stt_service.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import logging
+import os
 import aiohttp
 from typing import Dict, Any, List, Union, Optional, BinaryIO
 from openai import AsyncOpenAI
@@ -46,7 +47,7 @@ class OpenAISTTService(BaseSTTService):
         wait=wait_exponential(multiplier=1, min=4, max=10),
         reraise=True
     )
-    async def transcribe(self, audio_file: Union[str, BinaryIO], language: Optional[str] = None, prompt: Optional[str] = None) -> Dict[str, Any]:
+    async def transcribe(self, audio_file: Union[str, BinaryIO, bytes], language: Optional[str] = None, prompt: Optional[str] = None, **kwargs) -> Dict[str, Any]:
         """
         Transcribe audio file to text using OpenAI's Whisper model.
@@ -72,13 +73,54 @@ class OpenAISTTService(BaseSTTService):
             if prompt:
                 transcription_params["prompt"] = prompt
-            # Handle file input
-            if isinstance(audio_file, str):
-                with open(audio_file, "rb") as f:
-                    transcription = await self.client.audio.transcriptions.create(
-                        file=f,
-                        **transcription_params
-                    )
+            # Handle file input - support bytes, base64 strings, file paths, and file objects
+            if isinstance(audio_file, bytes):
+                # Handle bytes data directly
+                logger.info(f"Processing bytes audio data ({len(audio_file)} bytes)")
+                from io import BytesIO
+                audio_buffer = BytesIO(audio_file)
+                # Use filename from kwargs if provided, otherwise default to .mp3
+                filename = kwargs.get('filename', 'audio.mp3')
+                if filename and not filename.endswith(('.mp3', '.wav', '.m4a', '.flac', '.ogg', '.webm', '.mp4')):
+                    filename += '.mp3'  # Add extension if missing
+                audio_buffer.name = filename
+                logger.info(f"Using filename: {filename}")
+                transcription = await self.client.audio.transcriptions.create(
+                    file=audio_buffer,
+                    **transcription_params
+                )
+            elif isinstance(audio_file, str):
+                # Check if it's a base64 string or file path
+                if len(audio_file) > 100 and not os.path.exists(audio_file):
+                    # Likely a base64 string
+                    try:
+                        import base64
+                        from io import BytesIO
+                        logger.info(f"Attempting to decode base64 audio data (length: {len(audio_file)})")
+                        audio_data = base64.b64decode(audio_file)
+                        audio_buffer = BytesIO(audio_data)
+                        audio_buffer.name = "audio.wav"  # OpenAI needs a filename hint
+                        logger.info(f"Successfully decoded base64 to {len(audio_data)} bytes")
+                        transcription = await self.client.audio.transcriptions.create(
+                            file=audio_buffer,
+                            **transcription_params
+                        )
+                    except Exception as e:
+                        # If base64 decoding fails, treat as file path
+                        logger.error(f"Base64 decoding failed: {e}, treating as file path")
+                        with open(audio_file, "rb") as f:
+                            transcription = await self.client.audio.transcriptions.create(
+                                file=f,
+                                **transcription_params
+                            )
+                else:
+                    # Regular file path
+                    with open(audio_file, "rb") as f:
+                        transcription = await self.client.audio.transcriptions.create(
+                            file=f,
+                            **transcription_params
+                        )
             else:
                 transcription = await self.client.audio.transcriptions.create(
                     file=audio_file,
@@ -121,7 +163,7 @@ class OpenAISTTService(BaseSTTService):
         wait=wait_exponential(multiplier=1, min=4, max=10),
         reraise=True
     )
-    async def translate(self, audio_file: Union[str, BinaryIO]) -> Dict[str, Any]:
+    async def translate(self, audio_file: Union[str, BinaryIO, bytes]) -> Dict[str, Any]:
         """
         Translate audio file to English text using OpenAI's Whisper model.
@@ -185,7 +227,7 @@ class OpenAISTTService(BaseSTTService):
             logger.error(f"Translation failed: {e}")
             raise
-    async def transcribe_batch(self, audio_files: List[Union[str, BinaryIO]], language: Optional[str] = None, prompt: Optional[str] = None) -> List[Dict[str, Any]]:
+    async def transcribe_batch(self, audio_files: List[Union[str, BinaryIO, bytes]], language: Optional[str] = None, prompt: Optional[str] = None) -> List[Dict[str, Any]]:
         """
         Transcribe multiple audio files in batch.
@@ -212,7 +254,7 @@ class OpenAISTTService(BaseSTTService):
         return results
-    async def detect_language(self, audio_file: Union[str, BinaryIO]) -> Dict[str, Any]:
+    async def detect_language(self, audio_file: Union[str, BinaryIO, bytes]) -> Dict[str, Any]:
         """
         Detect the language of an audio file.

isa_model/inference/services/base_service.py CHANGED Viewed

@@ -66,7 +66,8 @@ class BaseService(ABC):
                     output_tokens=output_tokens
                 )
-            # Track usage through model manager
+            # Track usage through both systems (legacy and new)
+            # Legacy detailed tracking (will be phased out)
             self.model_manager.billing_tracker.track_model_usage(
                 model_id=self.model_name,
                 operation_type="inference",
@@ -80,6 +81,21 @@ class BaseService(ABC):
                 cost_usd=cost_usd,
                 metadata=metadata
             )
+            # New aggregated statistics tracking
+            self.model_manager.statistics_tracker.track_usage(
+                model_id=self.model_name,
+                provider=self.provider_name,
+                service_type=service_type if isinstance(service_type, str) else service_type.value,
+                operation_type="inference",
+                operation=operation,
+                input_tokens=input_tokens,
+                output_tokens=output_tokens,
+                input_units=input_units,
+                output_units=output_units,
+                cost_usd=cost_usd or 0.0,
+                metadata=metadata
+            )
         except Exception as e:
             # Don't let billing tracking break the service
             import logging

isa_model/inference/services/custom_model_manager.py ADDED Viewed

@@ -0,0 +1,277 @@
+#!/usr/bin/env python
+# -*- coding: utf-8 -*-
+"""
+Custom Model Manager - Handles registration and management of custom trained models
+Provides integration for models trained through ISA Model training pipeline
+"""
+import logging
+import json
+import os
+from typing import Dict, List, Any, Optional
+from datetime import datetime
+from dataclasses import dataclass, asdict
+logger = logging.getLogger(__name__)
+@dataclass
+class CustomModelInfo:
+    """Information about a custom model"""
+    model_id: str
+    model_name: str
+    model_type: str  # 'text', 'vision', 'audio', etc.
+    provider: str
+    base_model: str  # The base model this was fine-tuned from
+    training_date: str
+    model_path: str  # Local path or HuggingFace repo
+    metadata: Dict[str, Any]
+    capabilities: List[str]
+    performance_metrics: Optional[Dict[str, float]] = None
+    deployment_config: Optional[Dict[str, Any]] = None
+    def to_dict(self) -> Dict[str, Any]:
+        return asdict(self)
+class CustomModelManager:
+    """
+    Manages custom trained models in the ISA Model ecosystem
+    Handles registration, discovery, and integration of custom models
+    """
+    def __init__(self, models_registry_path: str = None):
+        self.models_registry_path = models_registry_path or os.path.join(
+            os.path.expanduser("~"), ".isa_model", "custom_models.json"
+        )
+        self._models: Dict[str, CustomModelInfo] = {}
+        self._load_models_registry()
+    def _load_models_registry(self):
+        """Load custom models registry from file"""
+        if os.path.exists(self.models_registry_path):
+            try:
+                with open(self.models_registry_path, 'r', encoding='utf-8') as f:
+                    models_data = json.load(f)
+                for model_data in models_data.get('models', []):
+                    model_info = CustomModelInfo(**model_data)
+                    self._models[model_info.model_id] = model_info
+                logger.info(f"Loaded {len(self._models)} custom models from registry")
+            except Exception as e:
+                logger.warning(f"Failed to load models registry: {e}")
+                self._models = {}
+        else:
+            # Create default registry with some ISA models
+            self._create_default_registry()
+    def _create_default_registry(self):
+        """Create default registry with ISA models"""
+        default_models = [
+            CustomModelInfo(
+                model_id="isa-llm-service",
+                model_name="ISA LLM Service",
+                model_type="text",
+                provider="isa",
+                base_model="DialoGPT-small",
+                training_date="2024-12-19",
+                model_path="modal://isa-llm-inference",
+                metadata={
+                    "description": "ISA custom LLM service with fallback support",
+                    "parameters": "124M",
+                    "context_length": 1024,
+                    "languages": ["en", "zh"]
+                },
+                capabilities=["chat", "text_generation", "conversation"],
+                performance_metrics={
+                    "perplexity": 3.2,
+                    "bleu_score": 0.75,
+                    "response_time_ms": 850
+                },
+                deployment_config={
+                    "platform": "modal",
+                    "gpu_type": "A10G",
+                    "memory_gb": 16,
+                    "concurrent_requests": 5
+                }
+            ),
+            CustomModelInfo(
+                model_id="xenodennis/dialoGPT-small-20241219-v1",
+                model_name="ISA Fine-tuned DialoGPT",
+                model_type="text",
+                provider="huggingface",
+                base_model="microsoft/DialoGPT-small",
+                training_date="2024-12-19",
+                model_path="xenodennis/dialoGPT-small-20241219-v1",
+                metadata={
+                    "description": "DialoGPT model fine-tuned with ISA training pipeline",
+                    "parameters": "124M",
+                    "trainable_parameters": "294K (LoRA)",
+                    "training_steps": 1000,
+                    "languages": ["en", "zh"]
+                },
+                capabilities=["chat", "text_generation", "dialogue"],
+                performance_metrics={
+                    "final_loss": 2.1234,
+                    "eval_loss": 2.3456,
+                    "training_time_minutes": 15
+                }
+            ),
+            CustomModelInfo(
+                model_id="isa-custom-embeddings",
+                model_name="ISA Custom Embeddings",
+                model_type="embedding",
+                provider="isa",
+                base_model="sentence-transformers/all-MiniLM-L6-v2",
+                training_date="2024-12-19",
+                model_path="local://models/isa-embeddings",
+                metadata={
+                    "description": "Custom embeddings trained on ISA domain data",
+                    "dimensions": 384,
+                    "max_sequence_length": 512
+                },
+                capabilities=["embed", "similarity", "clustering"]
+            )
+        ]
+        for model in default_models:
+            self._models[model.model_id] = model
+        self._save_models_registry()
+        logger.info(f"Created default registry with {len(default_models)} models")
+    def _save_models_registry(self):
+        """Save models registry to file"""
+        try:
+            os.makedirs(os.path.dirname(self.models_registry_path), exist_ok=True)
+            registry_data = {
+                "version": "1.0",
+                "last_updated": datetime.now().isoformat(),
+                "models": [model.to_dict() for model in self._models.values()]
+            }
+            with open(self.models_registry_path, 'w', encoding='utf-8') as f:
+                json.dump(registry_data, f, indent=2, ensure_ascii=False)
+            logger.debug(f"Saved models registry to {self.models_registry_path}")
+        except Exception as e:
+            logger.error(f"Failed to save models registry: {e}")
+    def register_model(self, model_info: CustomModelInfo) -> bool:
+        """Register a new custom model"""
+        try:
+            self._models[model_info.model_id] = model_info
+            self._save_models_registry()
+            logger.info(f"Registered custom model: {model_info.model_id}")
+            return True
+        except Exception as e:
+            logger.error(f"Failed to register model {model_info.model_id}: {e}")
+            return False
+    def unregister_model(self, model_id: str) -> bool:
+        """Unregister a custom model"""
+        if model_id in self._models:
+            del self._models[model_id]
+            self._save_models_registry()
+            logger.info(f"Unregistered custom model: {model_id}")
+            return True
+        return False
+    def get_model(self, model_id: str) -> Optional[CustomModelInfo]:
+        """Get custom model information"""
+        return self._models.get(model_id)
+    def list_models(self, model_type: str = None, provider: str = None) -> List[CustomModelInfo]:
+        """List custom models with optional filtering"""
+        models = list(self._models.values())
+        if model_type:
+            models = [m for m in models if m.model_type == model_type]
+        if provider:
+            models = [m for m in models if m.provider == provider]
+        return models
+    def get_models_for_api(self) -> List[Dict[str, Any]]:
+        """Get models in API format for model listing"""
+        api_models = []
+        for model in self._models.values():
+            api_model = {
+                "model_id": model.model_id,
+                "service_type": model.model_type,
+                "provider": model.provider,
+                "description": model.metadata.get("description", ""),
+                "capabilities": model.capabilities,
+                "custom": True,
+                "base_model": model.base_model,
+                "training_date": model.training_date
+            }
+            # Add performance metrics if available
+            if model.performance_metrics:
+                api_model["performance"] = model.performance_metrics
+            api_models.append(api_model)
+        return api_models
+    def search_models(self, query: str) -> List[CustomModelInfo]:
+        """Search custom models by query"""
+        query_lower = query.lower()
+        matching_models = []
+        for model in self._models.values():
+            # Search in model_id, name, description, and capabilities
+            searchable_text = f"{model.model_id} {model.model_name} {model.metadata.get('description', '')} {' '.join(model.capabilities)}".lower()
+            if query_lower in searchable_text:
+                matching_models.append(model)
+        return matching_models
+    def get_deployment_config(self, model_id: str) -> Optional[Dict[str, Any]]:
+        """Get deployment configuration for a model"""
+        model = self.get_model(model_id)
+        return model.deployment_config if model else None
+    def update_performance_metrics(self, model_id: str, metrics: Dict[str, float]) -> bool:
+        """Update performance metrics for a model"""
+        model = self.get_model(model_id)
+        if model:
+            model.performance_metrics = metrics
+            self._save_models_registry()
+            return True
+        return False
+    def get_provider_models(self, provider: str) -> List[CustomModelInfo]:
+        """Get all models for a specific provider"""
+        return [model for model in self._models.values() if model.provider == provider]
+    def get_stats(self) -> Dict[str, Any]:
+        """Get statistics about custom models"""
+        models_by_type = {}
+        models_by_provider = {}
+        for model in self._models.values():
+            models_by_type[model.model_type] = models_by_type.get(model.model_type, 0) + 1
+            models_by_provider[model.provider] = models_by_provider.get(model.provider, 0) + 1
+        return {
+            "total_models": len(self._models),
+            "models_by_type": models_by_type,
+            "models_by_provider": models_by_provider,
+            "registry_path": self.models_registry_path
+        }
+# Global instance
+_custom_model_manager = None
+def get_custom_model_manager() -> CustomModelManager:
+    """Get the global custom model manager instance"""
+    global _custom_model_manager
+    if _custom_model_manager is None:
+        _custom_model_manager = CustomModelManager()
+    return _custom_model_manager

isa_model/inference/services/embedding/__init__.py ADDED Viewed

@@ -0,0 +1,13 @@
+"""
+Embedding Services - Text and Document Embedding Services
+"""
+from .base_embed_service import BaseEmbedService
+from .openai_embed_service import OpenAIEmbedService
+from .ollama_embed_service import OllamaEmbedService
+__all__ = [
+    'BaseEmbedService',
+    'OpenAIEmbedService',
+    'OllamaEmbedService'
+]

isa_model/inference/services/embedding/base_embed_service.py CHANGED Viewed

@@ -36,17 +36,29 @@ class BaseEmbedService(BaseService):
             if not isinstance(input_data, list):
                 input_data = [input_data]
             return await self.create_text_embeddings(input_data)
-        elif task == "chunk_and_embed":
+        elif task in ["chunk", "chunk_and_embed"]:
             if isinstance(input_data, list):
-                raise ValueError("chunk_and_embed task requires single text input")
-            return await self.create_chunks(input_data, kwargs.get("metadata"))
+                raise ValueError("chunk task requires single text input")
+            return await self.create_chunks(input_data, **kwargs)
         elif task == "similarity":
+            # Support both text-based and embedding-based similarity
+            candidates = kwargs.get("candidates")
             embedding1 = kwargs.get("embedding1")
             embedding2 = kwargs.get("embedding2")
-            if not embedding1 or not embedding2:
-                raise ValueError("similarity task requires embedding1 and embedding2 parameters")
-            similarity = await self.compute_similarity(embedding1, embedding2)
-            return {"similarity": similarity}
+            if candidates:
+                # Text-based similarity - compute embeddings first
+                if isinstance(input_data, list):
+                    raise ValueError("similarity task with candidates requires single query text")
+                # Remove candidates from kwargs to avoid duplicate parameter
+                similarity_kwargs = {k: v for k, v in kwargs.items() if k != 'candidates'}
+                return await self._text_similarity_search(input_data, candidates, **similarity_kwargs)
+            elif embedding1 and embedding2:
+                # Direct embedding similarity
+                similarity = await self.compute_similarity(embedding1, embedding2)
+                return {"similarity": similarity}
+            else:
+                raise ValueError("similarity task requires either 'candidates' parameter or both 'embedding1' and 'embedding2' parameters")
         elif task == "find_similar":
             query_embedding = kwargs.get("query_embedding")
             candidate_embeddings = kwargs.get("candidate_embeddings")
@@ -57,6 +69,21 @@ class BaseEmbedService(BaseService):
                 candidate_embeddings,
                 kwargs.get("top_k", 5)
             )
+        # ==================== 重排序类任务 ====================
+        elif task in ["rerank", "rerank_documents", "document_ranking"]:
+            query = kwargs.get("query") or input_data
+            documents = kwargs.get("documents")
+            if not documents:
+                raise ValueError("rerank task requires documents parameter")
+            if isinstance(query, list):
+                raise ValueError("rerank task requires single query string")
+            return await self.rerank_documents(
+                query=query,
+                documents=documents,
+                top_k=kwargs.get("top_k"),
+                return_documents=kwargs.get("return_documents", True)
+            )
         else:
             raise NotImplementedError(f"{self.__class__.__name__} does not support task: {task}")
@@ -67,7 +94,51 @@ class BaseEmbedService(BaseService):
         Returns:
             List of supported task names
         """
-        return ["embed", "embed_batch", "chunk_and_embed", "similarity", "find_similar"]
+        return ["embed", "embed_batch", "chunk", "chunk_and_embed", "similarity", "find_similar", "rerank", "rerank_documents", "document_ranking"]
+    async def _text_similarity_search(self, query_text: str, candidates: List[str], **kwargs) -> Dict[str, Any]:
+        """
+        Helper method for text-based similarity search
+        Args:
+            query_text: Query text
+            candidates: List of candidate texts
+            **kwargs: Additional parameters (top_k, threshold, etc.)
+        Returns:
+            Dictionary containing similar documents with scores
+        """
+        # Get embeddings for query and candidates
+        query_embedding = await self.create_text_embedding(query_text)
+        candidate_embeddings = await self.create_text_embeddings(candidates)
+        # Find similar texts
+        similar_results = await self.find_similar_texts(
+            query_embedding,
+            candidate_embeddings,
+            kwargs.get("top_k", len(candidates))
+        )
+        # Apply threshold if specified
+        threshold = kwargs.get("threshold")
+        if threshold is not None:
+            similar_results = [r for r in similar_results if r["similarity"] >= threshold]
+        # Convert to expected format with text content
+        similar_documents = []
+        for result in similar_results:
+            similar_documents.append({
+                "text": candidates[result["index"]],
+                "similarity": result["similarity"],
+                "index": result["index"]
+            })
+        return {
+            "similar_documents": similar_documents,
+            "query": query_text,
+            "total_candidates": len(candidates),
+            "returned_count": len(similar_documents)
+        }
     @abstractmethod
     async def create_text_embedding(self, text: str) -> List[float]:
@@ -170,6 +241,38 @@ class BaseEmbedService(BaseService):
         """
         pass
+    async def rerank_documents(
+        self,
+        query: str,
+        documents: List[str],
+        top_k: Optional[int] = None,
+        return_documents: bool = True
+    ) -> Dict[str, Any]:
+        """
+        Rerank documents based on relevance to query
+        Default implementation returns NotImplementedError.
+        Override in subclasses that support reranking.
+        Args:
+            query: Search query string
+            documents: List of documents to rerank
+            top_k: Number of top results to return (None = all)
+            return_documents: Whether to include document text in results
+        Returns:
+            Dictionary containing:
+            - success: Boolean success status
+            - results: List of ranked documents with scores
+            - metadata: Additional information (model, timing, etc.)
+        """
+        return {
+            'success': False,
+            'error': f'Reranking not supported by {self.__class__.__name__}',
+            'provider': getattr(self, 'provider_name', 'unknown'),
+            'service': getattr(self, 'model_name', 'unknown')
+        }
     @abstractmethod
     async def close(self):
         """Cleanup resources"""

isa-model 0.3.91__py3-none-any.whl → 0.4.3__py3-none-any.whl

isa-model 0.3.91py3-none-any.whl → 0.4.3py3-none-any.whl