PyPI - isa-model - Versions diffs - 0.3.9__py3-none-any.whl → 0.4.0__py3-none-any.whl - Mend

isa-model 0.3.9py3-none-any.whl → 0.4.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (124) hide show

isa_model/__init__.py +1 -1
isa_model/client.py +732 -565
isa_model/core/cache/redis_cache.py +401 -0
isa_model/core/config/config_manager.py +53 -10
isa_model/core/config.py +1 -1
isa_model/core/database/__init__.py +1 -0
isa_model/core/database/migrations.py +277 -0
isa_model/core/database/supabase_client.py +123 -0
isa_model/core/models/__init__.py +37 -0
isa_model/core/models/model_billing_tracker.py +60 -88
isa_model/core/models/model_manager.py +36 -18
isa_model/core/models/model_repo.py +44 -38
isa_model/core/models/model_statistics_tracker.py +234 -0
isa_model/core/models/model_storage.py +0 -1
isa_model/core/models/model_version_manager.py +959 -0
isa_model/core/pricing_manager.py +2 -249
isa_model/core/resilience/circuit_breaker.py +366 -0
isa_model/core/security/secrets.py +358 -0
isa_model/core/services/__init__.py +2 -4
isa_model/core/services/intelligent_model_selector.py +101 -370
isa_model/core/storage/hf_storage.py +1 -1
isa_model/core/types.py +7 -0
isa_model/deployment/cloud/modal/isa_audio_chatTTS_service.py +520 -0
isa_model/deployment/cloud/modal/isa_audio_fish_service.py +0 -0
isa_model/deployment/cloud/modal/isa_audio_openvoice_service.py +758 -0
isa_model/deployment/cloud/modal/isa_audio_service_v2.py +1044 -0
isa_model/deployment/cloud/modal/isa_embed_rerank_service.py +296 -0
isa_model/deployment/cloud/modal/isa_video_hunyuan_service.py +423 -0
isa_model/deployment/cloud/modal/isa_vision_ocr_service.py +519 -0
isa_model/deployment/cloud/modal/isa_vision_qwen25_service.py +709 -0
isa_model/deployment/cloud/modal/isa_vision_table_service.py +467 -323
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +607 -180
isa_model/deployment/cloud/modal/isa_vision_ui_service_optimized.py +660 -0
isa_model/deployment/core/deployment_manager.py +6 -4
isa_model/deployment/services/auto_hf_modal_deployer.py +894 -0
isa_model/eval/benchmarks/__init__.py +27 -0
isa_model/eval/benchmarks/multimodal_datasets.py +460 -0
isa_model/eval/benchmarks.py +244 -12
isa_model/eval/evaluators/__init__.py +8 -2
isa_model/eval/evaluators/audio_evaluator.py +727 -0
isa_model/eval/evaluators/embedding_evaluator.py +742 -0
isa_model/eval/evaluators/vision_evaluator.py +564 -0
isa_model/eval/example_evaluation.py +395 -0
isa_model/eval/factory.py +272 -5
isa_model/eval/isa_benchmarks.py +700 -0
isa_model/eval/isa_integration.py +582 -0
isa_model/eval/metrics.py +159 -6
isa_model/eval/tests/unit/test_basic.py +396 -0
isa_model/inference/ai_factory.py +44 -8
isa_model/inference/services/audio/__init__.py +21 -0
isa_model/inference/services/audio/base_realtime_service.py +225 -0
isa_model/inference/services/audio/isa_tts_service.py +0 -0
isa_model/inference/services/audio/openai_realtime_service.py +320 -124
isa_model/inference/services/audio/openai_stt_service.py +32 -6
isa_model/inference/services/base_service.py +17 -1
isa_model/inference/services/embedding/__init__.py +13 -0
isa_model/inference/services/embedding/base_embed_service.py +111 -8
isa_model/inference/services/embedding/isa_embed_service.py +305 -0
isa_model/inference/services/embedding/openai_embed_service.py +2 -4
isa_model/inference/services/embedding/tests/test_embedding.py +222 -0
isa_model/inference/services/img/__init__.py +2 -2
isa_model/inference/services/img/base_image_gen_service.py +24 -7
isa_model/inference/services/img/replicate_image_gen_service.py +84 -422
isa_model/inference/services/img/services/replicate_face_swap.py +193 -0
isa_model/inference/services/img/services/replicate_flux.py +226 -0
isa_model/inference/services/img/services/replicate_flux_kontext.py +219 -0
isa_model/inference/services/img/services/replicate_sticker_maker.py +249 -0
isa_model/inference/services/img/tests/test_img_client.py +297 -0
isa_model/inference/services/llm/base_llm_service.py +30 -6
isa_model/inference/services/llm/helpers/llm_adapter.py +63 -9
isa_model/inference/services/llm/ollama_llm_service.py +2 -1
isa_model/inference/services/llm/openai_llm_service.py +652 -55
isa_model/inference/services/llm/yyds_llm_service.py +2 -1
isa_model/inference/services/vision/__init__.py +5 -5
isa_model/inference/services/vision/base_vision_service.py +118 -185
isa_model/inference/services/vision/helpers/image_utils.py +11 -5
isa_model/inference/services/vision/isa_vision_service.py +573 -0
isa_model/inference/services/vision/tests/test_ocr_client.py +284 -0
isa_model/serving/api/fastapi_server.py +88 -16
isa_model/serving/api/middleware/auth.py +311 -0
isa_model/serving/api/middleware/security.py +278 -0
isa_model/serving/api/routes/analytics.py +486 -0
isa_model/serving/api/routes/deployments.py +339 -0
isa_model/serving/api/routes/evaluations.py +579 -0
isa_model/serving/api/routes/logs.py +430 -0
isa_model/serving/api/routes/settings.py +582 -0
isa_model/serving/api/routes/unified.py +324 -165
isa_model/serving/api/startup.py +304 -0
isa_model/serving/modal_proxy_server.py +249 -0
isa_model/training/__init__.py +100 -6
isa_model/training/core/__init__.py +4 -1
isa_model/training/examples/intelligent_training_example.py +281 -0
isa_model/training/intelligent/__init__.py +25 -0
isa_model/training/intelligent/decision_engine.py +643 -0
isa_model/training/intelligent/intelligent_factory.py +888 -0
isa_model/training/intelligent/knowledge_base.py +751 -0
isa_model/training/intelligent/resource_optimizer.py +839 -0
isa_model/training/intelligent/task_classifier.py +576 -0
isa_model/training/storage/__init__.py +24 -0
isa_model/training/storage/core_integration.py +439 -0
isa_model/training/storage/training_repository.py +552 -0
isa_model/training/storage/training_storage.py +628 -0
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/METADATA +13 -1
isa_model-0.4.0.dist-info/RECORD +182 -0
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +0 -766
isa_model/deployment/cloud/modal/register_models.py +0 -321
isa_model/inference/adapter/unified_api.py +0 -248
isa_model/inference/services/helpers/stacked_config.py +0 -148
isa_model/inference/services/img/flux_professional_service.py +0 -603
isa_model/inference/services/img/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/others/table_transformer_service.py +0 -61
isa_model/inference/services/vision/doc_analysis_service.py +0 -640
isa_model/inference/services/vision/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/vision/ui_analysis_service.py +0 -823
isa_model/scripts/inference_tracker.py +0 -283
isa_model/scripts/mlflow_manager.py +0 -379
isa_model/scripts/model_registry.py +0 -465
isa_model/scripts/register_models.py +0 -370
isa_model/scripts/register_models_with_embeddings.py +0 -510
isa_model/scripts/start_mlflow.py +0 -95
isa_model/scripts/training_tracker.py +0 -257
isa_model-0.3.9.dist-info/RECORD +0 -138
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/WHEEL +0 -0
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/top_level.txt +0 -0

isa_model/eval/factory.py CHANGED Viewed

@@ -16,9 +16,45 @@ from typing import Optional, Dict, Any, List, Union, Callable
 from pathlib import Path
 import json
-from .evaluators import LLMEvaluator, VisionEvaluator, MultimodalEvaluator, EvaluationResult
-from .infrastructure import ExperimentTracker, create_experiment_tracker
-from .config import EvaluationConfig
+from .evaluators import LLMEvaluator, VisionEvaluator, AudioEvaluator, EmbeddingEvaluator, EvaluationResult
+from .isa_integration import ISAModelInterface
+try:
+    from .infrastructure import ExperimentTracker, create_experiment_tracker
+    EXPERIMENT_TRACKING_AVAILABLE = True
+except ImportError:
+    EXPERIMENT_TRACKING_AVAILABLE = False
+    logger.warning("Experiment tracking not available")
+try:
+    from .config import EvaluationConfig
+    CONFIG_AVAILABLE = True
+except ImportError:
+    CONFIG_AVAILABLE = False
+    # Create a simple config class
+    class EvaluationConfig:
+        def __init__(self):
+            self.batch_size = 16
+            self.output_dir = "./evaluation_results"
+            self.default_temperature = 0.7
+            self.default_max_tokens = 512
+            self.max_concurrent_evaluations = 3
+        def to_dict(self):
+            return {
+                "batch_size": self.batch_size,
+                "output_dir": self.output_dir,
+                "default_temperature": self.default_temperature,
+                "default_max_tokens": self.default_max_tokens,
+                "max_concurrent_evaluations": self.max_concurrent_evaluations
+            }
+        @classmethod
+        def from_dict(cls, config_dict):
+            config = cls()
+            for key, value in config_dict.items():
+                if hasattr(config, key):
+                    setattr(config, key, value)
+            return config
 logger = logging.getLogger(__name__)
@@ -103,19 +139,37 @@ class EvaluationFactory:
         # Initialize experiment tracker
         self.experiment_tracker = None
-        if experiment_tracking:
+        if experiment_tracking and EXPERIMENT_TRACKING_AVAILABLE:
             try:
                 self.experiment_tracker = create_experiment_tracker(**experiment_tracking)
                 logger.info(f"Initialized experiment tracking: {experiment_tracking['type']}")
             except Exception as e:
                 logger.warning(f"Failed to initialize experiment tracking: {e}")
+        # Initialize ISA Model interface
+        self.isa_interface = ISAModelInterface()
         # Initialize evaluators
         self.llm_evaluator = LLMEvaluator(
             config=self.config.to_dict(),
             experiment_tracker=self.experiment_tracker
         )
+        self.vision_evaluator = VisionEvaluator(
+            config=self.config.to_dict(),
+            experiment_tracker=self.experiment_tracker
+        )
+        self.audio_evaluator = AudioEvaluator(
+            config=self.config.to_dict(),
+            experiment_tracker=self.experiment_tracker
+        )
+        self.embedding_evaluator = EmbeddingEvaluator(
+            config=self.config.to_dict(),
+            experiment_tracker=self.experiment_tracker
+        )
         # State tracking
         self._active_evaluations: Dict[str, asyncio.Task] = {}
@@ -171,7 +225,7 @@ class EvaluationFactory:
         # Run evaluation
         result = await self.llm_evaluator.evaluate(
-            model_interface=None,  # Will use AI factory
+            model_interface=self.isa_interface,
             dataset=dataset,
             dataset_name=dataset_name,
             model_name=f"{provider}:{model_name}",
@@ -329,6 +383,219 @@ class EvaluationFactory:
         return results
+    async def evaluate_vision(self,
+                            dataset: List[Dict[str, Any]],
+                            task_type: str = "ocr",
+                            model_name: str = "gpt-4.1-mini",
+                            save_results: bool = True,
+                            experiment_name: Optional[str] = None) -> EvaluationResult:
+        """
+        Evaluate vision model on image tasks.
+        Args:
+            dataset: Vision dataset with images and expected outputs
+            task_type: Vision task type (ocr, table, ui, vqa, caption)
+            model_name: Vision model name
+            save_results: Whether to save results
+            experiment_name: Custom experiment name
+        Returns:
+            Vision evaluation results
+        """
+        # Configure vision evaluator
+        self.vision_evaluator.config.update({
+            "task_type": task_type,
+            "model_name": model_name
+        })
+        experiment_name = experiment_name or f"vision_{task_type}_{model_name}"
+        result = await self.vision_evaluator.evaluate(
+            model_interface=self.isa_interface,
+            dataset=dataset,
+            dataset_name=f"vision_{task_type}",
+            model_name=model_name
+        )
+        if save_results:
+            await self._save_results(result, experiment_name)
+        return result
+    async def evaluate_audio(self,
+                           dataset: List[Dict[str, Any]],
+                           task_type: str = "stt",
+                           model_name: str = "isa_audio_sota_service",
+                           save_results: bool = True,
+                           experiment_name: Optional[str] = None) -> EvaluationResult:
+        """
+        Evaluate audio model on speech tasks.
+        Args:
+            dataset: Audio dataset with audio files and expected outputs
+            task_type: Audio task type (stt, emotion, diarization)
+            model_name: Audio model name
+            save_results: Whether to save results
+            experiment_name: Custom experiment name
+        Returns:
+            Audio evaluation results
+        """
+        # Configure audio evaluator
+        self.audio_evaluator.config.update({
+            "task_type": task_type,
+            "model_name": model_name
+        })
+        experiment_name = experiment_name or f"audio_{task_type}_{model_name}"
+        result = await self.audio_evaluator.evaluate(
+            model_interface=self.isa_interface,
+            dataset=dataset,
+            dataset_name=f"audio_{task_type}",
+            model_name=model_name
+        )
+        if save_results:
+            await self._save_results(result, experiment_name)
+        return result
+    async def evaluate_embedding(self,
+                               dataset: List[Dict[str, Any]],
+                               task_type: str = "similarity",
+                               model_name: str = "text-embedding-3-small",
+                               save_results: bool = True,
+                               experiment_name: Optional[str] = None) -> EvaluationResult:
+        """
+        Evaluate embedding model on semantic tasks.
+        Args:
+            dataset: Embedding dataset with text and expected outputs
+            task_type: Embedding task type (similarity, retrieval, reranking)
+            model_name: Embedding model name
+            save_results: Whether to save results
+            experiment_name: Custom experiment name
+        Returns:
+            Embedding evaluation results
+        """
+        # Configure embedding evaluator
+        self.embedding_evaluator.config.update({
+            "task_type": task_type,
+            "model_name": model_name
+        })
+        experiment_name = experiment_name or f"embedding_{task_type}_{model_name}"
+        result = await self.embedding_evaluator.evaluate(
+            model_interface=self.isa_interface,
+            dataset=dataset,
+            dataset_name=f"embedding_{task_type}",
+            model_name=model_name
+        )
+        if save_results:
+            await self._save_results(result, experiment_name)
+        return result
+    async def compare_models(self,
+                           models: List[Dict[str, str]],
+                           dataset_path: Optional[str] = None,
+                           dataset: Optional[List[Dict[str, Any]]] = None,
+                           evaluator_type: str = "llm",
+                           benchmark_name: Optional[str] = None,
+                           metrics: Optional[List[str]] = None,
+                           save_results: bool = True,
+                           experiment_name: Optional[str] = None) -> Dict[str, EvaluationResult]:
+        """
+        Compare multiple models on the same evaluation task.
+        Args:
+            models: List of model configs [{"name": "gpt-4", "provider": "openai"}, ...]
+            dataset_path: Path to evaluation dataset
+            dataset: Direct dataset input
+            evaluator_type: Type of evaluator (llm, vision, audio, embedding)
+            benchmark_name: Benchmark name (alternative to dataset)
+            metrics: Metrics to compute
+            save_results: Whether to save comparison results
+            experiment_name: Custom experiment name
+        Returns:
+            Dictionary mapping model names to evaluation results
+        """
+        results = {}
+        # Load dataset if needed
+        if dataset is None and dataset_path:
+            dataset = self._load_dataset(dataset_path)
+        # Run evaluations concurrently (with concurrency limits)
+        semaphore = asyncio.Semaphore(self.config.max_concurrent_evaluations)
+        async def evaluate_single_model(model_config: Dict[str, str]) -> tuple:
+            async with semaphore:
+                model_name = model_config["name"]
+                provider = model_config.get("provider", "openai")
+                if evaluator_type == "llm":
+                    if benchmark_name:
+                        result = await self.run_benchmark(
+                            model_name=model_name,
+                            provider=provider,
+                            benchmark_name=benchmark_name,
+                            save_results=False
+                        )
+                    else:
+                        result = await self.evaluate_llm(
+                            model_name=model_name,
+                            provider=provider,
+                            dataset=dataset,
+                            metrics=metrics,
+                            save_results=False
+                        )
+                elif evaluator_type == "vision":
+                    result = await self.evaluate_vision(
+                        dataset=dataset,
+                        model_name=model_name,
+                        save_results=False
+                    )
+                elif evaluator_type == "audio":
+                    result = await self.evaluate_audio(
+                        dataset=dataset,
+                        model_name=model_name,
+                        save_results=False
+                    )
+                elif evaluator_type == "embedding":
+                    result = await self.evaluate_embedding(
+                        dataset=dataset,
+                        model_name=model_name,
+                        save_results=False
+                    )
+                else:
+                    raise ValueError(f"Unknown evaluator type: {evaluator_type}")
+                return f"{provider}:{model_name}", result
+        # Execute all evaluations
+        tasks = [evaluate_single_model(model) for model in models]
+        evaluation_results = await asyncio.gather(*tasks)
+        # Collect results
+        for model_id, result in evaluation_results:
+            results[model_id] = result
+        # Generate comparison report
+        comparison_report = self._generate_comparison_report(results)
+        # Save results if requested
+        if save_results:
+            experiment_name = experiment_name or f"model_comparison_{evaluator_type}_{len(models)}_models"
+            await self._save_comparison_results(results, comparison_report, experiment_name)
+        return results
     def _load_dataset(self, dataset_path: str) -> List[Dict[str, Any]]:
         """Load dataset from file."""
         with open(dataset_path, 'r', encoding='utf-8') as f:

isa-model 0.3.9__py3-none-any.whl → 0.4.0__py3-none-any.whl

isa-model 0.3.9py3-none-any.whl → 0.4.0py3-none-any.whl