PyPI - isa-model - Versions diffs - 0.3.9__py3-none-any.whl → 0.4.0__py3-none-any.whl - Mend

isa-model 0.3.9py3-none-any.whl → 0.4.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (124) hide show

isa_model/__init__.py +1 -1
isa_model/client.py +732 -565
isa_model/core/cache/redis_cache.py +401 -0
isa_model/core/config/config_manager.py +53 -10
isa_model/core/config.py +1 -1
isa_model/core/database/__init__.py +1 -0
isa_model/core/database/migrations.py +277 -0
isa_model/core/database/supabase_client.py +123 -0
isa_model/core/models/__init__.py +37 -0
isa_model/core/models/model_billing_tracker.py +60 -88
isa_model/core/models/model_manager.py +36 -18
isa_model/core/models/model_repo.py +44 -38
isa_model/core/models/model_statistics_tracker.py +234 -0
isa_model/core/models/model_storage.py +0 -1
isa_model/core/models/model_version_manager.py +959 -0
isa_model/core/pricing_manager.py +2 -249
isa_model/core/resilience/circuit_breaker.py +366 -0
isa_model/core/security/secrets.py +358 -0
isa_model/core/services/__init__.py +2 -4
isa_model/core/services/intelligent_model_selector.py +101 -370
isa_model/core/storage/hf_storage.py +1 -1
isa_model/core/types.py +7 -0
isa_model/deployment/cloud/modal/isa_audio_chatTTS_service.py +520 -0
isa_model/deployment/cloud/modal/isa_audio_fish_service.py +0 -0
isa_model/deployment/cloud/modal/isa_audio_openvoice_service.py +758 -0
isa_model/deployment/cloud/modal/isa_audio_service_v2.py +1044 -0
isa_model/deployment/cloud/modal/isa_embed_rerank_service.py +296 -0
isa_model/deployment/cloud/modal/isa_video_hunyuan_service.py +423 -0
isa_model/deployment/cloud/modal/isa_vision_ocr_service.py +519 -0
isa_model/deployment/cloud/modal/isa_vision_qwen25_service.py +709 -0
isa_model/deployment/cloud/modal/isa_vision_table_service.py +467 -323
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +607 -180
isa_model/deployment/cloud/modal/isa_vision_ui_service_optimized.py +660 -0
isa_model/deployment/core/deployment_manager.py +6 -4
isa_model/deployment/services/auto_hf_modal_deployer.py +894 -0
isa_model/eval/benchmarks/__init__.py +27 -0
isa_model/eval/benchmarks/multimodal_datasets.py +460 -0
isa_model/eval/benchmarks.py +244 -12
isa_model/eval/evaluators/__init__.py +8 -2
isa_model/eval/evaluators/audio_evaluator.py +727 -0
isa_model/eval/evaluators/embedding_evaluator.py +742 -0
isa_model/eval/evaluators/vision_evaluator.py +564 -0
isa_model/eval/example_evaluation.py +395 -0
isa_model/eval/factory.py +272 -5
isa_model/eval/isa_benchmarks.py +700 -0
isa_model/eval/isa_integration.py +582 -0
isa_model/eval/metrics.py +159 -6
isa_model/eval/tests/unit/test_basic.py +396 -0
isa_model/inference/ai_factory.py +44 -8
isa_model/inference/services/audio/__init__.py +21 -0
isa_model/inference/services/audio/base_realtime_service.py +225 -0
isa_model/inference/services/audio/isa_tts_service.py +0 -0
isa_model/inference/services/audio/openai_realtime_service.py +320 -124
isa_model/inference/services/audio/openai_stt_service.py +32 -6
isa_model/inference/services/base_service.py +17 -1
isa_model/inference/services/embedding/__init__.py +13 -0
isa_model/inference/services/embedding/base_embed_service.py +111 -8
isa_model/inference/services/embedding/isa_embed_service.py +305 -0
isa_model/inference/services/embedding/openai_embed_service.py +2 -4
isa_model/inference/services/embedding/tests/test_embedding.py +222 -0
isa_model/inference/services/img/__init__.py +2 -2
isa_model/inference/services/img/base_image_gen_service.py +24 -7
isa_model/inference/services/img/replicate_image_gen_service.py +84 -422
isa_model/inference/services/img/services/replicate_face_swap.py +193 -0
isa_model/inference/services/img/services/replicate_flux.py +226 -0
isa_model/inference/services/img/services/replicate_flux_kontext.py +219 -0
isa_model/inference/services/img/services/replicate_sticker_maker.py +249 -0
isa_model/inference/services/img/tests/test_img_client.py +297 -0
isa_model/inference/services/llm/base_llm_service.py +30 -6
isa_model/inference/services/llm/helpers/llm_adapter.py +63 -9
isa_model/inference/services/llm/ollama_llm_service.py +2 -1
isa_model/inference/services/llm/openai_llm_service.py +652 -55
isa_model/inference/services/llm/yyds_llm_service.py +2 -1
isa_model/inference/services/vision/__init__.py +5 -5
isa_model/inference/services/vision/base_vision_service.py +118 -185
isa_model/inference/services/vision/helpers/image_utils.py +11 -5
isa_model/inference/services/vision/isa_vision_service.py +573 -0
isa_model/inference/services/vision/tests/test_ocr_client.py +284 -0
isa_model/serving/api/fastapi_server.py +88 -16
isa_model/serving/api/middleware/auth.py +311 -0
isa_model/serving/api/middleware/security.py +278 -0
isa_model/serving/api/routes/analytics.py +486 -0
isa_model/serving/api/routes/deployments.py +339 -0
isa_model/serving/api/routes/evaluations.py +579 -0
isa_model/serving/api/routes/logs.py +430 -0
isa_model/serving/api/routes/settings.py +582 -0
isa_model/serving/api/routes/unified.py +324 -165
isa_model/serving/api/startup.py +304 -0
isa_model/serving/modal_proxy_server.py +249 -0
isa_model/training/__init__.py +100 -6
isa_model/training/core/__init__.py +4 -1
isa_model/training/examples/intelligent_training_example.py +281 -0
isa_model/training/intelligent/__init__.py +25 -0
isa_model/training/intelligent/decision_engine.py +643 -0
isa_model/training/intelligent/intelligent_factory.py +888 -0
isa_model/training/intelligent/knowledge_base.py +751 -0
isa_model/training/intelligent/resource_optimizer.py +839 -0
isa_model/training/intelligent/task_classifier.py +576 -0
isa_model/training/storage/__init__.py +24 -0
isa_model/training/storage/core_integration.py +439 -0
isa_model/training/storage/training_repository.py +552 -0
isa_model/training/storage/training_storage.py +628 -0
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/METADATA +13 -1
isa_model-0.4.0.dist-info/RECORD +182 -0
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +0 -766
isa_model/deployment/cloud/modal/register_models.py +0 -321
isa_model/inference/adapter/unified_api.py +0 -248
isa_model/inference/services/helpers/stacked_config.py +0 -148
isa_model/inference/services/img/flux_professional_service.py +0 -603
isa_model/inference/services/img/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/others/table_transformer_service.py +0 -61
isa_model/inference/services/vision/doc_analysis_service.py +0 -640
isa_model/inference/services/vision/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/vision/ui_analysis_service.py +0 -823
isa_model/scripts/inference_tracker.py +0 -283
isa_model/scripts/mlflow_manager.py +0 -379
isa_model/scripts/model_registry.py +0 -465
isa_model/scripts/register_models.py +0 -370
isa_model/scripts/register_models_with_embeddings.py +0 -510
isa_model/scripts/start_mlflow.py +0 -95
isa_model/scripts/training_tracker.py +0 -257
isa_model-0.3.9.dist-info/RECORD +0 -138
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/WHEEL +0 -0
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/top_level.txt +0 -0

isa_model/eval/benchmarks.py CHANGED Viewed

@@ -11,13 +11,106 @@ This module provides implementations of standard AI benchmarks:
 import os
 import json
 import logging
+import requests
+import zipfile
+import tarfile
+from pathlib import Path
 from typing import Dict, List, Any, Optional
 from abc import ABC, abstractmethod
 from dataclasses import dataclass
+import pandas as pd
 logger = logging.getLogger(__name__)
+class DatasetDownloader:
+    """Utility class for downloading and caching benchmark datasets."""
+    def __init__(self, cache_dir: str = "~/.isa_model/datasets"):
+        self.cache_dir = Path(cache_dir).expanduser()
+        self.cache_dir.mkdir(parents=True, exist_ok=True)
+        # Dataset URLs and info
+        self.dataset_info = {
+            "mmlu": {
+                "url": "https://people.eecs.berkeley.edu/~hendrycks/data.tar",
+                "filename": "mmlu_data.tar",
+                "extracted_dir": "data"
+            },
+            "hellaswag": {
+                "url": "https://raw.githubusercontent.com/rowanz/hellaswag/master/data/hellaswag_val.jsonl",
+                "filename": "hellaswag_val.jsonl"
+            },
+            "arc": {
+                "url": "https://s3-us-west-2.amazonaws.com/ai2-website/data/ARC-V1-Feb2018.zip",
+                "filename": "arc_data.zip",
+                "extracted_dir": "ARC-V1-Feb2018-2"
+            },
+            "gsm8k": {
+                "url": "https://github.com/openai/grade-school-math/raw/master/grade_school_math/data/test.jsonl",
+                "filename": "gsm8k_test.jsonl"
+            }
+        }
+    def download_dataset(self, dataset_name: str, force_download: bool = False) -> Path:
+        """Download and cache a dataset."""
+        if dataset_name not in self.dataset_info:
+            raise ValueError(f"Unknown dataset: {dataset_name}")
+        info = self.dataset_info[dataset_name]
+        dataset_dir = self.cache_dir / dataset_name
+        dataset_dir.mkdir(exist_ok=True)
+        file_path = dataset_dir / info["filename"]
+        # Check if already downloaded
+        if file_path.exists() and not force_download:
+            logger.info(f"Using cached {dataset_name} dataset at {file_path}")
+            return self._get_data_path(dataset_name, file_path)
+        # Download the dataset
+        logger.info(f"Downloading {dataset_name} dataset from {info['url']}")
+        try:
+            response = requests.get(info["url"], stream=True)
+            response.raise_for_status()
+            with open(file_path, 'wb') as f:
+                for chunk in response.iter_content(chunk_size=8192):
+                    f.write(chunk)
+            logger.info(f"Downloaded {dataset_name} dataset to {file_path}")
+            # Extract if needed
+            return self._get_data_path(dataset_name, file_path)
+        except Exception as e:
+            logger.error(f"Failed to download {dataset_name}: {e}")
+            # Fall back to placeholder data
+            return None
+    def _get_data_path(self, dataset_name: str, file_path: Path) -> Path:
+        """Get the actual data path, extracting archives if needed."""
+        info = self.dataset_info[dataset_name]
+        if "extracted_dir" in info:
+            # Need to extract
+            extract_dir = file_path.parent / info["extracted_dir"]
+            if not extract_dir.exists():
+                logger.info(f"Extracting {file_path}")
+                if file_path.suffix == ".zip":
+                    with zipfile.ZipFile(file_path, 'r') as zip_ref:
+                        zip_ref.extractall(file_path.parent)
+                elif file_path.suffix == ".tar" or ".tar." in file_path.name:
+                    with tarfile.open(file_path, 'r') as tar_ref:
+                        tar_ref.extractall(file_path.parent)
+            return extract_dir
+        else:
+            return file_path
 @dataclass
 class BenchmarkConfig:
     """Configuration for benchmark evaluation."""
@@ -36,6 +129,8 @@ class BaseBenchmark(ABC):
         self.config = config
         self.name = config.name
         self.data = None
+        self.downloader = DatasetDownloader()
+        self.use_real_data = True  # Flag to control real vs placeholder data
     @abstractmethod
     def load_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
@@ -111,10 +206,62 @@ class MMLU(BaseBenchmark):
         self.subjects = subjects or self.all_subjects[:10]  # Use first 10 subjects by default
     def load_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
-        """Load MMLU data (simplified implementation)."""
-        # This is a simplified implementation
-        # In practice, you'd load from the actual MMLU dataset
+        """Load MMLU data with real dataset support."""
+        if self.use_real_data:
+            try:
+                return self._load_real_mmlu_data(max_samples)
+            except Exception as e:
+                logger.warning(f"Failed to load real MMLU data: {e}. Falling back to placeholder data.")
+                return self._load_placeholder_mmlu_data(max_samples)
+        else:
+            return self._load_placeholder_mmlu_data(max_samples)
+    def _load_real_mmlu_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
+        """Load real MMLU dataset."""
+        data_path = self.downloader.download_dataset("mmlu")
+        if not data_path or not data_path.exists():
+            raise FileNotFoundError("MMLU dataset not found")
+        data = []
+        samples_per_subject = max_samples // len(self.subjects) if max_samples else None
+        for subject in self.subjects:
+            subject_file = data_path / "test" / f"{subject}_test.csv"
+            if not subject_file.exists():
+                logger.warning(f"Subject file not found: {subject_file}")
+                continue
+            try:
+                # Load CSV data
+                df = pd.read_csv(subject_file, header=None,
+                               names=["question", "A", "B", "C", "D", "answer"])
+                # Convert to our format
+                for idx, row in df.iterrows():
+                    if samples_per_subject and len([d for d in data if d["subject"] == subject]) >= samples_per_subject:
+                        break
+                    sample = {
+                        "subject": subject,
+                        "question": row["question"],
+                        "choices": [row["A"], row["B"], row["C"], row["D"]],
+                        "answer": str(row["answer"]).strip().upper(),
+                        "id": f"{subject}_{idx}"
+                    }
+                    data.append(sample)
+            except Exception as e:
+                logger.error(f"Error loading subject {subject}: {e}")
+                continue
+        if max_samples:
+            data = data[:max_samples]
+        logger.info(f"Loaded {len(data)} real MMLU samples across {len(self.subjects)} subjects")
+        return data
+    def _load_placeholder_mmlu_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
+        """Load placeholder MMLU data."""
         data = []
         for subject in self.subjects:
@@ -137,7 +284,7 @@ class MMLU(BaseBenchmark):
         if max_samples:
             data = data[:max_samples]
-        logger.info(f"Loaded {len(data)} MMLU samples across {len(self.subjects)} subjects")
+        logger.info(f"Loaded {len(data)} placeholder MMLU samples across {len(self.subjects)} subjects")
         return data
     def evaluate_sample(self, sample: Dict[str, Any], prediction: str) -> bool:
@@ -194,12 +341,52 @@ class HellaSwag(BaseBenchmark):
         super().__init__(config)
     def load_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
-        """Load HellaSwag data (simplified implementation)."""
-        # This is a simplified implementation
-        # In practice, you'd load from the actual HellaSwag dataset
+        """Load HellaSwag data with real dataset support."""
+        if self.use_real_data:
+            try:
+                return self._load_real_hellaswag_data(max_samples)
+            except Exception as e:
+                logger.warning(f"Failed to load real HellaSwag data: {e}. Falling back to placeholder data.")
+                return self._load_placeholder_hellaswag_data(max_samples)
+        else:
+            return self._load_placeholder_hellaswag_data(max_samples)
+    def _load_real_hellaswag_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
+        """Load real HellaSwag dataset."""
+        data_path = self.downloader.download_dataset("hellaswag")
+        if not data_path or not data_path.exists():
+            raise FileNotFoundError("HellaSwag dataset not found")
         data = []
+        try:
+            with open(data_path, 'r', encoding='utf-8') as f:
+                for i, line in enumerate(f):
+                    if max_samples and i >= max_samples:
+                        break
+                    item = json.loads(line.strip())
+                    sample = {
+                        "context": item["ctx"],
+                        "question": "What happens next?",
+                        "choices": item["endings"],
+                        "answer": chr(65 + int(item["label"])),  # Convert 0,1,2,3 to A,B,C,D
+                        "id": f"hellaswag_{item.get('ind', i)}"
+                    }
+                    data.append(sample)
+        except Exception as e:
+            logger.error(f"Error loading HellaSwag data: {e}")
+            raise
+        logger.info(f"Loaded {len(data)} real HellaSwag samples")
+        return data
+    def _load_placeholder_hellaswag_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
+        """Load placeholder HellaSwag data."""
+        data = []
         sample_contexts = [
             "A person is washing dishes in the kitchen",
             "Someone is riding a bicycle down a hill",
@@ -226,7 +413,7 @@ class HellaSwag(BaseBenchmark):
             }
             data.append(sample)
-        logger.info(f"Loaded {len(data)} HellaSwag samples")
+        logger.info(f"Loaded {len(data)} placeholder HellaSwag samples")
         return data
     def evaluate_sample(self, sample: Dict[str, Any], prediction: str) -> bool:
@@ -377,12 +564,57 @@ class GSM8K(BaseBenchmark):
         super().__init__(config)
     def load_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
-        """Load GSM8K data (simplified implementation)."""
-        # This is a simplified implementation
-        # In practice, you'd load from the actual GSM8K dataset
+        """Load GSM8K data with real dataset support."""
+        if self.use_real_data:
+            try:
+                return self._load_real_gsm8k_data(max_samples)
+            except Exception as e:
+                logger.warning(f"Failed to load real GSM8K data: {e}. Falling back to placeholder data.")
+                return self._load_placeholder_gsm8k_data(max_samples)
+        else:
+            return self._load_placeholder_gsm8k_data(max_samples)
+    def _load_real_gsm8k_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
+        """Load real GSM8K dataset."""
+        data_path = self.downloader.download_dataset("gsm8k")
+        if not data_path or not data_path.exists():
+            raise FileNotFoundError("GSM8K dataset not found")
         data = []
+        try:
+            with open(data_path, 'r', encoding='utf-8') as f:
+                for i, line in enumerate(f):
+                    if max_samples and i >= max_samples:
+                        break
+                    item = json.loads(line.strip())
+                    # Extract numerical answer from solution
+                    answer_text = item["answer"]
+                    import re
+                    numbers = re.findall(r'\d+', answer_text)
+                    answer = numbers[-1] if numbers else "0"
+                    sample = {
+                        "question": item["question"],
+                        "answer": answer,
+                        "solution": answer_text,  # Keep full solution for reference
+                        "id": f"gsm8k_{i}"
+                    }
+                    data.append(sample)
+        except Exception as e:
+            logger.error(f"Error loading GSM8K data: {e}")
+            raise
+        logger.info(f"Loaded {len(data)} real GSM8K samples")
+        return data
+    def _load_placeholder_gsm8k_data(self, max_samples: Optional[int] = None) -> List[Dict[str, Any]]:
+        """Load placeholder GSM8K data."""
+        data = []
         sample_problems = [
             {
                 "question": "Janet has 12 apples. She gives 3 apples to her friend and eats 2 apples. How many apples does Janet have left?",
@@ -417,7 +649,7 @@ class GSM8K(BaseBenchmark):
             }
             data.append(sample)
-        logger.info(f"Loaded {len(data)} GSM8K samples")
+        logger.info(f"Loaded {len(data)} placeholder GSM8K samples")
         return data
     def evaluate_sample(self, sample: Dict[str, Any], prediction: str) -> bool:

isa_model/eval/evaluators/__init__.py CHANGED Viewed

@@ -7,12 +7,18 @@ Provides specialized evaluators for different model types and evaluation tasks.
 from .base_evaluator import BaseEvaluator, EvaluationResult
 from .llm_evaluator import LLMEvaluator
 from .vision_evaluator import VisionEvaluator
-from .multimodal_evaluator import MultimodalEvaluator
+from .audio_evaluator import AudioEvaluator
+from .embedding_evaluator import EmbeddingEvaluator
+# MultimodalEvaluator will be implemented later
+# from .multimodal_evaluator import MultimodalEvaluator
 __all__ = [
     "BaseEvaluator",
     "EvaluationResult",
     "LLMEvaluator",
     "VisionEvaluator",
-    "MultimodalEvaluator"
+    "AudioEvaluator",
+    "EmbeddingEvaluator"
+    # "MultimodalEvaluator"  # TODO: Implement later
 ]

isa-model 0.3.9__py3-none-any.whl → 0.4.0__py3-none-any.whl

isa-model 0.3.9py3-none-any.whl → 0.4.0py3-none-any.whl