PyPI - isa-model - Versions diffs - 0.3.5__py3-none-any.whl → 0.3.7__py3-none-any.whl - Mend

isa-model 0.3.5py3-none-any.whl → 0.3.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (88) hide show

isa_model/__init__.py +30 -1
isa_model/client.py +937 -0
isa_model/core/config/__init__.py +16 -0
isa_model/core/config/config_manager.py +514 -0
isa_model/core/config.py +426 -0
isa_model/core/models/model_billing_tracker.py +476 -0
isa_model/core/models/model_manager.py +399 -0
isa_model/core/{storage/supabase_storage.py → models/model_repo.py} +72 -73
isa_model/core/pricing_manager.py +426 -0
isa_model/core/services/__init__.py +19 -0
isa_model/core/services/intelligent_model_selector.py +547 -0
isa_model/core/types.py +291 -0
isa_model/deployment/__init__.py +2 -0
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +157 -3
isa_model/deployment/cloud/modal/isa_vision_table_service.py +532 -0
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +104 -3
isa_model/deployment/cloud/modal/register_models.py +321 -0
isa_model/deployment/runtime/deployed_service.py +338 -0
isa_model/deployment/services/__init__.py +9 -0
isa_model/deployment/services/auto_deploy_vision_service.py +538 -0
isa_model/deployment/services/model_service.py +332 -0
isa_model/deployment/services/service_monitor.py +356 -0
isa_model/deployment/services/service_registry.py +527 -0
isa_model/deployment/services/simple_auto_deploy_vision_service.py +275 -0
isa_model/eval/__init__.py +80 -44
isa_model/eval/config/__init__.py +10 -0
isa_model/eval/config/evaluation_config.py +108 -0
isa_model/eval/evaluators/__init__.py +18 -0
isa_model/eval/evaluators/base_evaluator.py +503 -0
isa_model/eval/evaluators/llm_evaluator.py +472 -0
isa_model/eval/factory.py +417 -709
isa_model/eval/infrastructure/__init__.py +24 -0
isa_model/eval/infrastructure/experiment_tracker.py +466 -0
isa_model/eval/metrics.py +191 -21
isa_model/inference/ai_factory.py +257 -601
isa_model/inference/services/audio/base_stt_service.py +65 -1
isa_model/inference/services/audio/base_tts_service.py +75 -1
isa_model/inference/services/audio/openai_stt_service.py +189 -151
isa_model/inference/services/audio/openai_tts_service.py +12 -10
isa_model/inference/services/audio/replicate_tts_service.py +61 -56
isa_model/inference/services/base_service.py +55 -17
isa_model/inference/services/embedding/base_embed_service.py +65 -1
isa_model/inference/services/embedding/ollama_embed_service.py +103 -43
isa_model/inference/services/embedding/openai_embed_service.py +8 -10
isa_model/inference/services/helpers/stacked_config.py +148 -0
isa_model/inference/services/img/__init__.py +18 -0
isa_model/inference/services/{vision → img}/base_image_gen_service.py +80 -1
isa_model/inference/services/{stacked → img}/flux_professional_service.py +25 -1
isa_model/inference/services/{stacked → img/helpers}/base_stacked_service.py +40 -35
isa_model/inference/services/{vision → img}/replicate_image_gen_service.py +44 -31
isa_model/inference/services/llm/__init__.py +3 -3
isa_model/inference/services/llm/base_llm_service.py +492 -40
isa_model/inference/services/llm/helpers/llm_prompts.py +258 -0
isa_model/inference/services/llm/helpers/llm_utils.py +280 -0
isa_model/inference/services/llm/ollama_llm_service.py +51 -17
isa_model/inference/services/llm/openai_llm_service.py +70 -19
isa_model/inference/services/llm/yyds_llm_service.py +24 -23
isa_model/inference/services/vision/__init__.py +38 -4
isa_model/inference/services/vision/base_vision_service.py +218 -117
isa_model/inference/services/vision/{isA_vision_service.py → disabled/isA_vision_service.py} +98 -0
isa_model/inference/services/{stacked → vision}/doc_analysis_service.py +1 -1
isa_model/inference/services/vision/helpers/base_stacked_service.py +274 -0
isa_model/inference/services/vision/helpers/image_utils.py +272 -3
isa_model/inference/services/vision/helpers/vision_prompts.py +297 -0
isa_model/inference/services/vision/openai_vision_service.py +104 -307
isa_model/inference/services/vision/replicate_vision_service.py +140 -325
isa_model/inference/services/{stacked → vision}/ui_analysis_service.py +2 -498
isa_model/scripts/register_models.py +370 -0
isa_model/scripts/register_models_with_embeddings.py +510 -0
isa_model/serving/api/fastapi_server.py +6 -1
isa_model/serving/api/routes/unified.py +274 -0
{isa_model-0.3.5.dist-info → isa_model-0.3.7.dist-info}/METADATA +4 -1
{isa_model-0.3.5.dist-info → isa_model-0.3.7.dist-info}/RECORD +78 -53
isa_model/config/__init__.py +0 -9
isa_model/config/config_manager.py +0 -213
isa_model/core/model_manager.py +0 -213
isa_model/core/model_registry.py +0 -375
isa_model/core/vision_models_init.py +0 -116
isa_model/inference/billing_tracker.py +0 -406
isa_model/inference/services/llm/triton_llm_service.py +0 -481
isa_model/inference/services/stacked/__init__.py +0 -26
isa_model/inference/services/stacked/config.py +0 -426
isa_model/inference/services/vision/ollama_vision_service.py +0 -194
/isa_model/core/{model_storage.py → models/model_storage.py} +0 -0
/isa_model/inference/services/{vision → embedding}/helpers/text_splitter.py +0 -0
/isa_model/inference/services/llm/{llm_adapter.py → helpers/llm_adapter.py} +0 -0
{isa_model-0.3.5.dist-info → isa_model-0.3.7.dist-info}/WHEEL +0 -0
{isa_model-0.3.5.dist-info → isa_model-0.3.7.dist-info}/top_level.txt +0 -0

isa_model/eval/metrics.py CHANGED Viewed

@@ -15,6 +15,12 @@ from typing import Dict, List, Any, Optional, Union
 from enum import Enum
 from abc import ABC, abstractmethod
+try:
+    from ..inference.ai_factory import AIFactory
+    AI_FACTORY_AVAILABLE = True
+except ImportError:
+    AI_FACTORY_AVAILABLE = False
 logger = logging.getLogger(__name__)
@@ -66,6 +72,16 @@ class LLMMetrics:
             MetricType.COHERENCE,
             MetricType.FLUENCY
         ]
+        # Initialize AI factory if available
+        if AI_FACTORY_AVAILABLE:
+            try:
+                self.ai_factory = AIFactory()
+            except Exception as e:
+                logger.warning(f"Failed to initialize AIFactory: {e}")
+                self.ai_factory = None
+        else:
+            self.ai_factory = None
     def evaluate(
         self,
@@ -200,21 +216,92 @@ class LLMMetrics:
         provider: str,
         **kwargs
     ) -> tuple:
-        """Generate predictions from model."""
+        """Generate predictions from model using actual inference."""
         predictions = []
         references = []
-        # This is a simplified implementation
-        # In practice, you'd use the actual model inference
-        for item in dataset:
-            if isinstance(item, dict):
-                if "input" in item and "output" in item:
-                    # Simulate prediction (replace with actual model inference)
-                    predictions.append(f"Generated response for: {item['input']}")
-                    references.append(item["output"])
-                elif "prompt" in item and "response" in item:
-                    predictions.append(f"Generated response for: {item['prompt']}")
-                    references.append(item["response"])
+        if not self.ai_factory:
+            logger.warning("AIFactory not available, using placeholder predictions")
+            # Fallback to placeholder predictions
+            for item in dataset:
+                if isinstance(item, dict):
+                    if "input" in item and "output" in item:
+                        predictions.append(f"Generated response for: {item['input']}")
+                        references.append(item["output"])
+                    elif "prompt" in item and "response" in item:
+                        predictions.append(f"Generated response for: {item['prompt']}")
+                        references.append(item["response"])
+            return predictions, references
+        try:
+            # Get LLM service
+            llm_service = self.ai_factory.get_llm(model_name=model_path, provider=provider)
+            # Process dataset in batches
+            for i in range(0, len(dataset), batch_size):
+                batch = dataset[i:i + batch_size]
+                batch_predictions = []
+                batch_references = []
+                for item in batch:
+                    if isinstance(item, dict):
+                        prompt = None
+                        reference = None
+                        # Extract prompt and reference based on data format
+                        if "input" in item and "output" in item:
+                            prompt = item["input"]
+                            reference = item["output"]
+                        elif "prompt" in item and "response" in item:
+                            prompt = item["prompt"]
+                            reference = item["response"]
+                        elif "question" in item and "answer" in item:
+                            prompt = item["question"]
+                            reference = item["answer"]
+                        elif "text" in item and "label" in item:
+                            prompt = item["text"]
+                            reference = str(item["label"])
+                        if prompt and reference:
+                            try:
+                                # Generate prediction using actual model
+                                response = await llm_service.ainvoke(prompt)
+                                # Extract text from response
+                                if hasattr(response, 'text'):
+                                    prediction = response.text
+                                elif isinstance(response, dict) and 'text' in response:
+                                    prediction = response['text']
+                                elif isinstance(response, str):
+                                    prediction = response
+                                else:
+                                    prediction = str(response)
+                                batch_predictions.append(prediction.strip())
+                                batch_references.append(reference)
+                            except Exception as e:
+                                logger.error(f"Failed to generate prediction for item: {e}")
+                                # Use fallback prediction
+                                batch_predictions.append(f"Error generating prediction: {str(e)}")
+                                batch_references.append(reference)
+                predictions.extend(batch_predictions)
+                references.extend(batch_references)
+                logger.info(f"Processed batch {i//batch_size + 1}/{(len(dataset) + batch_size - 1)//batch_size}")
+        except Exception as e:
+            logger.error(f"Failed to use AIFactory for predictions: {e}")
+            # Fallback to placeholder predictions
+            for item in dataset:
+                if isinstance(item, dict):
+                    if "input" in item and "output" in item:
+                        predictions.append(f"Generated response for: {item['input']}")
+                        references.append(item["output"])
+                    elif "prompt" in item and "response" in item:
+                        predictions.append(f"Generated response for: {item['prompt']}")
+                        references.append(item["response"])
         logger.info(f"Generated {len(predictions)} predictions")
         return predictions, references
@@ -226,11 +313,47 @@ class LLMMetrics:
         provider: str,
         **kwargs
     ) -> List[str]:
-        """Generate texts from prompts."""
-        # Simplified implementation - replace with actual model inference
+        """Generate texts from prompts using actual model inference."""
         generated_texts = []
-        for prompt in prompts:
-            generated_texts.append(f"Generated response for: {prompt}")
+        if not self.ai_factory:
+            logger.warning("AIFactory not available, using placeholder text generation")
+            # Fallback to placeholder generation
+            for prompt in prompts:
+                generated_texts.append(f"Generated response for: {prompt}")
+            return generated_texts
+        try:
+            # Get LLM service
+            llm_service = self.ai_factory.get_llm(model_name=model_path, provider=provider)
+            for prompt in prompts:
+                try:
+                    # Generate text using actual model
+                    response = await llm_service.ainvoke(prompt)
+                    # Extract text from response
+                    if hasattr(response, 'text'):
+                        generated_text = response.text
+                    elif isinstance(response, dict) and 'text' in response:
+                        generated_text = response['text']
+                    elif isinstance(response, str):
+                        generated_text = response
+                    else:
+                        generated_text = str(response)
+                    generated_texts.append(generated_text.strip())
+                except Exception as e:
+                    logger.error(f"Failed to generate text for prompt: {e}")
+                    # Use fallback generation
+                    generated_texts.append(f"Error generating text: {str(e)}")
+        except Exception as e:
+            logger.error(f"Failed to use AIFactory for text generation: {e}")
+            # Fallback to placeholder generation
+            for prompt in prompts:
+                generated_texts.append(f"Generated response for: {prompt}")
         return generated_texts
@@ -544,6 +667,16 @@ class BenchmarkRunner:
     def __init__(self):
         self.supported_benchmarks = ["mmlu", "hellaswag", "arc", "gsm8k"]
+        # Initialize AI factory if available
+        if AI_FACTORY_AVAILABLE:
+            try:
+                self.ai_factory = AIFactory()
+            except Exception as e:
+                logger.warning(f"Failed to initialize AIFactory: {e}")
+                self.ai_factory = None
+        else:
+            self.ai_factory = None
     def run(
         self,
@@ -588,9 +721,12 @@ class BenchmarkRunner:
         for sample in test_data:
             try:
-                # Generate prediction (simplified)
+                # Format prompt using benchmark's method
+                prompt = benchmark.format_prompt(sample)
+                # Generate prediction using actual model
                 prediction = self._generate_prediction(
-                    model_path, sample, num_shots, provider, **kwargs
+                    model_path, {"prompt": prompt}, num_shots, provider, **kwargs
                 )
                 # Check if correct
@@ -623,6 +759,40 @@ class BenchmarkRunner:
         provider: str,
         **kwargs
     ) -> str:
-        """Generate prediction for a sample (simplified implementation)."""
-        # This is a placeholder - replace with actual model inference
-        return "A"  # Placeholder answer
+        """Generate prediction for a sample using actual model inference."""
+        if not self.ai_factory:
+            logger.warning("AIFactory not available, using placeholder prediction")
+            return "A"  # Placeholder answer
+        try:
+            # Get LLM service
+            llm_service = self.ai_factory.get_llm(model_name=model_path, provider=provider)
+            # Format the prompt (this should be done by the benchmark)
+            if hasattr(sample, 'get'):
+                prompt = sample.get('prompt', str(sample))
+            else:
+                prompt = str(sample)
+            # Generate prediction using actual model
+            response = llm_service.generate(
+                prompt=prompt,
+                max_tokens=kwargs.get("max_tokens", 50),
+                temperature=kwargs.get("temperature", 0.0)  # Low temperature for consistency
+            )
+            # Extract text from response
+            if hasattr(response, 'text'):
+                prediction = response.text
+            elif isinstance(response, dict) and 'text' in response:
+                prediction = response['text']
+            elif isinstance(response, str):
+                prediction = response
+            else:
+                prediction = str(response)
+            return prediction.strip()
+        except Exception as e:
+            logger.error(f"Failed to generate prediction: {e}")
+            return "A"  # Fallback answer

isa-model 0.3.5__py3-none-any.whl → 0.3.7__py3-none-any.whl

isa-model 0.3.5py3-none-any.whl → 0.3.7py3-none-any.whl