PyPI - isa-model - Versions diffs - 0.3.91__py3-none-any.whl → 0.4.3__py3-none-any.whl - Mend

isa-model 0.3.91py3-none-any.whl → 0.4.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (228) hide show

isa_model/client.py +1166 -584
isa_model/core/cache/redis_cache.py +410 -0
isa_model/core/config/config_manager.py +282 -12
isa_model/core/config.py +91 -1
isa_model/core/database/__init__.py +1 -0
isa_model/core/database/direct_db_client.py +114 -0
isa_model/core/database/migration_manager.py +563 -0
isa_model/core/database/migrations.py +297 -0
isa_model/core/database/supabase_client.py +258 -0
isa_model/core/dependencies.py +316 -0
isa_model/core/discovery/__init__.py +19 -0
isa_model/core/discovery/consul_discovery.py +190 -0
isa_model/core/logging/__init__.py +54 -0
isa_model/core/logging/influx_logger.py +523 -0
isa_model/core/logging/loki_logger.py +160 -0
isa_model/core/models/__init__.py +46 -0
isa_model/core/models/config_models.py +625 -0
isa_model/core/models/deployment_billing_tracker.py +430 -0
isa_model/core/models/model_billing_tracker.py +60 -88
isa_model/core/models/model_manager.py +66 -25
isa_model/core/models/model_metadata.py +690 -0
isa_model/core/models/model_repo.py +217 -55
isa_model/core/models/model_statistics_tracker.py +234 -0
isa_model/core/models/model_storage.py +0 -1
isa_model/core/models/model_version_manager.py +959 -0
isa_model/core/models/system_models.py +857 -0
isa_model/core/pricing_manager.py +2 -249
isa_model/core/repositories/__init__.py +9 -0
isa_model/core/repositories/config_repository.py +912 -0
isa_model/core/resilience/circuit_breaker.py +366 -0
isa_model/core/security/secrets.py +358 -0
isa_model/core/services/__init__.py +2 -4
isa_model/core/services/intelligent_model_selector.py +479 -370
isa_model/core/storage/hf_storage.py +2 -2
isa_model/core/types.py +8 -0
isa_model/deployment/__init__.py +5 -48
isa_model/deployment/core/__init__.py +2 -31
isa_model/deployment/core/deployment_manager.py +1278 -368
isa_model/deployment/local/__init__.py +31 -0
isa_model/deployment/local/config.py +248 -0
isa_model/deployment/local/gpu_gateway.py +607 -0
isa_model/deployment/local/health_checker.py +428 -0
isa_model/deployment/local/provider.py +586 -0
isa_model/deployment/local/tensorrt_service.py +621 -0
isa_model/deployment/local/transformers_service.py +644 -0
isa_model/deployment/local/vllm_service.py +527 -0
isa_model/deployment/modal/__init__.py +8 -0
isa_model/deployment/modal/config.py +136 -0
isa_model/deployment/modal/deployer.py +894 -0
isa_model/deployment/modal/services/__init__.py +3 -0
isa_model/deployment/modal/services/audio/__init__.py +1 -0
isa_model/deployment/modal/services/audio/isa_audio_chatTTS_service.py +520 -0
isa_model/deployment/modal/services/audio/isa_audio_openvoice_service.py +758 -0
isa_model/deployment/modal/services/audio/isa_audio_service_v2.py +1044 -0
isa_model/deployment/modal/services/embedding/__init__.py +1 -0
isa_model/deployment/modal/services/embedding/isa_embed_rerank_service.py +296 -0
isa_model/deployment/modal/services/llm/__init__.py +1 -0
isa_model/deployment/modal/services/llm/isa_llm_service.py +424 -0
isa_model/deployment/modal/services/video/__init__.py +1 -0
isa_model/deployment/modal/services/video/isa_video_hunyuan_service.py +423 -0
isa_model/deployment/modal/services/vision/__init__.py +1 -0
isa_model/deployment/modal/services/vision/isa_vision_ocr_service.py +519 -0
isa_model/deployment/modal/services/vision/isa_vision_qwen25_service.py +709 -0
isa_model/deployment/modal/services/vision/isa_vision_table_service.py +676 -0
isa_model/deployment/modal/services/vision/isa_vision_ui_service.py +833 -0
isa_model/deployment/modal/services/vision/isa_vision_ui_service_optimized.py +660 -0
isa_model/deployment/models/org-org-acme-corp-tenant-a-service-llm-20250825-225822/tenant-a-service_modal_service.py +48 -0
isa_model/deployment/models/org-test-org-123-prefix-test-service-llm-20250825-225822/prefix-test-service_modal_service.py +48 -0
isa_model/deployment/models/test-llm-service-llm-20250825-204442/test-llm-service_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-212906/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-213009/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/storage/__init__.py +5 -0
isa_model/deployment/storage/deployment_repository.py +824 -0
isa_model/deployment/triton/__init__.py +10 -0
isa_model/deployment/triton/config.py +196 -0
isa_model/deployment/triton/configs/__init__.py +1 -0
isa_model/deployment/triton/provider.py +512 -0
isa_model/deployment/triton/scripts/__init__.py +1 -0
isa_model/deployment/triton/templates/__init__.py +1 -0
isa_model/inference/__init__.py +47 -1
isa_model/inference/ai_factory.py +179 -16
isa_model/inference/legacy_services/__init__.py +21 -0
isa_model/inference/legacy_services/model_evaluation.py +637 -0
isa_model/inference/legacy_services/model_service.py +573 -0
isa_model/inference/legacy_services/model_serving.py +717 -0
isa_model/inference/legacy_services/model_training.py +561 -0
isa_model/inference/models/__init__.py +21 -0
isa_model/inference/models/inference_config.py +551 -0
isa_model/inference/models/inference_record.py +675 -0
isa_model/inference/models/performance_models.py +714 -0
isa_model/inference/repositories/__init__.py +9 -0
isa_model/inference/repositories/inference_repository.py +828 -0
isa_model/inference/services/audio/__init__.py +21 -0
isa_model/inference/services/audio/base_realtime_service.py +225 -0
isa_model/inference/services/audio/base_stt_service.py +184 -11
isa_model/inference/services/audio/isa_tts_service.py +0 -0
isa_model/inference/services/audio/openai_realtime_service.py +320 -124
isa_model/inference/services/audio/openai_stt_service.py +53 -11
isa_model/inference/services/base_service.py +17 -1
isa_model/inference/services/custom_model_manager.py +277 -0
isa_model/inference/services/embedding/__init__.py +13 -0
isa_model/inference/services/embedding/base_embed_service.py +111 -8
isa_model/inference/services/embedding/isa_embed_service.py +305 -0
isa_model/inference/services/embedding/ollama_embed_service.py +15 -3
isa_model/inference/services/embedding/openai_embed_service.py +2 -4
isa_model/inference/services/embedding/resilient_embed_service.py +285 -0
isa_model/inference/services/embedding/tests/test_embedding.py +222 -0
isa_model/inference/services/img/__init__.py +2 -2
isa_model/inference/services/img/base_image_gen_service.py +24 -7
isa_model/inference/services/img/replicate_image_gen_service.py +84 -422
isa_model/inference/services/img/services/replicate_face_swap.py +193 -0
isa_model/inference/services/img/services/replicate_flux.py +226 -0
isa_model/inference/services/img/services/replicate_flux_kontext.py +219 -0
isa_model/inference/services/img/services/replicate_sticker_maker.py +249 -0
isa_model/inference/services/img/tests/test_img_client.py +297 -0
isa_model/inference/services/llm/__init__.py +10 -2
isa_model/inference/services/llm/base_llm_service.py +361 -26
isa_model/inference/services/llm/cerebras_llm_service.py +628 -0
isa_model/inference/services/llm/helpers/llm_adapter.py +71 -12
isa_model/inference/services/llm/helpers/llm_prompts.py +342 -0
isa_model/inference/services/llm/helpers/llm_utils.py +321 -23
isa_model/inference/services/llm/huggingface_llm_service.py +581 -0
isa_model/inference/services/llm/local_llm_service.py +747 -0
isa_model/inference/services/llm/ollama_llm_service.py +11 -3
isa_model/inference/services/llm/openai_llm_service.py +670 -56
isa_model/inference/services/llm/yyds_llm_service.py +10 -3
isa_model/inference/services/vision/__init__.py +27 -6
isa_model/inference/services/vision/base_vision_service.py +118 -185
isa_model/inference/services/vision/blip_vision_service.py +359 -0
isa_model/inference/services/vision/helpers/image_utils.py +19 -10
isa_model/inference/services/vision/isa_vision_service.py +634 -0
isa_model/inference/services/vision/openai_vision_service.py +19 -10
isa_model/inference/services/vision/tests/test_ocr_client.py +284 -0
isa_model/inference/services/vision/vgg16_vision_service.py +257 -0
isa_model/serving/api/cache_manager.py +245 -0
isa_model/serving/api/dependencies/__init__.py +1 -0
isa_model/serving/api/dependencies/auth.py +194 -0
isa_model/serving/api/dependencies/database.py +139 -0
isa_model/serving/api/error_handlers.py +284 -0
isa_model/serving/api/fastapi_server.py +240 -18
isa_model/serving/api/middleware/auth.py +317 -0
isa_model/serving/api/middleware/security.py +268 -0
isa_model/serving/api/middleware/tenant_context.py +414 -0
isa_model/serving/api/routes/analytics.py +489 -0
isa_model/serving/api/routes/config.py +645 -0
isa_model/serving/api/routes/deployment_billing.py +315 -0
isa_model/serving/api/routes/deployments.py +475 -0
isa_model/serving/api/routes/gpu_gateway.py +440 -0
isa_model/serving/api/routes/health.py +32 -12
isa_model/serving/api/routes/inference_monitoring.py +486 -0
isa_model/serving/api/routes/local_deployments.py +448 -0
isa_model/serving/api/routes/logs.py +430 -0
isa_model/serving/api/routes/settings.py +582 -0
isa_model/serving/api/routes/tenants.py +575 -0
isa_model/serving/api/routes/unified.py +992 -171
isa_model/serving/api/routes/webhooks.py +479 -0
isa_model/serving/api/startup.py +318 -0
isa_model/serving/modal_proxy_server.py +249 -0
isa_model/utils/gpu_utils.py +311 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/METADATA +76 -22
isa_model-0.4.3.dist-info/RECORD +193 -0
isa_model/deployment/cloud/__init__.py +0 -9
isa_model/deployment/cloud/modal/__init__.py +0 -10
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +0 -766
isa_model/deployment/cloud/modal/isa_vision_table_service.py +0 -532
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +0 -406
isa_model/deployment/cloud/modal/register_models.py +0 -321
isa_model/deployment/core/deployment_config.py +0 -356
isa_model/deployment/core/isa_deployment_service.py +0 -401
isa_model/deployment/gpu_int8_ds8/app/server.py +0 -66
isa_model/deployment/gpu_int8_ds8/scripts/test_client.py +0 -43
isa_model/deployment/gpu_int8_ds8/scripts/test_client_os.py +0 -35
isa_model/deployment/runtime/deployed_service.py +0 -338
isa_model/deployment/services/__init__.py +0 -9
isa_model/deployment/services/auto_deploy_vision_service.py +0 -538
isa_model/deployment/services/model_service.py +0 -332
isa_model/deployment/services/service_monitor.py +0 -356
isa_model/deployment/services/service_registry.py +0 -527
isa_model/eval/__init__.py +0 -92
isa_model/eval/benchmarks.py +0 -469
isa_model/eval/config/__init__.py +0 -10
isa_model/eval/config/evaluation_config.py +0 -108
isa_model/eval/evaluators/__init__.py +0 -18
isa_model/eval/evaluators/base_evaluator.py +0 -503
isa_model/eval/evaluators/llm_evaluator.py +0 -472
isa_model/eval/factory.py +0 -531
isa_model/eval/infrastructure/__init__.py +0 -24
isa_model/eval/infrastructure/experiment_tracker.py +0 -466
isa_model/eval/metrics.py +0 -798
isa_model/inference/adapter/unified_api.py +0 -248
isa_model/inference/services/helpers/stacked_config.py +0 -148
isa_model/inference/services/img/flux_professional_service.py +0 -603
isa_model/inference/services/img/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/others/table_transformer_service.py +0 -61
isa_model/inference/services/vision/doc_analysis_service.py +0 -640
isa_model/inference/services/vision/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/vision/ui_analysis_service.py +0 -823
isa_model/scripts/inference_tracker.py +0 -283
isa_model/scripts/mlflow_manager.py +0 -379
isa_model/scripts/model_registry.py +0 -465
isa_model/scripts/register_models.py +0 -370
isa_model/scripts/register_models_with_embeddings.py +0 -510
isa_model/scripts/start_mlflow.py +0 -95
isa_model/scripts/training_tracker.py +0 -257
isa_model/training/__init__.py +0 -74
isa_model/training/annotation/annotation_schema.py +0 -47
isa_model/training/annotation/processors/annotation_processor.py +0 -126
isa_model/training/annotation/storage/dataset_manager.py +0 -131
isa_model/training/annotation/storage/dataset_schema.py +0 -44
isa_model/training/annotation/tests/test_annotation_flow.py +0 -109
isa_model/training/annotation/tests/test_minio copy.py +0 -113
isa_model/training/annotation/tests/test_minio_upload.py +0 -43
isa_model/training/annotation/views/annotation_controller.py +0 -158
isa_model/training/cloud/__init__.py +0 -22
isa_model/training/cloud/job_orchestrator.py +0 -402
isa_model/training/cloud/runpod_trainer.py +0 -454
isa_model/training/cloud/storage_manager.py +0 -482
isa_model/training/core/__init__.py +0 -23
isa_model/training/core/config.py +0 -181
isa_model/training/core/dataset.py +0 -222
isa_model/training/core/trainer.py +0 -720
isa_model/training/core/utils.py +0 -213
isa_model/training/factory.py +0 -424
isa_model-0.3.91.dist-info/RECORD +0 -138
/isa_model/{core/storage/minio_storage.py → deployment/modal/services/audio/isa_audio_fish_service.py} +0 -0
/isa_model/deployment/{services → modal/services/vision}/simple_auto_deploy_vision_service.py +0 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/WHEEL +0 -0
{isa_model-0.3.91.dist-info → isa_model-0.4.3.dist-info}/top_level.txt +0 -0

isa_model/training/core/utils.py DELETED Viewed

@@ -1,213 +0,0 @@
-"""
-Training Utilities
-Helper functions and utilities for training operations.
-"""
-import os
-import json
-import logging
-import datetime
-from typing import Dict, Any, Optional, List
-from pathlib import Path
-logger = logging.getLogger(__name__)
-class TrainingUtils:
-    """Utility functions for training operations."""
-    @staticmethod
-    def generate_output_dir(model_name: str, training_type: str, base_dir: str = "training_outputs") -> str:
-        """Generate a timestamped output directory."""
-        timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
-        safe_model_name = model_name.replace("/", "_").replace(":", "_")
-        output_dir = os.path.join(base_dir, f"{safe_model_name}_{training_type}_{timestamp}")
-        return output_dir
-    @staticmethod
-    def save_training_args(args: Dict[str, Any], output_dir: str) -> None:
-        """Save training arguments to file."""
-        args_path = Path(output_dir) / "training_args.json"
-        args_path.parent.mkdir(parents=True, exist_ok=True)
-        with open(args_path, 'w') as f:
-            json.dump(args, f, indent=2, default=str)
-        logger.info(f"Training arguments saved to: {args_path}")
-    @staticmethod
-    def load_training_args(output_dir: str) -> Dict[str, Any]:
-        """Load training arguments from file."""
-        args_path = Path(output_dir) / "training_args.json"
-        if not args_path.exists():
-            raise FileNotFoundError(f"Training args not found: {args_path}")
-        with open(args_path, 'r') as f:
-            args = json.load(f)
-        return args
-    @staticmethod
-    def get_model_info(model_name: str) -> Dict[str, Any]:
-        """Get information about a model."""
-        try:
-            from transformers import AutoConfig
-            config = AutoConfig.from_pretrained(model_name, trust_remote_code=True)
-            model_info = {
-                "model_name": model_name,
-                "model_type": config.model_type,
-                "vocab_size": getattr(config, 'vocab_size', None),
-                "hidden_size": getattr(config, 'hidden_size', None),
-                "num_layers": getattr(config, 'num_hidden_layers', None),
-                "num_attention_heads": getattr(config, 'num_attention_heads', None),
-                "max_position_embeddings": getattr(config, 'max_position_embeddings', None),
-            }
-            return model_info
-        except Exception as e:
-            logger.warning(f"Could not get model info for {model_name}: {e}")
-            return {"model_name": model_name, "error": str(e)}
-    @staticmethod
-    def estimate_memory_usage(
-        model_name: str,
-        batch_size: int = 1,
-        max_length: int = 1024,
-        use_lora: bool = True
-    ) -> Dict[str, Any]:
-        """Estimate memory usage for training."""
-        try:
-            model_info = TrainingUtils.get_model_info(model_name)
-            # Rough estimation based on model parameters
-            hidden_size = model_info.get('hidden_size', 4096)
-            num_layers = model_info.get('num_layers', 32)
-            vocab_size = model_info.get('vocab_size', 32000)
-            # Estimate model parameters (in millions)
-            param_count = (hidden_size * hidden_size * 12 * num_layers + vocab_size * hidden_size) / 1e6
-            # Base memory for model (assuming fp16)
-            model_memory_gb = param_count * 2 / 1024  # 2 bytes per parameter
-            # Training memory overhead (gradients, optimizer states, activations)
-            if use_lora:
-                training_overhead = 2.0  # LoRA reduces memory usage significantly
-            else:
-                training_overhead = 4.0  # Full fine-tuning needs more memory
-            # Batch and sequence length impact
-            sequence_memory = batch_size * max_length * hidden_size * 2 / (1024**3)  # Activation memory
-            total_memory_gb = model_memory_gb * training_overhead + sequence_memory
-            return {
-                "estimated_params_millions": param_count,
-                "model_memory_gb": model_memory_gb,
-                "total_training_memory_gb": total_memory_gb,
-                "recommended_gpu": TrainingUtils._recommend_gpu(total_memory_gb),
-                "use_lora": use_lora,
-                "batch_size": batch_size,
-                "max_length": max_length
-            }
-        except Exception as e:
-            logger.warning(f"Could not estimate memory usage: {e}")
-            return {"error": str(e)}
-    @staticmethod
-    def _recommend_gpu(memory_gb: float) -> str:
-        """Recommend GPU based on memory requirements."""
-        if memory_gb <= 8:
-            return "RTX 3080/4070 (8-12GB)"
-        elif memory_gb <= 16:
-            return "RTX 4080/4090 (16GB)"
-        elif memory_gb <= 24:
-            return "RTX A6000/4090 (24GB)"
-        elif memory_gb <= 40:
-            return "A100 40GB"
-        elif memory_gb <= 80:
-            return "A100 80GB"
-        else:
-            return "Multiple A100 80GB (Multi-GPU required)"
-    @staticmethod
-    def validate_training_config(config: Dict[str, Any]) -> List[str]:
-        """Validate training configuration and return any issues."""
-        issues = []
-        # Check required fields
-        required_fields = ["model_name", "output_dir"]
-        for field in required_fields:
-            if field not in config:
-                issues.append(f"Missing required field: {field}")
-        # Check batch size
-        if config.get("batch_size", 0) <= 0:
-            issues.append("batch_size must be positive")
-        # Check learning rate
-        lr = config.get("learning_rate", 0)
-        if lr <= 0 or lr > 1:
-            issues.append("learning_rate should be between 0 and 1")
-        # Check epochs
-        if config.get("num_epochs", 0) <= 0:
-            issues.append("num_epochs must be positive")
-        # Check LoRA config
-        if config.get("use_lora", False):
-            lora_rank = config.get("lora_rank", 8)
-            if lora_rank <= 0 or lora_rank > 256:
-                issues.append("lora_rank should be between 1 and 256")
-        return issues
-    @staticmethod
-    def format_training_summary(
-        config: Dict[str, Any],
-        model_info: Dict[str, Any],
-        memory_estimate: Dict[str, Any]
-    ) -> str:
-        """Format a training summary for display."""
-        summary = []
-        summary.append("=" * 60)
-        summary.append("TRAINING CONFIGURATION SUMMARY")
-        summary.append("=" * 60)
-        # Model information
-        summary.append(f"Model: {config.get('model_name', 'Unknown')}")
-        summary.append(f"Model Type: {model_info.get('model_type', 'Unknown')}")
-        summary.append(f"Parameters: ~{memory_estimate.get('estimated_params_millions', 0):.1f}M")
-        # Training configuration
-        summary.append(f"\nTraining Configuration:")
-        summary.append(f"  Training Type: {config.get('training_type', 'sft')}")
-        summary.append(f"  Epochs: {config.get('num_epochs', 3)}")
-        summary.append(f"  Batch Size: {config.get('batch_size', 4)}")
-        summary.append(f"  Learning Rate: {config.get('learning_rate', 2e-5)}")
-        summary.append(f"  Max Length: {config.get('max_length', 1024)}")
-        # LoRA configuration
-        if config.get('use_lora', True):
-            summary.append(f"\nLoRA Configuration:")
-            summary.append(f"  LoRA Rank: {config.get('lora_rank', 8)}")
-            summary.append(f"  LoRA Alpha: {config.get('lora_alpha', 16)}")
-            summary.append(f"  LoRA Dropout: {config.get('lora_dropout', 0.05)}")
-        # Memory estimation
-        summary.append(f"\nMemory Estimation:")
-        summary.append(f"  Estimated Memory: ~{memory_estimate.get('total_training_memory_gb', 0):.1f}GB")
-        summary.append(f"  Recommended GPU: {memory_estimate.get('recommended_gpu', 'Unknown')}")
-        # Output
-        summary.append(f"\nOutput Directory: {config.get('output_dir', 'Unknown')}")
-        summary.append("=" * 60)
-        return "\n".join(summary)

isa_model/training/factory.py DELETED Viewed

@@ -1,424 +0,0 @@
-"""
-ISA Model Training Factory
-A clean, simplified training factory that uses HuggingFace Transformers directly
-without external dependencies like LlamaFactory.
-"""
-import os
-import logging
-from typing import Optional, Dict, Any, Union, List
-from pathlib import Path
-import datetime
-from .core import (
-    TrainingConfig,
-    LoRAConfig,
-    DatasetConfig,
-    BaseTrainer,
-    SFTTrainer,
-    TrainingUtils,
-    DatasetManager,
-)
-from .cloud import TrainingJobOrchestrator
-logger = logging.getLogger(__name__)
-class TrainingFactory:
-    """
-    Unified Training Factory for ISA Model SDK
-    Provides a clean interface for:
-    - Local training with SFT (Supervised Fine-Tuning)
-    - Cloud training on RunPod
-    - Model evaluation and management
-    Example usage:
-        ```python
-        from isa_model.training import TrainingFactory
-        factory = TrainingFactory()
-        # Local training
-        model_path = factory.train_model(
-            model_name="google/gemma-2-4b-it",
-            dataset_path="tatsu-lab/alpaca",
-            use_lora=True,
-            num_epochs=3
-        )
-        # Cloud training on RunPod
-        result = factory.train_on_runpod(
-            model_name="google/gemma-2-4b-it",
-            dataset_path="tatsu-lab/alpaca",
-            runpod_api_key="your-api-key",
-            template_id="your-template-id"
-        )
-        ```
-    """
-    def __init__(self, base_output_dir: Optional[str] = None):
-        """
-        Initialize the training factory.
-        Args:
-            base_output_dir: Base directory for training outputs
-        """
-        self.base_output_dir = base_output_dir or os.path.join(os.getcwd(), "training_outputs")
-        os.makedirs(self.base_output_dir, exist_ok=True)
-        logger.info(f"TrainingFactory initialized with output dir: {self.base_output_dir}")
-    def train_model(
-        self,
-        model_name: str,
-        dataset_path: str,
-        output_dir: Optional[str] = None,
-        training_type: str = "sft",
-        dataset_format: str = "alpaca",
-        use_lora: bool = True,
-        batch_size: int = 4,
-        num_epochs: int = 3,
-        learning_rate: float = 2e-5,
-        max_length: int = 1024,
-        lora_rank: int = 8,
-        lora_alpha: int = 16,
-        validation_split: float = 0.1,
-        **kwargs
-    ) -> str:
-        """
-        Train a model locally.
-        Args:
-            model_name: Model identifier (e.g., "google/gemma-2-4b-it")
-            dataset_path: Path to dataset or HuggingFace dataset name
-            output_dir: Custom output directory
-            training_type: Type of training ("sft" supported)
-            dataset_format: Dataset format ("alpaca", "sharegpt", "custom")
-            use_lora: Whether to use LoRA for efficient training
-            batch_size: Training batch size
-            num_epochs: Number of training epochs
-            learning_rate: Learning rate
-            max_length: Maximum sequence length
-            lora_rank: LoRA rank parameter
-            lora_alpha: LoRA alpha parameter
-            validation_split: Fraction of data for validation
-            **kwargs: Additional training parameters
-        Returns:
-            Path to the trained model
-        Example:
-            ```python
-            model_path = factory.train_model(
-                model_name="google/gemma-2-4b-it",
-                dataset_path="tatsu-lab/alpaca",
-                use_lora=True,
-                num_epochs=3,
-                batch_size=4
-            )
-            ```
-        """
-        # Generate output directory if not provided
-        if not output_dir:
-            output_dir = TrainingUtils.generate_output_dir(
-                model_name, training_type, self.base_output_dir
-            )
-        # Create configurations
-        lora_config = LoRAConfig(
-            use_lora=use_lora,
-            lora_rank=lora_rank,
-            lora_alpha=lora_alpha
-        ) if use_lora else None
-        dataset_config = DatasetConfig(
-            dataset_path=dataset_path,
-            dataset_format=dataset_format,
-            max_length=max_length,
-            validation_split=validation_split
-        )
-        training_config = TrainingConfig(
-            model_name=model_name,
-            output_dir=output_dir,
-            training_type=training_type,
-            num_epochs=num_epochs,
-            batch_size=batch_size,
-            learning_rate=learning_rate,
-            lora_config=lora_config,
-            dataset_config=dataset_config,
-            **kwargs
-        )
-        # Print training summary
-        model_info = TrainingUtils.get_model_info(model_name)
-        memory_estimate = TrainingUtils.estimate_memory_usage(
-            model_name, batch_size, max_length, use_lora
-        )
-        summary = TrainingUtils.format_training_summary(
-            training_config.to_dict(), model_info, memory_estimate
-        )
-        print(summary)
-        # Validate configuration
-        issues = TrainingUtils.validate_training_config(training_config.to_dict())
-        if issues:
-            raise ValueError(f"Training configuration issues: {issues}")
-        # Initialize trainer based on training type
-        if training_type.lower() == "sft":
-            trainer = SFTTrainer(training_config)
-        else:
-            raise ValueError(f"Training type '{training_type}' not supported yet")
-        # Execute training
-        logger.info(f"Starting {training_type.upper()} training...")
-        result_path = trainer.train()
-        logger.info(f"Training completed! Model saved to: {result_path}")
-        return result_path
-    def train_on_runpod(
-        self,
-        model_name: str,
-        dataset_path: str,
-        runpod_api_key: str,
-        template_id: str,
-        gpu_type: str = "NVIDIA RTX A6000",
-        storage_config: Optional[Dict[str, Any]] = None,
-        job_name: Optional[str] = None,
-        **training_params
-    ) -> Dict[str, Any]:
-        """
-        Train a model on RunPod cloud infrastructure.
-        Args:
-            model_name: Model identifier
-            dataset_path: Dataset path or HuggingFace dataset name
-            runpod_api_key: RunPod API key
-            template_id: RunPod template ID
-            gpu_type: GPU type to use
-            storage_config: Optional cloud storage configuration
-            job_name: Optional job name
-            **training_params: Additional training parameters
-        Returns:
-            Training job results
-        Example:
-            ```python
-            result = factory.train_on_runpod(
-                model_name="google/gemma-2-4b-it",
-                dataset_path="tatsu-lab/alpaca",
-                runpod_api_key="your-api-key",
-                template_id="your-template-id",
-                use_lora=True,
-                num_epochs=3
-            )
-            ```
-        """
-        # Import cloud components
-        from .cloud import TrainingJobOrchestrator
-        from .cloud.runpod_trainer import RunPodConfig
-        from .cloud.storage_manager import StorageConfig
-        from .cloud.job_orchestrator import JobConfig
-        # Create RunPod configuration
-        runpod_config = RunPodConfig(
-            api_key=runpod_api_key,
-            template_id=template_id,
-            gpu_type=gpu_type
-        )
-        # Create storage configuration if provided
-        storage_cfg = None
-        if storage_config:
-            storage_cfg = StorageConfig(**storage_config)
-        # Create job configuration
-        job_config = JobConfig(
-            model_name=model_name,
-            dataset_source=dataset_path,
-            job_name=job_name or f"gemma-training-{int(datetime.datetime.now().timestamp())}",
-            **training_params
-        )
-        # Initialize orchestrator and execute training
-        orchestrator = TrainingJobOrchestrator(
-            runpod_config=runpod_config,
-            storage_config=storage_cfg
-        )
-        logger.info(f"Starting RunPod training for {model_name}")
-        result = orchestrator.execute_training_workflow(job_config)
-        return result
-    async def upload_to_huggingface(
-        self,
-        model_path: str,
-        hf_model_name: str,
-        hf_token: Optional[str] = None,
-        metadata: Optional[Dict[str, Any]] = None
-    ) -> str:
-        """
-        Upload a trained model to HuggingFace Hub using HuggingFaceStorage.
-        Args:
-            model_path: Path to the trained model
-            hf_model_name: Name for the model on HuggingFace Hub
-            hf_token: HuggingFace token
-            metadata: Additional metadata for the model
-        Returns:
-            URL of the uploaded model
-        """
-        try:
-            from ..core.storage.hf_storage import HuggingFaceStorage
-            logger.info(f"Uploading model to HuggingFace: {hf_model_name}")
-            # Initialize HuggingFace storage
-            storage = HuggingFaceStorage(
-                username="xenobordom",
-                token=hf_token
-            )
-            # Prepare metadata
-            upload_metadata = metadata or {}
-            upload_metadata.update({
-                "description": f"Fine-tuned model: {hf_model_name}",
-                "training_framework": "ISA Model SDK",
-                "uploaded_from": "training_factory"
-            })
-            # Upload model
-            success = await storage.save_model(
-                model_id=hf_model_name,
-                model_path=model_path,
-                metadata=upload_metadata
-            )
-            if success:
-                model_url = storage.get_public_url(hf_model_name)
-                logger.info(f"Model uploaded successfully: {model_url}")
-                return model_url
-            else:
-                raise Exception("Failed to upload model")
-        except Exception as e:
-            logger.error(f"Failed to upload to HuggingFace: {e}")
-            raise
-    def get_training_status(self, output_dir: str) -> Dict[str, Any]:
-        """
-        Get training status from output directory.
-        Args:
-            output_dir: Training output directory
-        Returns:
-            Dictionary with training status information
-        """
-        status = {
-            "output_dir": output_dir,
-            "exists": os.path.exists(output_dir),
-            "files": []
-        }
-        if status["exists"]:
-            status["files"] = os.listdir(output_dir)
-            # Check for specific files
-            config_path = os.path.join(output_dir, "training_config.json")
-            metrics_path = os.path.join(output_dir, "training_metrics.json")
-            model_path = os.path.join(output_dir, "pytorch_model.bin")
-            status["has_config"] = os.path.exists(config_path)
-            status["has_metrics"] = os.path.exists(metrics_path)
-            status["has_model"] = os.path.exists(model_path) or os.path.exists(os.path.join(output_dir, "adapter_model.bin"))
-            if status["has_config"]:
-                try:
-                    status["config"] = TrainingUtils.load_training_args(output_dir)
-                except:
-                    pass
-        return status
-    def list_trained_models(self) -> List[Dict[str, Any]]:
-        """
-        List all trained models in the output directory.
-        Returns:
-            List of model information dictionaries
-        """
-        models = []
-        if os.path.exists(self.base_output_dir):
-            for item in os.listdir(self.base_output_dir):
-                item_path = os.path.join(self.base_output_dir, item)
-                if os.path.isdir(item_path):
-                    status = self.get_training_status(item_path)
-                    models.append({
-                        "name": item,
-                        "path": item_path,
-                        "created": datetime.datetime.fromtimestamp(
-                            os.path.getctime(item_path)
-                        ).isoformat(),
-                        "status": status
-                    })
-        return sorted(models, key=lambda x: x["created"], reverse=True)
-# Convenience functions for quick access
-def train_gemma(
-    dataset_path: str,
-    model_size: str = "4b",
-    output_dir: Optional[str] = None,
-    **kwargs
-) -> str:
-    """
-    Quick function to train Gemma models.
-    Args:
-        dataset_path: Path to training dataset
-        model_size: Model size ("2b", "4b", "7b")
-        output_dir: Output directory
-        **kwargs: Additional training parameters
-    Returns:
-        Path to trained model
-    Example:
-        ```python
-        from isa_model.training import train_gemma
-        model_path = train_gemma(
-            dataset_path="tatsu-lab/alpaca",
-            model_size="4b",
-            num_epochs=3,
-            batch_size=4
-        )
-        ```
-    """
-    factory = TrainingFactory()
-    model_map = {
-        "2b": "google/gemma-2-2b-it",
-        "4b": "google/gemma-2-4b-it",
-        "7b": "google/gemma-2-7b-it"
-    }
-    model_name = model_map.get(model_size, "google/gemma-2-4b-it")
-    return factory.train_model(
-        model_name=model_name,
-        dataset_path=dataset_path,
-        output_dir=output_dir,
-        **kwargs
-    )

isa-model 0.3.91__py3-none-any.whl → 0.4.3__py3-none-any.whl

isa-model 0.3.91py3-none-any.whl → 0.4.3py3-none-any.whl