PyPI - isa-model - Versions diffs - 0.3.9__py3-none-any.whl → 0.4.0__py3-none-any.whl - Mend

isa-model 0.3.9py3-none-any.whl → 0.4.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (124) hide show

isa_model/__init__.py +1 -1
isa_model/client.py +732 -565
isa_model/core/cache/redis_cache.py +401 -0
isa_model/core/config/config_manager.py +53 -10
isa_model/core/config.py +1 -1
isa_model/core/database/__init__.py +1 -0
isa_model/core/database/migrations.py +277 -0
isa_model/core/database/supabase_client.py +123 -0
isa_model/core/models/__init__.py +37 -0
isa_model/core/models/model_billing_tracker.py +60 -88
isa_model/core/models/model_manager.py +36 -18
isa_model/core/models/model_repo.py +44 -38
isa_model/core/models/model_statistics_tracker.py +234 -0
isa_model/core/models/model_storage.py +0 -1
isa_model/core/models/model_version_manager.py +959 -0
isa_model/core/pricing_manager.py +2 -249
isa_model/core/resilience/circuit_breaker.py +366 -0
isa_model/core/security/secrets.py +358 -0
isa_model/core/services/__init__.py +2 -4
isa_model/core/services/intelligent_model_selector.py +101 -370
isa_model/core/storage/hf_storage.py +1 -1
isa_model/core/types.py +7 -0
isa_model/deployment/cloud/modal/isa_audio_chatTTS_service.py +520 -0
isa_model/deployment/cloud/modal/isa_audio_fish_service.py +0 -0
isa_model/deployment/cloud/modal/isa_audio_openvoice_service.py +758 -0
isa_model/deployment/cloud/modal/isa_audio_service_v2.py +1044 -0
isa_model/deployment/cloud/modal/isa_embed_rerank_service.py +296 -0
isa_model/deployment/cloud/modal/isa_video_hunyuan_service.py +423 -0
isa_model/deployment/cloud/modal/isa_vision_ocr_service.py +519 -0
isa_model/deployment/cloud/modal/isa_vision_qwen25_service.py +709 -0
isa_model/deployment/cloud/modal/isa_vision_table_service.py +467 -323
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +607 -180
isa_model/deployment/cloud/modal/isa_vision_ui_service_optimized.py +660 -0
isa_model/deployment/core/deployment_manager.py +6 -4
isa_model/deployment/services/auto_hf_modal_deployer.py +894 -0
isa_model/eval/benchmarks/__init__.py +27 -0
isa_model/eval/benchmarks/multimodal_datasets.py +460 -0
isa_model/eval/benchmarks.py +244 -12
isa_model/eval/evaluators/__init__.py +8 -2
isa_model/eval/evaluators/audio_evaluator.py +727 -0
isa_model/eval/evaluators/embedding_evaluator.py +742 -0
isa_model/eval/evaluators/vision_evaluator.py +564 -0
isa_model/eval/example_evaluation.py +395 -0
isa_model/eval/factory.py +272 -5
isa_model/eval/isa_benchmarks.py +700 -0
isa_model/eval/isa_integration.py +582 -0
isa_model/eval/metrics.py +159 -6
isa_model/eval/tests/unit/test_basic.py +396 -0
isa_model/inference/ai_factory.py +44 -8
isa_model/inference/services/audio/__init__.py +21 -0
isa_model/inference/services/audio/base_realtime_service.py +225 -0
isa_model/inference/services/audio/isa_tts_service.py +0 -0
isa_model/inference/services/audio/openai_realtime_service.py +320 -124
isa_model/inference/services/audio/openai_stt_service.py +32 -6
isa_model/inference/services/base_service.py +17 -1
isa_model/inference/services/embedding/__init__.py +13 -0
isa_model/inference/services/embedding/base_embed_service.py +111 -8
isa_model/inference/services/embedding/isa_embed_service.py +305 -0
isa_model/inference/services/embedding/openai_embed_service.py +2 -4
isa_model/inference/services/embedding/tests/test_embedding.py +222 -0
isa_model/inference/services/img/__init__.py +2 -2
isa_model/inference/services/img/base_image_gen_service.py +24 -7
isa_model/inference/services/img/replicate_image_gen_service.py +84 -422
isa_model/inference/services/img/services/replicate_face_swap.py +193 -0
isa_model/inference/services/img/services/replicate_flux.py +226 -0
isa_model/inference/services/img/services/replicate_flux_kontext.py +219 -0
isa_model/inference/services/img/services/replicate_sticker_maker.py +249 -0
isa_model/inference/services/img/tests/test_img_client.py +297 -0
isa_model/inference/services/llm/base_llm_service.py +30 -6
isa_model/inference/services/llm/helpers/llm_adapter.py +63 -9
isa_model/inference/services/llm/ollama_llm_service.py +2 -1
isa_model/inference/services/llm/openai_llm_service.py +652 -55
isa_model/inference/services/llm/yyds_llm_service.py +2 -1
isa_model/inference/services/vision/__init__.py +5 -5
isa_model/inference/services/vision/base_vision_service.py +118 -185
isa_model/inference/services/vision/helpers/image_utils.py +11 -5
isa_model/inference/services/vision/isa_vision_service.py +573 -0
isa_model/inference/services/vision/tests/test_ocr_client.py +284 -0
isa_model/serving/api/fastapi_server.py +88 -16
isa_model/serving/api/middleware/auth.py +311 -0
isa_model/serving/api/middleware/security.py +278 -0
isa_model/serving/api/routes/analytics.py +486 -0
isa_model/serving/api/routes/deployments.py +339 -0
isa_model/serving/api/routes/evaluations.py +579 -0
isa_model/serving/api/routes/logs.py +430 -0
isa_model/serving/api/routes/settings.py +582 -0
isa_model/serving/api/routes/unified.py +324 -165
isa_model/serving/api/startup.py +304 -0
isa_model/serving/modal_proxy_server.py +249 -0
isa_model/training/__init__.py +100 -6
isa_model/training/core/__init__.py +4 -1
isa_model/training/examples/intelligent_training_example.py +281 -0
isa_model/training/intelligent/__init__.py +25 -0
isa_model/training/intelligent/decision_engine.py +643 -0
isa_model/training/intelligent/intelligent_factory.py +888 -0
isa_model/training/intelligent/knowledge_base.py +751 -0
isa_model/training/intelligent/resource_optimizer.py +839 -0
isa_model/training/intelligent/task_classifier.py +576 -0
isa_model/training/storage/__init__.py +24 -0
isa_model/training/storage/core_integration.py +439 -0
isa_model/training/storage/training_repository.py +552 -0
isa_model/training/storage/training_storage.py +628 -0
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/METADATA +13 -1
isa_model-0.4.0.dist-info/RECORD +182 -0
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +0 -766
isa_model/deployment/cloud/modal/register_models.py +0 -321
isa_model/inference/adapter/unified_api.py +0 -248
isa_model/inference/services/helpers/stacked_config.py +0 -148
isa_model/inference/services/img/flux_professional_service.py +0 -603
isa_model/inference/services/img/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/others/table_transformer_service.py +0 -61
isa_model/inference/services/vision/doc_analysis_service.py +0 -640
isa_model/inference/services/vision/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/vision/ui_analysis_service.py +0 -823
isa_model/scripts/inference_tracker.py +0 -283
isa_model/scripts/mlflow_manager.py +0 -379
isa_model/scripts/model_registry.py +0 -465
isa_model/scripts/register_models.py +0 -370
isa_model/scripts/register_models_with_embeddings.py +0 -510
isa_model/scripts/start_mlflow.py +0 -95
isa_model/scripts/training_tracker.py +0 -257
isa_model-0.3.9.dist-info/RECORD +0 -138
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/WHEEL +0 -0
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/top_level.txt +0 -0

isa_model/serving/api/routes/deployments.py ADDED Viewed

@@ -0,0 +1,339 @@
+"""
+Deployments API Routes
+Handles automated HuggingFace model deployment to Modal
+"""
+from fastapi import APIRouter, HTTPException, BackgroundTasks
+from pydantic import BaseModel
+from typing import Optional, List, Dict, Any
+import logging
+import asyncio
+import json
+from pathlib import Path
+from isa_model.deployment.services.auto_hf_modal_deployer import HuggingFaceModalDeployer
+logger = logging.getLogger(__name__)
+router = APIRouter()
+# Request/Response models
+class AnalyzeModelRequest(BaseModel):
+    model_id: str
+class DeployModelRequest(BaseModel):
+    model_id: str
+    service_name: Optional[str] = None
+    auto_deploy: bool = False
+class DeploymentResponse(BaseModel):
+    success: bool
+    deployment_id: Optional[str] = None
+    model_id: str
+    config: Optional[Dict[str, Any]] = None
+    service_file: Optional[str] = None
+    deployment_command: Optional[str] = None
+    estimated_cost_per_hour: Optional[float] = None
+    deployed: bool = False
+    error: Optional[str] = None
+# Global deployer instance
+deployer = HuggingFaceModalDeployer()
+# In-memory deployment tracking (in production, use a database)
+deployments = {}
+@router.post("/analyze", response_model=Dict[str, Any])
+async def analyze_model(request: AnalyzeModelRequest):
+    """
+    Analyze a HuggingFace model for deployment compatibility
+    """
+    try:
+        logger.info(f"Analyzing model: {request.model_id}")
+        # Analyze the model
+        config = deployer.analyze_model(request.model_id)
+        return {
+            "success": True,
+            "model_id": config.model_id,
+            "model_type": config.model_type,
+            "architecture": config.architecture,
+            "parameters": config.parameters,
+            "gpu_requirements": config.gpu_requirements,
+            "memory_gb": config.memory_gb,
+            "container_memory_mb": config.container_memory_mb,
+            "dependencies": config.dependencies,
+            "capabilities": config.capabilities,
+            "estimated_cost_per_hour": config.estimated_cost_per_hour
+        }
+    except Exception as e:
+        logger.error(f"Model analysis failed for {request.model_id}: {e}")
+        raise HTTPException(status_code=400, detail=f"Model analysis failed: {str(e)}")
+@router.post("/deploy", response_model=DeploymentResponse)
+async def deploy_model(request: DeployModelRequest, background_tasks: BackgroundTasks):
+    """
+    Deploy a HuggingFace model to Modal
+    """
+    try:
+        logger.info(f"Starting deployment for model: {request.model_id}")
+        # Generate unique deployment ID
+        import time
+        import uuid
+        deployment_id = f"deploy_{uuid.uuid4().hex[:8]}_{int(time.time())}"
+        # Add to deployments tracking
+        deployments[deployment_id] = {
+            "id": deployment_id,
+            "model_id": request.model_id,
+            "service_name": request.service_name,
+            "status": "pending",
+            "created_at": time.time(),
+            "auto_deploy": request.auto_deploy
+        }
+        # Start deployment in background
+        background_tasks.add_task(
+            perform_deployment,
+            deployment_id,
+            request.model_id,
+            request.service_name,
+            request.auto_deploy
+        )
+        return DeploymentResponse(
+            success=True,
+            deployment_id=deployment_id,
+            model_id=request.model_id,
+            deployed=False
+        )
+    except Exception as e:
+        logger.error(f"Deployment initiation failed for {request.model_id}: {e}")
+        raise HTTPException(status_code=500, detail=f"Deployment failed: {str(e)}")
+async def perform_deployment(deployment_id: str, model_id: str, service_name: Optional[str], auto_deploy: bool):
+    """
+    Perform the actual deployment in the background
+    """
+    import time
+    try:
+        logger.info(f"Performing deployment {deployment_id} for model {model_id}")
+        # Update status
+        deployments[deployment_id]["status"] = "deploying"
+        deployments[deployment_id]["progress"] = "Analyzing model"
+        # Deploy the model
+        result = deployer.deploy_model(model_id, deploy=auto_deploy)
+        if result["success"]:
+            deployments[deployment_id].update({
+                "status": "completed" if result.get("deployed") else "generated",
+                "progress": "Deployment completed",
+                "config": result["config"],
+                "service_file": result["service_file"],
+                "deployment_command": result["deployment_command"],
+                "estimated_cost_per_hour": result["estimated_cost_per_hour"],
+                "deployed": result.get("deployed", False),
+                "completed_at": time.time()
+            })
+        else:
+            deployments[deployment_id].update({
+                "status": "failed",
+                "progress": "Deployment failed",
+                "error": result.get("error", "Unknown error"),
+                "failed_at": time.time()
+            })
+    except Exception as e:
+        logger.error(f"Deployment {deployment_id} failed: {e}")
+        deployments[deployment_id].update({
+            "status": "failed",
+            "progress": "Deployment failed",
+            "error": str(e),
+            "failed_at": time.time()
+        })
+@router.get("/")
+async def list_deployments():
+    """
+    List all deployments
+    """
+    try:
+        # Convert deployments to list format
+        deployment_list = []
+        for deployment_id, deployment in deployments.items():
+            deployment_list.append({
+                "id": deployment_id,
+                "name": deployment.get("service_name") or f"{deployment['model_id'].split('/')[-1]} Service",
+                "model_id": deployment["model_id"],
+                "model_type": "text",  # Would be determined from analysis
+                "status": deployment["status"],
+                "gpu": "A10G",  # Would be from config
+                "cost_per_hour": "1.20",  # Would be from config
+                "created_at": deployment["created_at"],
+                "deployed_at": deployment.get("completed_at"),
+                "error": deployment.get("error")
+            })
+        # Add some fallback deployments for demo
+        if not deployment_list:
+            deployment_list = [
+                {
+                    "id": "qwen2-vl-7b",
+                    "name": "Qwen2.5-VL Service",
+                    "model_id": "Qwen/Qwen2.5-VL-7B-Instruct",
+                    "model_type": "vision",
+                    "status": "active",
+                    "gpu": "A100",
+                    "cost_per_hour": "4.00",
+                    "created_at": 1705312200,
+                    "deployed_at": 1705312800
+                },
+                {
+                    "id": "embed-service",
+                    "name": "BGE Embed Service",
+                    "model_id": "BAAI/bge-base-en-v1.5",
+                    "model_type": "embedding",
+                    "status": "active",
+                    "gpu": "A10G",
+                    "cost_per_hour": "1.20",
+                    "created_at": 1705225800,
+                    "deployed_at": 1705226400
+                }
+            ]
+        return deployment_list
+    except Exception as e:
+        logger.error(f"Failed to list deployments: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to list deployments: {str(e)}")
+@router.get("/{deployment_id}")
+async def get_deployment(deployment_id: str):
+    """
+    Get deployment details
+    """
+    try:
+        if deployment_id not in deployments:
+            raise HTTPException(status_code=404, detail="Deployment not found")
+        return deployments[deployment_id]
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.error(f"Failed to get deployment {deployment_id}: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to get deployment: {str(e)}")
+@router.delete("/{deployment_id}")
+async def cancel_deployment(deployment_id: str):
+    """
+    Cancel a pending deployment
+    """
+    try:
+        if deployment_id not in deployments:
+            raise HTTPException(status_code=404, detail="Deployment not found")
+        deployment = deployments[deployment_id]
+        if deployment["status"] == "pending":
+            deployment["status"] = "cancelled"
+            deployment["cancelled_at"] = time.time()
+            return {"success": True, "message": "Deployment cancelled"}
+        else:
+            raise HTTPException(status_code=400, detail="Cannot cancel deployment in current status")
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.error(f"Failed to cancel deployment {deployment_id}: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to cancel deployment: {str(e)}")
+@router.post("/{deployment_id}/retry")
+async def retry_deployment(deployment_id: str, background_tasks: BackgroundTasks):
+    """
+    Retry a failed deployment
+    """
+    try:
+        if deployment_id not in deployments:
+            raise HTTPException(status_code=404, detail="Deployment not found")
+        deployment = deployments[deployment_id]
+        if deployment["status"] == "failed":
+            # Reset deployment status
+            deployment["status"] = "pending"
+            deployment["error"] = None
+            deployment["progress"] = "Retrying deployment"
+            # Start deployment in background
+            background_tasks.add_task(
+                perform_deployment,
+                deployment_id,
+                deployment["model_id"],
+                deployment.get("service_name"),
+                deployment.get("auto_deploy", False)
+            )
+            return {"success": True, "message": "Deployment retry started"}
+        else:
+            raise HTTPException(status_code=400, detail="Cannot retry deployment in current status")
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.error(f"Failed to retry deployment {deployment_id}: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to retry deployment: {str(e)}")
+@router.get("/{deployment_id}/code")
+async def get_service_code(deployment_id: str):
+    """
+    Download the generated service code for a deployment
+    """
+    try:
+        if deployment_id not in deployments:
+            raise HTTPException(status_code=404, detail="Deployment not found")
+        deployment = deployments[deployment_id]
+        service_file = deployment.get("service_file")
+        if not service_file or not Path(service_file).exists():
+            raise HTTPException(status_code=404, detail="Service code not found")
+        # Read the service code file
+        with open(service_file, 'r') as f:
+            service_code = f.read()
+        from fastapi.responses import PlainTextResponse
+        return PlainTextResponse(
+            content=service_code,
+            headers={
+                "Content-Disposition": f"attachment; filename={Path(service_file).name}"
+            }
+        )
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.error(f"Failed to get service code for {deployment_id}: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to get service code: {str(e)}")
+# Health check for deployments service
+@router.get("/health")
+async def deployments_health():
+    """Health check for deployments service"""
+    return {
+        "status": "healthy",
+        "service": "deployments",
+        "active_deployments": len([d for d in deployments.values() if d["status"] == "active"]),
+        "pending_deployments": len([d for d in deployments.values() if d["status"] == "pending"]),
+        "total_deployments": len(deployments)
+    }

isa-model 0.3.9__py3-none-any.whl → 0.4.0__py3-none-any.whl

isa-model 0.3.9py3-none-any.whl → 0.4.0py3-none-any.whl