PyPI - isa-model - Versions diffs - 0.4.0__py3-none-any.whl → 0.4.4__py3-none-any.whl - Mend

isa-model 0.4.0py3-none-any.whl → 0.4.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (189) hide show

isa_model/client.py +466 -43
isa_model/core/cache/redis_cache.py +12 -3
isa_model/core/config/config_manager.py +230 -3
isa_model/core/config.py +90 -0
isa_model/core/database/direct_db_client.py +114 -0
isa_model/core/database/migration_manager.py +563 -0
isa_model/core/database/migrations.py +21 -1
isa_model/core/database/supabase_client.py +154 -19
isa_model/core/dependencies.py +316 -0
isa_model/core/discovery/__init__.py +19 -0
isa_model/core/discovery/consul_discovery.py +190 -0
isa_model/core/logging/__init__.py +54 -0
isa_model/core/logging/influx_logger.py +523 -0
isa_model/core/logging/loki_logger.py +160 -0
isa_model/core/models/__init__.py +27 -18
isa_model/core/models/config_models.py +625 -0
isa_model/core/models/deployment_billing_tracker.py +430 -0
isa_model/core/models/model_manager.py +35 -80
isa_model/core/models/model_metadata.py +690 -0
isa_model/core/models/model_repo.py +174 -18
isa_model/core/models/system_models.py +857 -0
isa_model/core/repositories/__init__.py +9 -0
isa_model/core/repositories/config_repository.py +912 -0
isa_model/core/services/intelligent_model_selector.py +399 -21
isa_model/core/types.py +1 -0
isa_model/deployment/__init__.py +5 -48
isa_model/deployment/core/__init__.py +2 -31
isa_model/deployment/core/deployment_manager.py +1278 -370
isa_model/deployment/modal/__init__.py +8 -0
isa_model/deployment/modal/config.py +136 -0
isa_model/deployment/{services/auto_hf_modal_deployer.py → modal/deployer.py} +1 -1
isa_model/deployment/modal/services/__init__.py +3 -0
isa_model/deployment/modal/services/audio/__init__.py +1 -0
isa_model/deployment/modal/services/embedding/__init__.py +1 -0
isa_model/deployment/modal/services/llm/__init__.py +1 -0
isa_model/deployment/modal/services/llm/isa_llm_service.py +424 -0
isa_model/deployment/modal/services/video/__init__.py +1 -0
isa_model/deployment/modal/services/vision/__init__.py +1 -0
isa_model/deployment/models/org-org-acme-corp-tenant-a-service-llm-20250825-225822/tenant-a-service_modal_service.py +48 -0
isa_model/deployment/models/org-test-org-123-prefix-test-service-llm-20250825-225822/prefix-test-service_modal_service.py +48 -0
isa_model/deployment/models/test-llm-service-llm-20250825-204442/test-llm-service_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-212906/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-213009/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/storage/__init__.py +5 -0
isa_model/deployment/storage/deployment_repository.py +824 -0
isa_model/deployment/triton/__init__.py +10 -0
isa_model/deployment/triton/config.py +196 -0
isa_model/deployment/triton/configs/__init__.py +1 -0
isa_model/deployment/triton/provider.py +512 -0
isa_model/deployment/triton/scripts/__init__.py +1 -0
isa_model/deployment/triton/templates/__init__.py +1 -0
isa_model/inference/__init__.py +47 -1
isa_model/inference/ai_factory.py +137 -10
isa_model/inference/legacy_services/__init__.py +21 -0
isa_model/inference/legacy_services/model_evaluation.py +637 -0
isa_model/inference/legacy_services/model_service.py +573 -0
isa_model/inference/legacy_services/model_serving.py +717 -0
isa_model/inference/legacy_services/model_training.py +561 -0
isa_model/inference/models/__init__.py +21 -0
isa_model/inference/models/inference_config.py +551 -0
isa_model/inference/models/inference_record.py +675 -0
isa_model/inference/models/performance_models.py +714 -0
isa_model/inference/repositories/__init__.py +9 -0
isa_model/inference/repositories/inference_repository.py +828 -0
isa_model/inference/services/audio/base_stt_service.py +184 -11
isa_model/inference/services/audio/openai_stt_service.py +22 -6
isa_model/inference/services/embedding/ollama_embed_service.py +15 -3
isa_model/inference/services/embedding/resilient_embed_service.py +285 -0
isa_model/inference/services/llm/__init__.py +10 -2
isa_model/inference/services/llm/base_llm_service.py +335 -24
isa_model/inference/services/llm/cerebras_llm_service.py +628 -0
isa_model/inference/services/llm/helpers/llm_adapter.py +9 -4
isa_model/inference/services/llm/helpers/llm_prompts.py +342 -0
isa_model/inference/services/llm/helpers/llm_utils.py +321 -23
isa_model/inference/services/llm/huggingface_llm_service.py +581 -0
isa_model/inference/services/llm/ollama_llm_service.py +9 -2
isa_model/inference/services/llm/openai_llm_service.py +33 -16
isa_model/inference/services/llm/yyds_llm_service.py +8 -2
isa_model/inference/services/vision/__init__.py +22 -1
isa_model/inference/services/vision/helpers/image_utils.py +8 -5
isa_model/inference/services/vision/isa_vision_service.py +65 -4
isa_model/inference/services/vision/openai_vision_service.py +19 -10
isa_model/inference/services/vision/vgg16_vision_service.py +257 -0
isa_model/serving/api/cache_manager.py +245 -0
isa_model/serving/api/dependencies/__init__.py +1 -0
isa_model/serving/api/dependencies/auth.py +194 -0
isa_model/serving/api/dependencies/database.py +139 -0
isa_model/serving/api/error_handlers.py +284 -0
isa_model/serving/api/fastapi_server.py +172 -22
isa_model/serving/api/middleware/auth.py +8 -2
isa_model/serving/api/middleware/security.py +23 -33
isa_model/serving/api/middleware/tenant_context.py +414 -0
isa_model/serving/api/routes/analytics.py +4 -1
isa_model/serving/api/routes/config.py +645 -0
isa_model/serving/api/routes/deployment_billing.py +315 -0
isa_model/serving/api/routes/deployments.py +138 -2
isa_model/serving/api/routes/gpu_gateway.py +440 -0
isa_model/serving/api/routes/health.py +32 -12
isa_model/serving/api/routes/inference_monitoring.py +486 -0
isa_model/serving/api/routes/local_deployments.py +448 -0
isa_model/serving/api/routes/tenants.py +575 -0
isa_model/serving/api/routes/unified.py +680 -18
isa_model/serving/api/routes/webhooks.py +479 -0
isa_model/serving/api/startup.py +68 -54
isa_model/utils/gpu_utils.py +311 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.4.dist-info}/METADATA +71 -24
isa_model-0.4.4.dist-info/RECORD +180 -0
isa_model/core/security/secrets.py +0 -358
isa_model/core/storage/hf_storage.py +0 -419
isa_model/core/storage/minio_storage.py +0 -0
isa_model/deployment/cloud/__init__.py +0 -9
isa_model/deployment/cloud/modal/__init__.py +0 -10
isa_model/deployment/core/deployment_config.py +0 -356
isa_model/deployment/core/isa_deployment_service.py +0 -401
isa_model/deployment/gpu_int8_ds8/app/server.py +0 -66
isa_model/deployment/gpu_int8_ds8/scripts/test_client.py +0 -43
isa_model/deployment/gpu_int8_ds8/scripts/test_client_os.py +0 -35
isa_model/deployment/runtime/deployed_service.py +0 -338
isa_model/deployment/services/__init__.py +0 -9
isa_model/deployment/services/auto_deploy_vision_service.py +0 -538
isa_model/deployment/services/model_service.py +0 -332
isa_model/deployment/services/service_monitor.py +0 -356
isa_model/deployment/services/service_registry.py +0 -527
isa_model/eval/__init__.py +0 -92
isa_model/eval/benchmarks/__init__.py +0 -27
isa_model/eval/benchmarks/multimodal_datasets.py +0 -460
isa_model/eval/benchmarks.py +0 -701
isa_model/eval/config/__init__.py +0 -10
isa_model/eval/config/evaluation_config.py +0 -108
isa_model/eval/evaluators/__init__.py +0 -24
isa_model/eval/evaluators/audio_evaluator.py +0 -727
isa_model/eval/evaluators/base_evaluator.py +0 -503
isa_model/eval/evaluators/embedding_evaluator.py +0 -742
isa_model/eval/evaluators/llm_evaluator.py +0 -472
isa_model/eval/evaluators/vision_evaluator.py +0 -564
isa_model/eval/example_evaluation.py +0 -395
isa_model/eval/factory.py +0 -798
isa_model/eval/infrastructure/__init__.py +0 -24
isa_model/eval/infrastructure/experiment_tracker.py +0 -466
isa_model/eval/isa_benchmarks.py +0 -700
isa_model/eval/isa_integration.py +0 -582
isa_model/eval/metrics.py +0 -951
isa_model/eval/tests/unit/test_basic.py +0 -396
isa_model/serving/api/routes/evaluations.py +0 -579
isa_model/training/__init__.py +0 -168
isa_model/training/annotation/annotation_schema.py +0 -47
isa_model/training/annotation/processors/annotation_processor.py +0 -126
isa_model/training/annotation/storage/dataset_manager.py +0 -131
isa_model/training/annotation/storage/dataset_schema.py +0 -44
isa_model/training/annotation/tests/test_annotation_flow.py +0 -109
isa_model/training/annotation/tests/test_minio copy.py +0 -113
isa_model/training/annotation/tests/test_minio_upload.py +0 -43
isa_model/training/annotation/views/annotation_controller.py +0 -158
isa_model/training/cloud/__init__.py +0 -22
isa_model/training/cloud/job_orchestrator.py +0 -402
isa_model/training/cloud/runpod_trainer.py +0 -454
isa_model/training/cloud/storage_manager.py +0 -482
isa_model/training/core/__init__.py +0 -26
isa_model/training/core/config.py +0 -181
isa_model/training/core/dataset.py +0 -222
isa_model/training/core/trainer.py +0 -720
isa_model/training/core/utils.py +0 -213
isa_model/training/examples/intelligent_training_example.py +0 -281
isa_model/training/factory.py +0 -424
isa_model/training/intelligent/__init__.py +0 -25
isa_model/training/intelligent/decision_engine.py +0 -643
isa_model/training/intelligent/intelligent_factory.py +0 -888
isa_model/training/intelligent/knowledge_base.py +0 -751
isa_model/training/intelligent/resource_optimizer.py +0 -839
isa_model/training/intelligent/task_classifier.py +0 -576
isa_model/training/storage/__init__.py +0 -24
isa_model/training/storage/core_integration.py +0 -439
isa_model/training/storage/training_repository.py +0 -552
isa_model/training/storage/training_storage.py +0 -628
isa_model-0.4.0.dist-info/RECORD +0 -182
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_chatTTS_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_fish_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_openvoice_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_service_v2.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/embedding}/isa_embed_rerank_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/video}/isa_video_hunyuan_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ocr_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_qwen25_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_table_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ui_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ui_service_optimized.py +0 -0
/isa_model/deployment/{services → modal/services/vision}/simple_auto_deploy_vision_service.py +0 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.4.dist-info}/WHEEL +0 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.4.dist-info}/top_level.txt +0 -0

isa_model/serving/api/routes/evaluations.py DELETED Viewed

@@ -1,579 +0,0 @@
-"""
-Evaluation API Routes
-Provides comprehensive evaluation capabilities for AI models including
-benchmark testing, performance analysis, and comparison metrics.
-"""
-from fastapi import APIRouter, Query, HTTPException, Depends, BackgroundTasks
-from fastapi.responses import StreamingResponse
-from pydantic import BaseModel, Field
-from typing import Optional, List, Dict, Any, Union
-import logging
-from datetime import datetime, timedelta
-import asyncpg
-import asyncio
-import json
-import os
-import uuid
-from enum import Enum
-try:
-    from ..middleware.auth import require_read_access, require_write_access
-except ImportError:
-    # For development/testing when auth is not required
-    def require_read_access():
-        return {"user_id": "test_user"}
-    def require_write_access():
-        return {"user_id": "test_user"}
-logger = logging.getLogger(__name__)
-router = APIRouter()
-# Database connection configuration
-DATABASE_URL = os.getenv("DATABASE_URL", "postgresql://postgres:postgres@127.0.0.1:54322/postgres?options=-c%20search_path%3Ddev")
-# Enums
-class TaskStatus(str, Enum):
-    PENDING = "pending"
-    RUNNING = "running"
-    COMPLETED = "completed"
-    FAILED = "failed"
-    CANCELLED = "cancelled"
-class EvaluationPriority(int, Enum):
-    LOW = 1
-    MEDIUM = 5
-    HIGH = 10
-# Request Models
-class EvaluationRequest(BaseModel):
-    name: str = Field(..., description="评估任务名称", min_length=1, max_length=255)
-    models: List[str] = Field(..., description="待评估模型列表", min_items=1)
-    benchmark: str = Field(..., description="基准测试名称")
-    dataset: Optional[str] = Field(None, description="数据集名称")
-    config: Optional[Dict[str, Any]] = Field(None, description="评估配置参数")
-    priority: EvaluationPriority = Field(EvaluationPriority.MEDIUM, description="任务优先级")
-    timeout_minutes: Optional[int] = Field(60, description="超时时间(分钟)", ge=5, le=1440)
-class BatchEvaluationRequest(BaseModel):
-    name_prefix: str = Field(..., description="批量任务名称前缀")
-    models: List[str] = Field(..., description="待评估模型列表", min_items=1)
-    benchmarks: List[str] = Field(..., description="基准测试列表", min_items=1)
-    config: Optional[Dict[str, Any]] = Field(None, description="通用评估配置")
-    priority: EvaluationPriority = Field(EvaluationPriority.MEDIUM, description="任务优先级")
-# Response Models
-class EvaluationResponse(BaseModel):
-    success: bool
-    task_id: str
-    status: TaskStatus
-    message: Optional[str] = None
-    estimated_time_minutes: Optional[int] = None
-class EvaluationStatusResponse(BaseModel):
-    task_id: str
-    name: str
-    status: TaskStatus
-    models: List[str]
-    benchmark: str
-    progress: float = Field(0.0, description="完成进度 (0.0-1.0)")
-    current_model: Optional[str] = None
-    created_at: datetime
-    started_at: Optional[datetime] = None
-    completed_at: Optional[datetime] = None
-    estimated_completion: Optional[datetime] = None
-    error_message: Optional[str] = None
-class ModelResult(BaseModel):
-    model_name: str
-    metrics: Dict[str, float]
-    raw_results: Optional[List[Any]] = None
-    execution_time_seconds: float
-    status: str
-class EvaluationResult(BaseModel):
-    task_id: str
-    name: str
-    status: TaskStatus
-    models: List[ModelResult]
-    benchmark: str
-    dataset: Optional[str] = None
-    summary: Dict[str, Any]
-    config: Optional[Dict[str, Any]] = None
-    created_at: datetime
-    started_at: Optional[datetime] = None
-    completed_at: Optional[datetime] = None
-    total_execution_time_seconds: Optional[float] = None
-class BenchmarkInfo(BaseModel):
-    name: str
-    description: str
-    category: str
-    metrics: List[str]
-    config_schema: Optional[Dict[str, Any]] = None
-# Database connection helper
-async def get_db_connection():
-    """Get database connection"""
-    try:
-        return await asyncpg.connect(DATABASE_URL)
-    except Exception as e:
-        logger.error(f"Database connection failed: {e}")
-        raise HTTPException(status_code=500, detail="Database connection failed")
-# Task Management Functions
-async def create_task_record(task_id: str, request: EvaluationRequest) -> None:
-    """Create evaluation task record in database"""
-    conn = await get_db_connection()
-    try:
-        await conn.execute("""
-            INSERT INTO evaluations (id, name, status, models, benchmark, dataset, config, priority, timeout_minutes, created_at)
-            VALUES ($1, $2, $3, $4, $5, $6, $7, $8, $9, $10)
-        """, task_id, request.name, TaskStatus.PENDING.value, request.models,
-            request.benchmark, request.dataset, json.dumps(request.config) if request.config else None,
-            request.priority, request.timeout_minutes, datetime.utcnow())
-    finally:
-        await conn.close()
-async def update_task_status(task_id: str, status: TaskStatus,
-                           progress: Optional[float] = None,
-                           current_model: Optional[str] = None,
-                           error_message: Optional[str] = None) -> None:
-    """Update evaluation task status"""
-    conn = await get_db_connection()
-    try:
-        updates = ["status = $2"]
-        params = [task_id, status.value]
-        param_count = 2
-        if progress is not None:
-            param_count += 1
-            updates.append(f"progress = ${param_count}")
-            params.append(progress)
-        if current_model is not None:
-            param_count += 1
-            updates.append(f"current_model = ${param_count}")
-            params.append(current_model)
-        if error_message is not None:
-            param_count += 1
-            updates.append(f"error_message = ${param_count}")
-            params.append(error_message)
-        if status == TaskStatus.RUNNING:
-            param_count += 1
-            updates.append(f"started_at = ${param_count}")
-            params.append(datetime.utcnow())
-        elif status in [TaskStatus.COMPLETED, TaskStatus.FAILED, TaskStatus.CANCELLED]:
-            param_count += 1
-            updates.append(f"completed_at = ${param_count}")
-            params.append(datetime.utcnow())
-        query = f"UPDATE evaluations SET {', '.join(updates)} WHERE id = $1"
-        await conn.execute(query, *params)
-    finally:
-        await conn.close()
-async def get_task_status(task_id: str) -> Optional[Dict[str, Any]]:
-    """Get evaluation task status"""
-    conn = await get_db_connection()
-    try:
-        result = await conn.fetchrow("""
-            SELECT * FROM evaluations WHERE id = $1
-        """, task_id)
-        if not result:
-            return None
-        return {
-            'task_id': str(result['id']),
-            'name': result['name'],
-            'status': result['status'],
-            'models': result['models'],
-            'benchmark': result['benchmark'],
-            'dataset': result['dataset'],
-            'progress': result.get('progress', 0.0),
-            'current_model': result.get('current_model'),
-            'created_at': result['created_at'],
-            'started_at': result.get('started_at'),
-            'completed_at': result.get('completed_at'),
-            'estimated_completion': result.get('estimated_completion'),
-            'error_message': result.get('error_message')
-        }
-    finally:
-        await conn.close()
-def generate_task_id() -> str:
-    """Generate unique task ID"""
-    return str(uuid.uuid4())
-# Background task functions
-async def run_evaluation_task(task_id: str, request: EvaluationRequest):
-    """Run evaluation task in background"""
-    try:
-        logger.info(f"Starting evaluation task {task_id}: {request.name}")
-        await update_task_status(task_id, TaskStatus.RUNNING)
-        # For now, create a mock evaluation for testing
-        import random
-        total_models = len(request.models)
-        results = []
-        for i, model in enumerate(request.models):
-            logger.info(f"Evaluating model {model} ({i+1}/{total_models})")
-            await update_task_status(task_id, TaskStatus.RUNNING,
-                                   progress=i/total_models, current_model=model)
-            # Simulate evaluation time
-            await asyncio.sleep(2)
-            # Mock evaluation results
-            model_result = {
-                'model_name': model,
-                'metrics': {
-                    'accuracy': round(random.uniform(0.6, 0.95), 4),
-                    'f1_score': round(random.uniform(0.55, 0.92), 4),
-                    'overall_score': round(random.uniform(0.6, 0.9), 4)
-                },
-                'raw_results': [f"sample_prediction_{j}" for j in range(5)],  # Mock predictions
-                'execution_time_seconds': round(random.uniform(1.5, 4.0), 2)
-            }
-            results.append(model_result)
-            # Update progress
-            await update_task_status(task_id, TaskStatus.RUNNING,
-                                   progress=(i+1)/total_models, current_model=model)
-        # Save final results
-        await save_evaluation_results(task_id, results)
-        await update_task_status(task_id, TaskStatus.COMPLETED, progress=1.0)
-        logger.info(f"Completed evaluation task {task_id}")
-    except Exception as e:
-        logger.error(f"Evaluation task {task_id} failed: {e}")
-        await update_task_status(task_id, TaskStatus.FAILED, error_message=str(e))
-async def save_evaluation_results(task_id: str, results: List[Dict[str, Any]]):
-    """Save evaluation results to database"""
-    conn = await get_db_connection()
-    try:
-        for result in results:
-            await conn.execute("""
-                INSERT INTO evaluation_results (evaluation_id, model_name, metrics, raw_results, execution_time_seconds, created_at)
-                VALUES ($1, $2, $3, $4, $5, $6)
-            """, task_id, result['model_name'], json.dumps(result['metrics']),
-                json.dumps(result.get('raw_results')), result['execution_time_seconds'], datetime.utcnow())
-    finally:
-        await conn.close()
-# API Endpoints
-@router.post("/", response_model=EvaluationResponse)
-async def create_evaluation(
-    request: EvaluationRequest,
-    background_tasks: BackgroundTasks
-):
-    """Create new evaluation task"""
-    try:
-        task_id = generate_task_id()
-        # Create task record
-        await create_task_record(task_id, request)
-        # Start background evaluation
-        background_tasks.add_task(run_evaluation_task, task_id, request)
-        return EvaluationResponse(
-            success=True,
-            task_id=task_id,
-            status=TaskStatus.PENDING,
-            estimated_time_minutes=request.timeout_minutes
-        )
-    except Exception as e:
-        logger.error(f"Failed to create evaluation: {e}")
-        raise HTTPException(status_code=500, detail=f"Failed to create evaluation: {str(e)}")
-@router.post("/batch", response_model=List[EvaluationResponse])
-async def create_batch_evaluation(
-    request: BatchEvaluationRequest,
-    background_tasks: BackgroundTasks,
-    user: Dict = Depends(require_write_access)
-):
-    """Create batch evaluation tasks"""
-    try:
-        responses = []
-        for i, benchmark in enumerate(request.benchmarks):
-            task_id = generate_task_id()
-            eval_request = EvaluationRequest(
-                name=f"{request.name_prefix}_{benchmark}_{i+1}",
-                models=request.models,
-                benchmark=benchmark,
-                config=request.config,
-                priority=request.priority
-            )
-            await create_task_record(task_id, eval_request)
-            background_tasks.add_task(run_evaluation_task, task_id, eval_request)
-            responses.append(EvaluationResponse(
-                success=True,
-                task_id=task_id,
-                status=TaskStatus.PENDING
-            ))
-        return responses
-    except Exception as e:
-        logger.error(f"Failed to create batch evaluation: {e}")
-        raise HTTPException(status_code=500, detail=f"Failed to create batch evaluation: {str(e)}")
-@router.get("/", response_model=List[EvaluationStatusResponse])
-async def list_evaluations(
-    status: Optional[TaskStatus] = None,
-    limit: int = Query(default=50, le=200),
-    offset: int = Query(default=0, ge=0)
-):
-    """List evaluation tasks"""
-    try:
-        conn = await get_db_connection()
-        try:
-            query = "SELECT * FROM evaluations"
-            params = []
-            if status:
-                query += " WHERE status = $1"
-                params.append(status.value)
-            query += " ORDER BY created_at DESC LIMIT $" + str(len(params) + 1) + " OFFSET $" + str(len(params) + 2)
-            params.extend([limit, offset])
-            results = await conn.fetch(query, *params)
-            return [
-                EvaluationStatusResponse(
-                    task_id=str(row['id']),
-                    name=row['name'],
-                    status=TaskStatus(row['status']),
-                    models=row['models'],
-                    benchmark=row['benchmark'],
-                    progress=row.get('progress', 0.0),
-                    current_model=row.get('current_model'),
-                    created_at=row['created_at'],
-                    started_at=row.get('started_at'),
-                    completed_at=row.get('completed_at'),
-                    estimated_completion=row.get('estimated_completion'),
-                    error_message=row.get('error_message')
-                )
-                for row in results
-            ]
-        finally:
-            await conn.close()
-    except Exception as e:
-        logger.error(f"Failed to list evaluations: {e}")
-        raise HTTPException(status_code=500, detail=f"Failed to list evaluations: {str(e)}")
-@router.get("/{task_id}/status", response_model=EvaluationStatusResponse)
-async def get_evaluation_status(
-    task_id: str
-):
-    """Get evaluation task status"""
-    try:
-        status = await get_task_status(task_id)
-        if not status:
-            raise HTTPException(status_code=404, detail="Task not found")
-        return EvaluationStatusResponse(**status)
-    except HTTPException:
-        raise
-    except Exception as e:
-        logger.error(f"Failed to get evaluation status: {e}")
-        raise HTTPException(status_code=500, detail=f"Failed to get evaluation status: {str(e)}")
-@router.get("/{task_id}/results", response_model=EvaluationResult)
-async def get_evaluation_results(
-    task_id: str
-):
-    """Get evaluation results"""
-    try:
-        # Get task info
-        status = await get_task_status(task_id)
-        if not status:
-            raise HTTPException(status_code=404, detail="Task not found")
-        # Get results
-        conn = await get_db_connection()
-        try:
-            results = await conn.fetch("""
-                SELECT * FROM evaluation_results WHERE evaluation_id = $1 ORDER BY created_at
-            """, task_id)
-            model_results = [
-                ModelResult(
-                    model_name=row['model_name'],
-                    metrics=json.loads(row['metrics']),
-                    raw_results=json.loads(row['raw_results']) if row['raw_results'] else None,
-                    execution_time_seconds=float(row['execution_time_seconds']),
-                    status="completed"
-                )
-                for row in results
-            ]
-            # Calculate summary
-            summary = {}
-            if model_results:
-                all_metrics = [r.metrics for r in model_results]
-                if all_metrics:
-                    metric_names = set()
-                    for metrics in all_metrics:
-                        metric_names.update(metrics.keys())
-                    for metric in metric_names:
-                        values = [m.get(metric, 0) for m in all_metrics if metric in m]
-                        if values:
-                            summary[f"avg_{metric}"] = sum(values) / len(values)
-                            summary[f"max_{metric}"] = max(values)
-                            summary[f"min_{metric}"] = min(values)
-            return EvaluationResult(
-                task_id=task_id,
-                name=status['name'],
-                status=TaskStatus(status['status']),
-                models=model_results,
-                benchmark=status['benchmark'],
-                dataset=status.get('dataset'),
-                summary=summary,
-                created_at=status['created_at'],
-                started_at=status.get('started_at'),
-                completed_at=status.get('completed_at')
-            )
-        finally:
-            await conn.close()
-    except HTTPException:
-        raise
-    except Exception as e:
-        logger.error(f"Failed to get evaluation results: {e}")
-        raise HTTPException(status_code=500, detail=f"Failed to get evaluation results: {str(e)}")
-@router.post("/{task_id}/cancel")
-async def cancel_evaluation(
-    task_id: str
-):
-    """Cancel evaluation task"""
-    try:
-        status = await get_task_status(task_id)
-        if not status:
-            raise HTTPException(status_code=404, detail="Task not found")
-        current_status = TaskStatus(status['status'])
-        if current_status in [TaskStatus.COMPLETED, TaskStatus.FAILED, TaskStatus.CANCELLED]:
-            raise HTTPException(status_code=400, detail=f"Cannot cancel task with status: {current_status}")
-        await update_task_status(task_id, TaskStatus.CANCELLED)
-        return {"success": True, "message": "Task cancelled successfully"}
-    except HTTPException:
-        raise
-    except Exception as e:
-        logger.error(f"Failed to cancel evaluation: {e}")
-        raise HTTPException(status_code=500, detail=f"Failed to cancel evaluation: {str(e)}")
-@router.get("/{task_id}/stream")
-async def stream_evaluation_progress(
-    task_id: str
-):
-    """Stream evaluation progress in real-time"""
-    async def generate():
-        """Generate SSE stream for evaluation progress"""
-        last_status = None
-        while True:
-            try:
-                current_status = await get_task_status(task_id)
-                if not current_status:
-                    yield f"data: {json.dumps({'error': 'Task not found'})}\n\n"
-                    break
-                # Only send update if status changed
-                if current_status != last_status:
-                    yield f"data: {json.dumps(current_status)}\n\n"
-                    last_status = current_status
-                # Stop streaming if task is complete
-                status_enum = TaskStatus(current_status['status'])
-                if status_enum in [TaskStatus.COMPLETED, TaskStatus.FAILED, TaskStatus.CANCELLED]:
-                    break
-                await asyncio.sleep(2)  # Update every 2 seconds
-            except Exception as e:
-                logger.error(f"Error in stream: {e}")
-                yield f"data: {json.dumps({'error': str(e)})}\n\n"
-                break
-    return StreamingResponse(generate(), media_type="text/plain")
-@router.get("/benchmarks", response_model=List[BenchmarkInfo])
-async def list_benchmarks(
-    category: Optional[str] = None
-):
-    """List available benchmarks"""
-    try:
-        # Get benchmarks from database
-        conn = await get_db_connection()
-        try:
-            results = await conn.fetch("SELECT * FROM dev.benchmarks ORDER BY category, name")
-            benchmarks = [
-                BenchmarkInfo(
-                    name=row['name'],
-                    description=row['description'],
-                    category=row['category'],
-                    metrics=row['metrics'] if isinstance(row['metrics'], list) else json.loads(row['metrics']) if row['metrics'] else [],
-                    config_schema=row['config_schema'] if isinstance(row['config_schema'], dict) else json.loads(row['config_schema']) if row['config_schema'] else None
-                )
-                for row in results
-            ]
-        finally:
-            await conn.close()
-        if category:
-            benchmarks = [b for b in benchmarks if b.category == category]
-        return benchmarks
-    except Exception as e:
-        logger.error(f"Failed to list benchmarks: {e}")
-        raise HTTPException(status_code=500, detail=f"Failed to list benchmarks: {str(e)}")
-@router.get("/models")
-async def list_evaluatable_models():
-    """List models available for evaluation"""
-    try:
-        # This would integrate with your model registry
-        # For now, return common models
-        return {
-            "success": True,
-            "models": [
-                {"name": "gpt-4", "provider": "openai", "type": "llm"},
-                {"name": "gpt-3.5-turbo", "provider": "openai", "type": "llm"},
-                {"name": "claude-3-opus", "provider": "anthropic", "type": "llm"},
-                {"name": "claude-3-sonnet", "provider": "anthropic", "type": "llm"},
-                {"name": "llama-2-70b", "provider": "meta", "type": "llm"},
-            ]
-        }
-    except Exception as e:
-        logger.error(f"Failed to list models: {e}")
-        raise HTTPException(status_code=500, detail=f"Failed to list models: {str(e)}")

isa-model 0.4.0__py3-none-any.whl → 0.4.4__py3-none-any.whl

isa-model 0.4.0py3-none-any.whl → 0.4.4py3-none-any.whl