PyPI - isa-model - Versions diffs - 0.3.9__py3-none-any.whl → 0.4.0__py3-none-any.whl - Mend

isa-model 0.3.9py3-none-any.whl → 0.4.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (124) hide show

isa_model/__init__.py +1 -1
isa_model/client.py +732 -565
isa_model/core/cache/redis_cache.py +401 -0
isa_model/core/config/config_manager.py +53 -10
isa_model/core/config.py +1 -1
isa_model/core/database/__init__.py +1 -0
isa_model/core/database/migrations.py +277 -0
isa_model/core/database/supabase_client.py +123 -0
isa_model/core/models/__init__.py +37 -0
isa_model/core/models/model_billing_tracker.py +60 -88
isa_model/core/models/model_manager.py +36 -18
isa_model/core/models/model_repo.py +44 -38
isa_model/core/models/model_statistics_tracker.py +234 -0
isa_model/core/models/model_storage.py +0 -1
isa_model/core/models/model_version_manager.py +959 -0
isa_model/core/pricing_manager.py +2 -249
isa_model/core/resilience/circuit_breaker.py +366 -0
isa_model/core/security/secrets.py +358 -0
isa_model/core/services/__init__.py +2 -4
isa_model/core/services/intelligent_model_selector.py +101 -370
isa_model/core/storage/hf_storage.py +1 -1
isa_model/core/types.py +7 -0
isa_model/deployment/cloud/modal/isa_audio_chatTTS_service.py +520 -0
isa_model/deployment/cloud/modal/isa_audio_fish_service.py +0 -0
isa_model/deployment/cloud/modal/isa_audio_openvoice_service.py +758 -0
isa_model/deployment/cloud/modal/isa_audio_service_v2.py +1044 -0
isa_model/deployment/cloud/modal/isa_embed_rerank_service.py +296 -0
isa_model/deployment/cloud/modal/isa_video_hunyuan_service.py +423 -0
isa_model/deployment/cloud/modal/isa_vision_ocr_service.py +519 -0
isa_model/deployment/cloud/modal/isa_vision_qwen25_service.py +709 -0
isa_model/deployment/cloud/modal/isa_vision_table_service.py +467 -323
isa_model/deployment/cloud/modal/isa_vision_ui_service.py +607 -180
isa_model/deployment/cloud/modal/isa_vision_ui_service_optimized.py +660 -0
isa_model/deployment/core/deployment_manager.py +6 -4
isa_model/deployment/services/auto_hf_modal_deployer.py +894 -0
isa_model/eval/benchmarks/__init__.py +27 -0
isa_model/eval/benchmarks/multimodal_datasets.py +460 -0
isa_model/eval/benchmarks.py +244 -12
isa_model/eval/evaluators/__init__.py +8 -2
isa_model/eval/evaluators/audio_evaluator.py +727 -0
isa_model/eval/evaluators/embedding_evaluator.py +742 -0
isa_model/eval/evaluators/vision_evaluator.py +564 -0
isa_model/eval/example_evaluation.py +395 -0
isa_model/eval/factory.py +272 -5
isa_model/eval/isa_benchmarks.py +700 -0
isa_model/eval/isa_integration.py +582 -0
isa_model/eval/metrics.py +159 -6
isa_model/eval/tests/unit/test_basic.py +396 -0
isa_model/inference/ai_factory.py +44 -8
isa_model/inference/services/audio/__init__.py +21 -0
isa_model/inference/services/audio/base_realtime_service.py +225 -0
isa_model/inference/services/audio/isa_tts_service.py +0 -0
isa_model/inference/services/audio/openai_realtime_service.py +320 -124
isa_model/inference/services/audio/openai_stt_service.py +32 -6
isa_model/inference/services/base_service.py +17 -1
isa_model/inference/services/embedding/__init__.py +13 -0
isa_model/inference/services/embedding/base_embed_service.py +111 -8
isa_model/inference/services/embedding/isa_embed_service.py +305 -0
isa_model/inference/services/embedding/openai_embed_service.py +2 -4
isa_model/inference/services/embedding/tests/test_embedding.py +222 -0
isa_model/inference/services/img/__init__.py +2 -2
isa_model/inference/services/img/base_image_gen_service.py +24 -7
isa_model/inference/services/img/replicate_image_gen_service.py +84 -422
isa_model/inference/services/img/services/replicate_face_swap.py +193 -0
isa_model/inference/services/img/services/replicate_flux.py +226 -0
isa_model/inference/services/img/services/replicate_flux_kontext.py +219 -0
isa_model/inference/services/img/services/replicate_sticker_maker.py +249 -0
isa_model/inference/services/img/tests/test_img_client.py +297 -0
isa_model/inference/services/llm/base_llm_service.py +30 -6
isa_model/inference/services/llm/helpers/llm_adapter.py +63 -9
isa_model/inference/services/llm/ollama_llm_service.py +2 -1
isa_model/inference/services/llm/openai_llm_service.py +652 -55
isa_model/inference/services/llm/yyds_llm_service.py +2 -1
isa_model/inference/services/vision/__init__.py +5 -5
isa_model/inference/services/vision/base_vision_service.py +118 -185
isa_model/inference/services/vision/helpers/image_utils.py +11 -5
isa_model/inference/services/vision/isa_vision_service.py +573 -0
isa_model/inference/services/vision/tests/test_ocr_client.py +284 -0
isa_model/serving/api/fastapi_server.py +88 -16
isa_model/serving/api/middleware/auth.py +311 -0
isa_model/serving/api/middleware/security.py +278 -0
isa_model/serving/api/routes/analytics.py +486 -0
isa_model/serving/api/routes/deployments.py +339 -0
isa_model/serving/api/routes/evaluations.py +579 -0
isa_model/serving/api/routes/logs.py +430 -0
isa_model/serving/api/routes/settings.py +582 -0
isa_model/serving/api/routes/unified.py +324 -165
isa_model/serving/api/startup.py +304 -0
isa_model/serving/modal_proxy_server.py +249 -0
isa_model/training/__init__.py +100 -6
isa_model/training/core/__init__.py +4 -1
isa_model/training/examples/intelligent_training_example.py +281 -0
isa_model/training/intelligent/__init__.py +25 -0
isa_model/training/intelligent/decision_engine.py +643 -0
isa_model/training/intelligent/intelligent_factory.py +888 -0
isa_model/training/intelligent/knowledge_base.py +751 -0
isa_model/training/intelligent/resource_optimizer.py +839 -0
isa_model/training/intelligent/task_classifier.py +576 -0
isa_model/training/storage/__init__.py +24 -0
isa_model/training/storage/core_integration.py +439 -0
isa_model/training/storage/training_repository.py +552 -0
isa_model/training/storage/training_storage.py +628 -0
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/METADATA +13 -1
isa_model-0.4.0.dist-info/RECORD +182 -0
isa_model/deployment/cloud/modal/isa_vision_doc_service.py +0 -766
isa_model/deployment/cloud/modal/register_models.py +0 -321
isa_model/inference/adapter/unified_api.py +0 -248
isa_model/inference/services/helpers/stacked_config.py +0 -148
isa_model/inference/services/img/flux_professional_service.py +0 -603
isa_model/inference/services/img/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/others/table_transformer_service.py +0 -61
isa_model/inference/services/vision/doc_analysis_service.py +0 -640
isa_model/inference/services/vision/helpers/base_stacked_service.py +0 -274
isa_model/inference/services/vision/ui_analysis_service.py +0 -823
isa_model/scripts/inference_tracker.py +0 -283
isa_model/scripts/mlflow_manager.py +0 -379
isa_model/scripts/model_registry.py +0 -465
isa_model/scripts/register_models.py +0 -370
isa_model/scripts/register_models_with_embeddings.py +0 -510
isa_model/scripts/start_mlflow.py +0 -95
isa_model/scripts/training_tracker.py +0 -257
isa_model-0.3.9.dist-info/RECORD +0 -138
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/WHEEL +0 -0
{isa_model-0.3.9.dist-info → isa_model-0.4.0.dist-info}/top_level.txt +0 -0

isa_model/serving/api/routes/logs.py ADDED Viewed

@@ -0,0 +1,430 @@
+"""
+Logs API Routes
+Handles log retrieval, filtering, and streaming for the ISA Model Platform
+"""
+from fastapi import APIRouter, Query, HTTPException
+from pydantic import BaseModel
+from typing import Optional, List, Dict, Any, Union
+import logging
+import time
+import json
+from datetime import datetime, timedelta
+from collections import defaultdict
+logger = logging.getLogger(__name__)
+router = APIRouter()
+# In-memory log storage (in production, use a proper logging system like ELK, Grafana Loki, etc.)
+logs_storage = []
+max_logs = 10000  # Limit logs in memory
+class LogEntry(BaseModel):
+    timestamp: float
+    level: str
+    service: str
+    component: Optional[str] = None
+    message: str
+    request_id: Optional[str] = None
+    duration: Optional[float] = None
+    details: Optional[Dict[str, Any]] = None
+    stack_trace: Optional[str] = None
+class LogFilter(BaseModel):
+    level: Optional[str] = None
+    service: Optional[str] = None
+    component: Optional[str] = None
+    time_range: Optional[str] = "24h"
+    since: Optional[float] = None
+    limit: Optional[int] = 1000
+    search: Optional[str] = None
+def add_log_entry(
+    level: str,
+    service: str,
+    message: str,
+    component: Optional[str] = None,
+    request_id: Optional[str] = None,
+    duration: Optional[float] = None,
+    details: Optional[Dict[str, Any]] = None,
+    stack_trace: Optional[str] = None
+):
+    """Add a log entry to the storage"""
+    global logs_storage
+    log_entry = {
+        "timestamp": time.time() * 1000,  # Convert to milliseconds
+        "level": level,
+        "service": service,
+        "component": component,
+        "message": message,
+        "request_id": request_id,
+        "duration": duration,
+        "details": details,
+        "stack_trace": stack_trace
+    }
+    # Add to beginning of list (newest first)
+    logs_storage.insert(0, log_entry)
+    # Limit storage size
+    if len(logs_storage) > max_logs:
+        logs_storage = logs_storage[:max_logs]
+def get_time_range_timestamp(time_range: str) -> float:
+    """Convert time range string to timestamp"""
+    now = time.time() * 1000
+    time_ranges = {
+        "1h": now - (1 * 60 * 60 * 1000),
+        "6h": now - (6 * 60 * 60 * 1000),
+        "24h": now - (24 * 60 * 60 * 1000),
+        "7d": now - (7 * 24 * 60 * 60 * 1000),
+        "30d": now - (30 * 24 * 60 * 60 * 1000)
+    }
+    return time_ranges.get(time_range, now - (24 * 60 * 60 * 1000))
+def filter_logs(logs: List[Dict], filters: LogFilter) -> List[Dict]:
+    """Apply filters to log list"""
+    filtered_logs = logs
+    # Time range filter
+    if filters.time_range:
+        since_timestamp = get_time_range_timestamp(filters.time_range)
+        filtered_logs = [log for log in filtered_logs if log["timestamp"] >= since_timestamp]
+    # Since timestamp filter (for streaming)
+    if filters.since:
+        filtered_logs = [log for log in filtered_logs if log["timestamp"] > filters.since]
+    # Level filter
+    if filters.level:
+        filtered_logs = [log for log in filtered_logs if log["level"] == filters.level]
+    # Service filter
+    if filters.service:
+        filtered_logs = [log for log in filtered_logs if log["service"] == filters.service]
+    # Component filter
+    if filters.component:
+        filtered_logs = [log for log in filtered_logs if log.get("component") == filters.component]
+    # Search filter
+    if filters.search:
+        search_term = filters.search.lower()
+        filtered_logs = [
+            log for log in filtered_logs
+            if search_term in log["message"].lower() or
+               search_term in log["service"].lower() or
+               (log.get("component") and search_term in log["component"].lower())
+        ]
+    # Limit results
+    if filters.limit:
+        filtered_logs = filtered_logs[:filters.limit]
+    return filtered_logs
+@router.get("/")
+async def get_logs(
+    level: Optional[str] = Query(None, description="Filter by log level"),
+    service: Optional[str] = Query(None, description="Filter by service"),
+    component: Optional[str] = Query(None, description="Filter by component"),
+    time_range: Optional[str] = Query("24h", description="Time range (1h, 6h, 24h, 7d, 30d)"),
+    limit: Optional[int] = Query(1000, description="Maximum number of logs"),
+    search: Optional[str] = Query(None, description="Search term")
+):
+    """
+    Get filtered logs
+    """
+    try:
+        filters = LogFilter(
+            level=level,
+            service=service,
+            component=component,
+            time_range=time_range,
+            limit=limit,
+            search=search
+        )
+        # If no logs in storage, generate some sample logs
+        if not logs_storage:
+            populate_sample_logs()
+        filtered_logs = filter_logs(logs_storage, filters)
+        return {
+            "logs": filtered_logs,
+            "total": len(logs_storage),
+            "filtered": len(filtered_logs),
+            "filters": filters.dict()
+        }
+    except Exception as e:
+        logger.error(f"Error retrieving logs: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to retrieve logs: {str(e)}")
+@router.get("/stream")
+async def get_logs_stream(
+    since: Optional[float] = Query(None, description="Get logs since timestamp"),
+    level: Optional[str] = Query(None, description="Filter by log level"),
+    service: Optional[str] = Query(None, description="Filter by service"),
+    limit: Optional[int] = Query(50, description="Maximum number of logs")
+):
+    """
+    Get new logs for streaming (since a specific timestamp)
+    """
+    try:
+        filters = LogFilter(
+            level=level,
+            service=service,
+            since=since,
+            limit=limit
+        )
+        # Generate some new sample logs periodically
+        if len(logs_storage) < 20:
+            add_sample_log()
+        filtered_logs = filter_logs(logs_storage, filters)
+        return filtered_logs
+    except Exception as e:
+        logger.error(f"Error streaming logs: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to stream logs: {str(e)}")
+@router.post("/")
+async def add_log(log_entry: LogEntry):
+    """
+    Add a new log entry
+    """
+    try:
+        add_log_entry(
+            level=log_entry.level,
+            service=log_entry.service,
+            message=log_entry.message,
+            component=log_entry.component,
+            request_id=log_entry.request_id,
+            duration=log_entry.duration,
+            details=log_entry.details,
+            stack_trace=log_entry.stack_trace
+        )
+        return {"success": True, "message": "Log entry added"}
+    except Exception as e:
+        logger.error(f"Error adding log entry: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to add log entry: {str(e)}")
+@router.get("/stats")
+async def get_log_stats():
+    """
+    Get log statistics
+    """
+    try:
+        if not logs_storage:
+            populate_sample_logs()
+        # Calculate statistics
+        one_hour_ago = time.time() * 1000 - (60 * 60 * 1000)
+        stats = {
+            "total_logs": len(logs_storage),
+            "logs_last_hour": len([log for log in logs_storage if log["timestamp"] > one_hour_ago]),
+            "by_level": defaultdict(int),
+            "by_service": defaultdict(int),
+            "errors_last_hour": 0,
+            "warnings_last_hour": 0
+        }
+        for log in logs_storage:
+            stats["by_level"][log["level"]] += 1
+            stats["by_service"][log["service"]] += 1
+            if log["timestamp"] > one_hour_ago:
+                if log["level"] == "ERROR":
+                    stats["errors_last_hour"] += 1
+                elif log["level"] == "WARNING":
+                    stats["warnings_last_hour"] += 1
+        # Convert defaultdict to regular dict for JSON serialization
+        stats["by_level"] = dict(stats["by_level"])
+        stats["by_service"] = dict(stats["by_service"])
+        return stats
+    except Exception as e:
+        logger.error(f"Error getting log stats: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to get log stats: {str(e)}")
+@router.delete("/")
+async def clear_logs():
+    """
+    Clear all logs
+    """
+    try:
+        global logs_storage
+        logs_storage = []
+        return {"success": True, "message": "All logs cleared"}
+    except Exception as e:
+        logger.error(f"Error clearing logs: {e}")
+        raise HTTPException(status_code=500, detail=f"Failed to clear logs: {str(e)}")
+def populate_sample_logs():
+    """Populate storage with sample logs for demonstration"""
+    sample_logs = [
+        {
+            "level": "INFO",
+            "service": "api",
+            "component": "fastapi",
+            "message": "FastAPI server started successfully",
+            "request_id": "req_001",
+            "duration": 125
+        },
+        {
+            "level": "INFO",
+            "service": "deployments",
+            "component": "deployer",
+            "message": "HuggingFace model analysis completed for microsoft/DialoGPT-medium",
+            "request_id": "dep_001",
+            "details": {
+                "model_id": "microsoft/DialoGPT-medium",
+                "model_type": "text",
+                "gpu_requirements": "A10G",
+                "estimated_cost": 1.20
+            }
+        },
+        {
+            "level": "WARNING",
+            "service": "api",
+            "component": "middleware",
+            "message": "High request rate detected from client 192.168.1.100",
+            "request_id": "req_002",
+            "details": {
+                "client_ip": "192.168.1.100",
+                "requests_per_minute": 120,
+                "threshold": 100
+            }
+        },
+        {
+            "level": "ERROR",
+            "service": "deployments",
+            "component": "modal",
+            "message": "Failed to deploy model: insufficient GPU resources",
+            "request_id": "dep_002",
+            "details": {
+                "model_id": "meta-llama/Llama-2-70b-chat-hf",
+                "required_gpu": "A100-80GB",
+                "available_gpu": "A10G-24GB"
+            },
+            "stack_trace": "Traceback (most recent call last):\n  File \"modal_deployer.py\", line 45, in deploy\n    raise InsufficientResourcesError(\"GPU resources unavailable\")\nInsufficientResourcesError: GPU resources unavailable"
+        },
+        {
+            "level": "INFO",
+            "service": "models",
+            "component": "registry",
+            "message": "Model registry updated with 3 new models",
+            "request_id": "mod_001",
+            "details": {
+                "new_models": ["Qwen/Qwen2-VL-7B-Instruct", "BAAI/bge-base-en-v1.5", "openai/whisper-large-v3"],
+                "total_models": 156
+            }
+        },
+        {
+            "level": "DEBUG",
+            "service": "api",
+            "component": "auth",
+            "message": "User authentication successful",
+            "request_id": "auth_001",
+            "details": {
+                "user_id": "user_123",
+                "method": "api_key",
+                "permissions": ["read", "deploy"]
+            }
+        },
+        {
+            "level": "INFO",
+            "service": "api",
+            "component": "models",
+            "message": "Model inference request completed",
+            "request_id": "inf_001",
+            "duration": 245,
+            "details": {
+                "model": "gpt-4-turbo",
+                "tokens": 150,
+                "cost": 0.003
+            }
+        },
+        {
+            "level": "WARNING",
+            "service": "system",
+            "component": "monitoring",
+            "message": "High memory usage detected",
+            "details": {
+                "memory_usage": "85%",
+                "threshold": "80%",
+                "service": "deployments"
+            }
+        }
+    ]
+    current_time = time.time() * 1000
+    for i, log in enumerate(sample_logs):
+        add_log_entry(
+            level=log["level"],
+            service=log["service"],
+            message=log["message"],
+            component=log.get("component"),
+            request_id=log.get("request_id"),
+            duration=log.get("duration"),
+            details=log.get("details"),
+            stack_trace=log.get("stack_trace")
+        )
+        # Adjust timestamps to be recent
+        logs_storage[i]["timestamp"] = current_time - (i * 5000)  # 5 seconds apart
+def add_sample_log():
+    """Add a new sample log entry for live streaming demo"""
+    import random
+    sample_messages = [
+        ("INFO", "api", "HTTP request processed", "fastapi", {"status": 200, "path": "/api/v1/models"}),
+        ("INFO", "deployments", "Model deployment started", "deployer", {"model": "BAAI/bge-base-en-v1.5"}),
+        ("WARNING", "api", "Rate limiting applied", "middleware", {"client": "192.168.1.50", "rate": 105}),
+        ("DEBUG", "models", "Model cache hit", "registry", {"model": "gpt-4-turbo", "cache_size": "2.1GB"}),
+        ("INFO", "system", "Health check completed", "monitor", {"status": "healthy", "services": 5}),
+        ("ERROR", "deployments", "Model loading failed", "loader", {"model": "invalid/model-id", "error": "not found"}),
+    ]
+    level, service, message, component, details = random.choice(sample_messages)
+    request_id = f"req_{random.randint(1000, 9999)}"
+    duration = random.randint(50, 500) if level == "INFO" else None
+    add_log_entry(
+        level=level,
+        service=service,
+        message=message,
+        component=component,
+        request_id=request_id,
+        duration=duration,
+        details=details
+    )
+# Health check for logs service
+@router.get("/health")
+async def logs_health():
+    """Health check for logs service"""
+    return {
+        "status": "healthy",
+        "service": "logs",
+        "total_logs": len(logs_storage),
+        "memory_usage": f"{len(logs_storage)}/{max_logs} logs"
+    }

isa-model 0.3.9__py3-none-any.whl → 0.4.0__py3-none-any.whl

isa-model 0.3.9py3-none-any.whl → 0.4.0py3-none-any.whl