PyPI - isa-model - Versions diffs - 0.4.0__py3-none-any.whl → 0.4.4__py3-none-any.whl - Mend

isa-model 0.4.0py3-none-any.whl → 0.4.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (189) hide show

isa_model/client.py +466 -43
isa_model/core/cache/redis_cache.py +12 -3
isa_model/core/config/config_manager.py +230 -3
isa_model/core/config.py +90 -0
isa_model/core/database/direct_db_client.py +114 -0
isa_model/core/database/migration_manager.py +563 -0
isa_model/core/database/migrations.py +21 -1
isa_model/core/database/supabase_client.py +154 -19
isa_model/core/dependencies.py +316 -0
isa_model/core/discovery/__init__.py +19 -0
isa_model/core/discovery/consul_discovery.py +190 -0
isa_model/core/logging/__init__.py +54 -0
isa_model/core/logging/influx_logger.py +523 -0
isa_model/core/logging/loki_logger.py +160 -0
isa_model/core/models/__init__.py +27 -18
isa_model/core/models/config_models.py +625 -0
isa_model/core/models/deployment_billing_tracker.py +430 -0
isa_model/core/models/model_manager.py +35 -80
isa_model/core/models/model_metadata.py +690 -0
isa_model/core/models/model_repo.py +174 -18
isa_model/core/models/system_models.py +857 -0
isa_model/core/repositories/__init__.py +9 -0
isa_model/core/repositories/config_repository.py +912 -0
isa_model/core/services/intelligent_model_selector.py +399 -21
isa_model/core/types.py +1 -0
isa_model/deployment/__init__.py +5 -48
isa_model/deployment/core/__init__.py +2 -31
isa_model/deployment/core/deployment_manager.py +1278 -370
isa_model/deployment/modal/__init__.py +8 -0
isa_model/deployment/modal/config.py +136 -0
isa_model/deployment/{services/auto_hf_modal_deployer.py → modal/deployer.py} +1 -1
isa_model/deployment/modal/services/__init__.py +3 -0
isa_model/deployment/modal/services/audio/__init__.py +1 -0
isa_model/deployment/modal/services/embedding/__init__.py +1 -0
isa_model/deployment/modal/services/llm/__init__.py +1 -0
isa_model/deployment/modal/services/llm/isa_llm_service.py +424 -0
isa_model/deployment/modal/services/video/__init__.py +1 -0
isa_model/deployment/modal/services/vision/__init__.py +1 -0
isa_model/deployment/models/org-org-acme-corp-tenant-a-service-llm-20250825-225822/tenant-a-service_modal_service.py +48 -0
isa_model/deployment/models/org-test-org-123-prefix-test-service-llm-20250825-225822/prefix-test-service_modal_service.py +48 -0
isa_model/deployment/models/test-llm-service-llm-20250825-204442/test-llm-service_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-212906/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/models/test-monitoring-gpt2-llm-20250825-213009/test-monitoring-gpt2_modal_service.py +48 -0
isa_model/deployment/storage/__init__.py +5 -0
isa_model/deployment/storage/deployment_repository.py +824 -0
isa_model/deployment/triton/__init__.py +10 -0
isa_model/deployment/triton/config.py +196 -0
isa_model/deployment/triton/configs/__init__.py +1 -0
isa_model/deployment/triton/provider.py +512 -0
isa_model/deployment/triton/scripts/__init__.py +1 -0
isa_model/deployment/triton/templates/__init__.py +1 -0
isa_model/inference/__init__.py +47 -1
isa_model/inference/ai_factory.py +137 -10
isa_model/inference/legacy_services/__init__.py +21 -0
isa_model/inference/legacy_services/model_evaluation.py +637 -0
isa_model/inference/legacy_services/model_service.py +573 -0
isa_model/inference/legacy_services/model_serving.py +717 -0
isa_model/inference/legacy_services/model_training.py +561 -0
isa_model/inference/models/__init__.py +21 -0
isa_model/inference/models/inference_config.py +551 -0
isa_model/inference/models/inference_record.py +675 -0
isa_model/inference/models/performance_models.py +714 -0
isa_model/inference/repositories/__init__.py +9 -0
isa_model/inference/repositories/inference_repository.py +828 -0
isa_model/inference/services/audio/base_stt_service.py +184 -11
isa_model/inference/services/audio/openai_stt_service.py +22 -6
isa_model/inference/services/embedding/ollama_embed_service.py +15 -3
isa_model/inference/services/embedding/resilient_embed_service.py +285 -0
isa_model/inference/services/llm/__init__.py +10 -2
isa_model/inference/services/llm/base_llm_service.py +335 -24
isa_model/inference/services/llm/cerebras_llm_service.py +628 -0
isa_model/inference/services/llm/helpers/llm_adapter.py +9 -4
isa_model/inference/services/llm/helpers/llm_prompts.py +342 -0
isa_model/inference/services/llm/helpers/llm_utils.py +321 -23
isa_model/inference/services/llm/huggingface_llm_service.py +581 -0
isa_model/inference/services/llm/ollama_llm_service.py +9 -2
isa_model/inference/services/llm/openai_llm_service.py +33 -16
isa_model/inference/services/llm/yyds_llm_service.py +8 -2
isa_model/inference/services/vision/__init__.py +22 -1
isa_model/inference/services/vision/helpers/image_utils.py +8 -5
isa_model/inference/services/vision/isa_vision_service.py +65 -4
isa_model/inference/services/vision/openai_vision_service.py +19 -10
isa_model/inference/services/vision/vgg16_vision_service.py +257 -0
isa_model/serving/api/cache_manager.py +245 -0
isa_model/serving/api/dependencies/__init__.py +1 -0
isa_model/serving/api/dependencies/auth.py +194 -0
isa_model/serving/api/dependencies/database.py +139 -0
isa_model/serving/api/error_handlers.py +284 -0
isa_model/serving/api/fastapi_server.py +172 -22
isa_model/serving/api/middleware/auth.py +8 -2
isa_model/serving/api/middleware/security.py +23 -33
isa_model/serving/api/middleware/tenant_context.py +414 -0
isa_model/serving/api/routes/analytics.py +4 -1
isa_model/serving/api/routes/config.py +645 -0
isa_model/serving/api/routes/deployment_billing.py +315 -0
isa_model/serving/api/routes/deployments.py +138 -2
isa_model/serving/api/routes/gpu_gateway.py +440 -0
isa_model/serving/api/routes/health.py +32 -12
isa_model/serving/api/routes/inference_monitoring.py +486 -0
isa_model/serving/api/routes/local_deployments.py +448 -0
isa_model/serving/api/routes/tenants.py +575 -0
isa_model/serving/api/routes/unified.py +680 -18
isa_model/serving/api/routes/webhooks.py +479 -0
isa_model/serving/api/startup.py +68 -54
isa_model/utils/gpu_utils.py +311 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.4.dist-info}/METADATA +71 -24
isa_model-0.4.4.dist-info/RECORD +180 -0
isa_model/core/security/secrets.py +0 -358
isa_model/core/storage/hf_storage.py +0 -419
isa_model/core/storage/minio_storage.py +0 -0
isa_model/deployment/cloud/__init__.py +0 -9
isa_model/deployment/cloud/modal/__init__.py +0 -10
isa_model/deployment/core/deployment_config.py +0 -356
isa_model/deployment/core/isa_deployment_service.py +0 -401
isa_model/deployment/gpu_int8_ds8/app/server.py +0 -66
isa_model/deployment/gpu_int8_ds8/scripts/test_client.py +0 -43
isa_model/deployment/gpu_int8_ds8/scripts/test_client_os.py +0 -35
isa_model/deployment/runtime/deployed_service.py +0 -338
isa_model/deployment/services/__init__.py +0 -9
isa_model/deployment/services/auto_deploy_vision_service.py +0 -538
isa_model/deployment/services/model_service.py +0 -332
isa_model/deployment/services/service_monitor.py +0 -356
isa_model/deployment/services/service_registry.py +0 -527
isa_model/eval/__init__.py +0 -92
isa_model/eval/benchmarks/__init__.py +0 -27
isa_model/eval/benchmarks/multimodal_datasets.py +0 -460
isa_model/eval/benchmarks.py +0 -701
isa_model/eval/config/__init__.py +0 -10
isa_model/eval/config/evaluation_config.py +0 -108
isa_model/eval/evaluators/__init__.py +0 -24
isa_model/eval/evaluators/audio_evaluator.py +0 -727
isa_model/eval/evaluators/base_evaluator.py +0 -503
isa_model/eval/evaluators/embedding_evaluator.py +0 -742
isa_model/eval/evaluators/llm_evaluator.py +0 -472
isa_model/eval/evaluators/vision_evaluator.py +0 -564
isa_model/eval/example_evaluation.py +0 -395
isa_model/eval/factory.py +0 -798
isa_model/eval/infrastructure/__init__.py +0 -24
isa_model/eval/infrastructure/experiment_tracker.py +0 -466
isa_model/eval/isa_benchmarks.py +0 -700
isa_model/eval/isa_integration.py +0 -582
isa_model/eval/metrics.py +0 -951
isa_model/eval/tests/unit/test_basic.py +0 -396
isa_model/serving/api/routes/evaluations.py +0 -579
isa_model/training/__init__.py +0 -168
isa_model/training/annotation/annotation_schema.py +0 -47
isa_model/training/annotation/processors/annotation_processor.py +0 -126
isa_model/training/annotation/storage/dataset_manager.py +0 -131
isa_model/training/annotation/storage/dataset_schema.py +0 -44
isa_model/training/annotation/tests/test_annotation_flow.py +0 -109
isa_model/training/annotation/tests/test_minio copy.py +0 -113
isa_model/training/annotation/tests/test_minio_upload.py +0 -43
isa_model/training/annotation/views/annotation_controller.py +0 -158
isa_model/training/cloud/__init__.py +0 -22
isa_model/training/cloud/job_orchestrator.py +0 -402
isa_model/training/cloud/runpod_trainer.py +0 -454
isa_model/training/cloud/storage_manager.py +0 -482
isa_model/training/core/__init__.py +0 -26
isa_model/training/core/config.py +0 -181
isa_model/training/core/dataset.py +0 -222
isa_model/training/core/trainer.py +0 -720
isa_model/training/core/utils.py +0 -213
isa_model/training/examples/intelligent_training_example.py +0 -281
isa_model/training/factory.py +0 -424
isa_model/training/intelligent/__init__.py +0 -25
isa_model/training/intelligent/decision_engine.py +0 -643
isa_model/training/intelligent/intelligent_factory.py +0 -888
isa_model/training/intelligent/knowledge_base.py +0 -751
isa_model/training/intelligent/resource_optimizer.py +0 -839
isa_model/training/intelligent/task_classifier.py +0 -576
isa_model/training/storage/__init__.py +0 -24
isa_model/training/storage/core_integration.py +0 -439
isa_model/training/storage/training_repository.py +0 -552
isa_model/training/storage/training_storage.py +0 -628
isa_model-0.4.0.dist-info/RECORD +0 -182
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_chatTTS_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_fish_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_openvoice_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/audio}/isa_audio_service_v2.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/embedding}/isa_embed_rerank_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/video}/isa_video_hunyuan_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ocr_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_qwen25_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_table_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ui_service.py +0 -0
/isa_model/deployment/{cloud/modal → modal/services/vision}/isa_vision_ui_service_optimized.py +0 -0
/isa_model/deployment/{services → modal/services/vision}/simple_auto_deploy_vision_service.py +0 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.4.dist-info}/WHEEL +0 -0
{isa_model-0.4.0.dist-info → isa_model-0.4.4.dist-info}/top_level.txt +0 -0

isa_model/serving/api/middleware/security.py CHANGED Viewed

@@ -13,7 +13,6 @@ import time
 import logging
 import os
 import redis
-import structlog
 from typing import Dict, Any, Optional, Callable
 from fastapi import FastAPI, Request, Response, HTTPException, status
 from fastapi.middleware.cors import CORSMiddleware
@@ -25,12 +24,16 @@ from starlette.middleware.base import BaseHTTPMiddleware
 from starlette.responses import JSONResponse
 import html
-# Configure structured logging
-logger = structlog.get_logger(__name__)
+from ....core.config.config_manager import ConfigManager
+# Configure logging
+logger = logging.getLogger(__name__)
 # Configuration from environment variables
+config_manager = ConfigManager()
 MAX_REQUEST_SIZE = int(os.getenv("MAX_REQUEST_SIZE_MB", "50")) * 1024 * 1024  # 50MB default
-REDIS_URL = os.getenv("REDIS_URL", "redis://localhost:6379")
+# Use Consul discovery for Redis URL with fallback
+REDIS_URL = os.getenv("REDIS_URL", config_manager.get_redis_url())
 ENABLE_RATE_LIMITING = os.getenv("ENABLE_RATE_LIMITING", "true").lower() == "true"
 RATE_LIMIT_PER_MINUTE = os.getenv("RATE_LIMIT_PER_MINUTE", "100")
 RATE_LIMIT_PER_HOUR = os.getenv("RATE_LIMIT_PER_HOUR", "1000")
@@ -41,7 +44,7 @@ SECURITY_HEADERS = {
     "X-Frame-Options": "DENY",
     "X-XSS-Protection": "1; mode=block",
     "Strict-Transport-Security": "max-age=31536000; includeSubDomains",
-    "Content-Security-Policy": "default-src 'self'; script-src 'self' 'unsafe-inline' https://unpkg.com https://cdn.jsdelivr.net; style-src 'self' 'unsafe-inline' https://fonts.googleapis.com; font-src 'self' https://fonts.gstatic.com; connect-src 'self'",
+    "Content-Security-Policy": "default-src 'self'; script-src 'self' 'unsafe-inline' https://unpkg.com https://cdn.jsdelivr.net; style-src 'self' 'unsafe-inline' https://fonts.googleapis.com https://cdn.jsdelivr.net; font-src 'self' https://fonts.gstatic.com; img-src 'self' https://fastapi.tiangolo.com data:; connect-src 'self'",
     "Referrer-Policy": "strict-origin-when-cross-origin",
     "Permissions-Policy": "geolocation=(), microphone=(), camera=()"
 }
@@ -100,7 +103,7 @@ class SecurityHeadersMiddleware(BaseHTTPMiddleware):
             return response
         except Exception as e:
-            logger.error("Error in security headers middleware", error=str(e))
+            logger.error(f"Error in security headers middleware: {e}")
             return JSONResponse(
                 status_code=500,
                 content={"error": "Internal server error"},
@@ -119,10 +122,8 @@ class RequestValidationMiddleware(BaseHTTPMiddleware):
             content_length = request.headers.get("content-length")
             if content_length and int(content_length) > MAX_REQUEST_SIZE:
                 logger.warning(
-                    "Request too large",
-                    content_length=content_length,
-                    max_size=MAX_REQUEST_SIZE,
-                    client_ip=get_remote_address_with_proxy(request)
+                    f"Request too large: {content_length} bytes > {MAX_REQUEST_SIZE} bytes "
+                    f"from client {get_remote_address_with_proxy(request)}"
                 )
                 raise HTTPException(
                     status_code=status.HTTP_413_REQUEST_ENTITY_TOO_LARGE,
@@ -134,19 +135,15 @@ class RequestValidationMiddleware(BaseHTTPMiddleware):
                 sanitized_query = html.escape(request.url.query)
                 if sanitized_query != request.url.query:
                     logger.warning(
-                        "Potentially malicious query parameters detected",
-                        original=request.url.query,
-                        sanitized=sanitized_query,
-                        client_ip=get_remote_address_with_proxy(request)
+                        f"Potentially malicious query parameters detected from client {get_remote_address_with_proxy(request)}: "
+                        f"'{request.url.query}' -> '{sanitized_query}'"
                     )
             # Log request details for monitoring
             logger.info(
-                "Request received",
-                method=request.method,
-                path=request.url.path,
-                client_ip=get_remote_address_with_proxy(request),
-                user_agent=request.headers.get("user-agent", "unknown")
+                f"Request received: {request.method} {request.url.path} "
+                f"from {get_remote_address_with_proxy(request)} "
+                f"(UA: {request.headers.get('user-agent', 'unknown')})"
             )
             response = await call_next(request)
@@ -154,12 +151,8 @@ class RequestValidationMiddleware(BaseHTTPMiddleware):
             # Log response details
             process_time = time.time() - request.state.start_time
             logger.info(
-                "Request completed",
-                method=request.method,
-                path=request.url.path,
-                status_code=response.status_code,
-                process_time=process_time,
-                client_ip=get_remote_address_with_proxy(request)
+                f"Request completed: {request.method} {request.url.path} -> {response.status_code} "
+                f"in {process_time:.3f}s from {get_remote_address_with_proxy(request)}"
             )
             return response
@@ -168,11 +161,8 @@ class RequestValidationMiddleware(BaseHTTPMiddleware):
             raise
         except Exception as e:
             logger.error(
-                "Error in request validation middleware",
-                error=str(e),
-                path=request.url.path,
-                method=request.method,
-                client_ip=get_remote_address_with_proxy(request)
+                f"Error in request validation middleware: {e} "
+                f"({request.method} {request.url.path} from {get_remote_address_with_proxy(request)})"
             )
             raise HTTPException(
                 status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
@@ -186,13 +176,13 @@ def setup_security_middleware(app: FastAPI):
     if ENABLE_RATE_LIMITING:
         app.state.limiter = limiter
         app.add_exception_handler(RateLimitExceeded, _rate_limit_exceeded_handler)
-        logger.info("Rate limiting enabled", redis_backend=redis_client is not None)
+        logger.info(f"Rate limiting enabled (Redis backend: {redis_client is not None})")
     # Trusted hosts (production should specify allowed hosts)
     allowed_hosts = os.getenv("ALLOWED_HOSTS", "*").split(",")
     if allowed_hosts != ["*"]:
         app.add_middleware(TrustedHostMiddleware, allowed_hosts=allowed_hosts)
-        logger.info("Trusted hosts middleware enabled", allowed_hosts=allowed_hosts)
+        logger.info(f"Trusted hosts middleware enabled: {allowed_hosts}")
     # CORS configuration
     cors_origins = os.getenv("CORS_ORIGINS", "*").split(",")
@@ -204,7 +194,7 @@ def setup_security_middleware(app: FastAPI):
         allow_headers=["*"],
         expose_headers=["X-Process-Time"]
     )
-    logger.info("CORS middleware enabled", origins=cors_origins)
+    logger.info(f"CORS middleware enabled for origins: {cors_origins}")
     # Custom security middleware
     app.add_middleware(SecurityHeadersMiddleware)

isa_model/serving/api/middleware/tenant_context.py ADDED Viewed

@@ -0,0 +1,414 @@
+"""
+Tenant Context Middleware
+Handles tenant isolation by:
+1. Extracting tenant info from requests (API keys, JWT tokens, headers)
+2. Setting tenant context for all database operations
+3. Enforcing resource quotas and access control
+4. Logging tenant-specific activities
+"""
+from fastapi import Request, HTTPException
+from starlette.middleware.base import BaseHTTPMiddleware
+from starlette.responses import Response
+from contextlib import contextmanager
+from contextvars import ContextVar
+from typing import Optional, Dict, Any
+import logging
+import json
+import asyncio
+import time
+logger = logging.getLogger(__name__)
+# Context variables for tenant isolation
+_tenant_context: ContextVar[Optional['TenantContext']] = ContextVar('tenant_context', default=None)
+class TenantContext:
+    """Container for tenant-specific context information"""
+    def __init__(
+        self,
+        organization_id: str,
+        user_id: Optional[str] = None,
+        role: Optional[str] = None,
+        plan: str = "starter",
+        quotas: Optional[Dict[str, Any]] = None,
+        settings: Optional[Dict[str, Any]] = None
+    ):
+        self.organization_id = organization_id
+        self.user_id = user_id
+        self.role = role
+        self.plan = plan
+        self.quotas = quotas or {}
+        self.settings = settings or {}
+        self.request_start_time = time.time()
+    def __str__(self):
+        return f"TenantContext(org={self.organization_id}, user={self.user_id}, role={self.role})"
+    def is_admin(self) -> bool:
+        """Check if current user is admin"""
+        return self.role in ["admin", "owner"]
+    def can_access_resource(self, resource_type: str, action: str = "read") -> bool:
+        """Check if tenant can access a specific resource type"""
+        # TODO: Implement fine-grained permissions
+        return True
+    def check_quota(self, resource: str, current_usage: int = 0) -> bool:
+        """Check if tenant is within quota limits"""
+        if resource not in self.quotas:
+            return True
+        quota_limit = self.quotas[resource]
+        return current_usage < quota_limit
+    def get_database_filter(self) -> Dict[str, Any]:
+        """Get database filter parameters for tenant isolation"""
+        return {"organization_id": self.organization_id}
+def get_tenant_context() -> Optional[TenantContext]:
+    """Get current tenant context"""
+    return _tenant_context.get()
+def require_tenant_context() -> TenantContext:
+    """Get tenant context or raise error if not available"""
+    context = get_tenant_context()
+    if not context:
+        raise HTTPException(
+            status_code=401,
+            detail="Tenant context required - invalid or missing authentication"
+        )
+    return context
+@contextmanager
+def set_tenant_context(context: TenantContext):
+    """Context manager to set tenant context"""
+    token = _tenant_context.set(context)
+    try:
+        yield context
+    finally:
+        _tenant_context.reset(token)
+class TenantContextMiddleware(BaseHTTPMiddleware):
+    """Middleware to extract and set tenant context for requests"""
+    def __init__(self, app, database_pool=None):
+        super().__init__(app)
+        self.database_pool = database_pool
+        # Initialize database pool if not provided
+        if not self.database_pool:
+            try:
+                import asyncio
+                from ..dependencies.database import initialize_database_pool
+                # Will be initialized in first request
+                self.database_pool = None
+            except ImportError:
+                pass
+    async def dispatch(self, request: Request, call_next) -> Response:
+        """Process request and set tenant context"""
+        start_time = time.time()
+        try:
+            # Extract tenant information from request
+            tenant_context = await self.extract_tenant_context(request)
+            # Set context for this request
+            if tenant_context:
+                token = _tenant_context.set(tenant_context)
+                try:
+                    # Check quotas before processing request
+                    await self.enforce_quotas(tenant_context, request)
+                    # Process the request
+                    response = await call_next(request)
+                    # Log successful request
+                    await self.log_tenant_activity(tenant_context, request, response, start_time)
+                    return response
+                finally:
+                    _tenant_context.reset(token)
+            else:
+                # No tenant context - allow for public endpoints
+                return await call_next(request)
+        except HTTPException:
+            raise
+        except Exception as e:
+            logger.error(f"Error in tenant context middleware: {e}", exc_info=True)
+            raise HTTPException(status_code=500, detail="Internal server error")
+    async def extract_tenant_context(self, request: Request) -> Optional[TenantContext]:
+        """Extract tenant information from request"""
+        try:
+            # Skip tenant context for certain paths
+            if self.should_skip_tenant_context(request.url.path):
+                return None
+            # Method 1: Extract from Authorization header (API key or JWT)
+            auth_header = request.headers.get("Authorization")
+            if auth_header:
+                tenant_context = await self.extract_from_auth_header(auth_header)
+                if tenant_context:
+                    return tenant_context
+            # Method 2: Extract from X-Organization-ID header (for service-to-service calls)
+            org_header = request.headers.get("X-Organization-ID")
+            if org_header:
+                return await self.extract_from_org_header(org_header)
+            # Method 3: Extract from query parameters (for some public APIs)
+            org_param = request.query_params.get("organization_id")
+            if org_param:
+                return await self.extract_from_org_param(org_param)
+            return None
+        except Exception as e:
+            logger.error(f"Error extracting tenant context: {e}")
+            return None
+    def should_skip_tenant_context(self, path: str) -> bool:
+        """Check if path should skip tenant context extraction"""
+        skip_paths = [
+            "/health",
+            "/docs",
+            "/redoc",
+            "/openapi.json",
+            "/api/v1/tenants",  # Tenant management endpoints handle their own context
+            "/static"
+        ]
+        return any(path.startswith(skip_path) for skip_path in skip_paths)
+    async def extract_from_auth_header(self, auth_header: str) -> Optional[TenantContext]:
+        """Extract tenant context from Authorization header"""
+        try:
+            if not auth_header.startswith("Bearer "):
+                return None
+            token = auth_header[7:]  # Remove "Bearer "
+            # If it looks like an API key
+            if token.startswith("isa_"):
+                return await self.lookup_api_key(token)
+            # If it looks like a JWT token
+            if "." in token:
+                return await self.decode_jwt_token(token)
+            return None
+        except Exception as e:
+            logger.error(f"Error extracting from auth header: {e}")
+            return None
+    async def extract_from_org_header(self, org_id: str) -> Optional[TenantContext]:
+        """Extract tenant context from organization header"""
+        try:
+            # For service-to-service calls, just create basic context
+            return await self.lookup_organization(org_id)
+        except Exception as e:
+            logger.error(f"Error extracting from org header: {e}")
+            return None
+    async def extract_from_org_param(self, org_id: str) -> Optional[TenantContext]:
+        """Extract tenant context from query parameter"""
+        # Similar to org header but maybe more restricted
+        return await self.lookup_organization(org_id)
+    async def lookup_api_key(self, api_key: str) -> Optional[TenantContext]:
+        """Look up tenant context from API key"""
+        try:
+            # For now, create a simple tenant context based on API key
+            # In a real implementation, this would lookup the organization
+            # associated with the API key from the database
+            # Create a default organization for testing
+            if api_key.startswith("isa_"):
+                return TenantContext(
+                    organization_id="org_default_test_123",
+                    user_id="user_admin",
+                    role="admin",
+                    plan="pro",
+                    quotas={
+                        "api_calls_per_month": 100000,
+                        "max_training_jobs": 10,
+                        "max_deployments": 5
+                    },
+                    settings={}
+                )
+            return None
+        except Exception as e:
+            logger.error(f"Error looking up API key: {e}")
+            return None
+    async def decode_jwt_token(self, token: str) -> Optional[TenantContext]:
+        """Decode JWT token and extract tenant context"""
+        try:
+            # TODO: Implement JWT token decoding
+            # This would involve verifying the token signature and extracting claims
+            logger.info("JWT token decoding not yet implemented")
+            return None
+        except Exception as e:
+            logger.error(f"Error decoding JWT token: {e}")
+            return None
+    async def lookup_organization(self, org_id: str) -> Optional[TenantContext]:
+        """Look up organization details"""
+        try:
+            if not self.database_pool:
+                return None
+            async with self.database_pool.acquire() as conn:
+                result = await conn.fetchrow("""
+                    SELECT o.organization_id, o.plan, o.settings, oq.quotas
+                    FROM organizations o
+                    LEFT JOIN organization_quotas oq ON o.organization_id = oq.organization_id
+                    WHERE o.organization_id = $1 AND o.status = 'active'
+                """, org_id)
+                if result:
+                    return TenantContext(
+                        organization_id=result['organization_id'],
+                        plan=result['plan'],
+                        quotas=result['quotas'] or {},
+                        settings=result['settings'] or {}
+                    )
+            return None
+        except Exception as e:
+            logger.error(f"Error looking up organization {org_id}: {e}")
+            return None
+    async def enforce_quotas(self, context: TenantContext, request: Request):
+        """Enforce tenant quotas before processing request"""
+        try:
+            # Check concurrent request quota
+            # TODO: Implement concurrent request tracking
+            # Check API rate limits
+            if not context.check_quota("requests_per_minute", 0):  # TODO: Get actual usage
+                raise HTTPException(
+                    status_code=429,
+                    detail="Request rate limit exceeded for your organization"
+                )
+            # Check plan-specific restrictions
+            if context.plan == "starter" and request.method in ["POST", "PUT", "DELETE"]:
+                # Maybe starter plans have restricted write access to some endpoints
+                pass
+        except HTTPException:
+            raise
+        except Exception as e:
+            logger.error(f"Error enforcing quotas: {e}")
+            # Don't block request on quota enforcement errors
+    async def log_tenant_activity(
+        self,
+        context: TenantContext,
+        request: Request,
+        response: Response,
+        start_time: float
+    ):
+        """Log tenant-specific activity for billing and monitoring"""
+        try:
+            duration = time.time() - start_time
+            activity_log = {
+                "timestamp": time.time(),
+                "organization_id": context.organization_id,
+                "user_id": context.user_id,
+                "method": request.method,
+                "path": str(request.url.path),
+                "status_code": response.status_code,
+                "duration_ms": duration * 1000,
+                "plan": context.plan
+            }
+            # Log to structured logger for processing
+            logger.info(f"TENANT_ACTIVITY: {json.dumps(activity_log)}")
+            # TODO: Store in database for billing/analytics
+            # await self.store_activity_log(activity_log)
+        except Exception as e:
+            logger.error(f"Error logging tenant activity: {e}")
+# Dependency functions for FastAPI
+def get_current_tenant() -> TenantContext:
+    """FastAPI dependency to get current tenant context"""
+    return require_tenant_context()
+def get_current_organization_id() -> str:
+    """FastAPI dependency to get current organization ID"""
+    context = require_tenant_context()
+    return context.organization_id
+def require_admin_role() -> TenantContext:
+    """FastAPI dependency to require admin role"""
+    context = require_tenant_context()
+    if not context.is_admin():
+        raise HTTPException(
+            status_code=403,
+            detail="Admin role required for this operation"
+        )
+    return context
+def check_resource_quota(resource_type: str):
+    """FastAPI dependency factory to check specific resource quotas"""
+    def _check_quota():
+        context = require_tenant_context()
+        # TODO: Get current usage and check against quota
+        if not context.check_quota(resource_type):
+            raise HTTPException(
+                status_code=429,
+                detail=f"Quota exceeded for {resource_type}"
+            )
+        return context
+    return _check_quota
+# Database query helpers that respect tenant context
+def add_tenant_filter(base_query: str, params: list, table_alias: str = "") -> tuple[str, list]:
+    """Add tenant filter to database queries"""
+    context = get_tenant_context()
+    if not context:
+        return base_query, params
+    # Add organization_id filter
+    table_prefix = f"{table_alias}." if table_alias else ""
+    if "WHERE" in base_query.upper():
+        filtered_query = f"{base_query} AND {table_prefix}organization_id = ${len(params) + 1}"
+    else:
+        filtered_query = f"{base_query} WHERE {table_prefix}organization_id = ${len(params) + 1}"
+    params.append(context.organization_id)
+    return filtered_query, params
+async def tenant_safe_query(conn, query: str, *params, table_alias: str = ""):
+    """Execute query with automatic tenant filtering"""
+    filtered_query, filtered_params = add_tenant_filter(query, list(params), table_alias)
+    return await conn.fetch(filtered_query, *filtered_params)
+async def tenant_safe_fetchrow(conn, query: str, *params, table_alias: str = ""):
+    """Execute fetchrow with automatic tenant filtering"""
+    filtered_query, filtered_params = add_tenant_filter(query, list(params), table_alias)
+    return await conn.fetchrow(filtered_query, *filtered_params)
+async def tenant_safe_execute(conn, query: str, *params, table_alias: str = ""):
+    """Execute query with automatic tenant filtering"""
+    filtered_query, filtered_params = add_tenant_filter(query, list(params), table_alias)
+    return await conn.execute(filtered_query, *filtered_params)

isa_model/serving/api/routes/analytics.py CHANGED Viewed

@@ -14,12 +14,15 @@ import asyncpg
 import os
 from collections import defaultdict
+from ....core.config.config_manager import ConfigManager
 logger = logging.getLogger(__name__)
 router = APIRouter()
 # Database connection configuration
-DATABASE_URL = os.getenv("DATABASE_URL", "postgresql://postgres:postgres@127.0.0.1:54322/postgres?options=-c%20search_path%3Ddev")
+config_manager = ConfigManager()
+DATABASE_URL = os.getenv("DATABASE_URL", config_manager.get_global_config().database.default_database_url)
 class AnalyticsDateRange(BaseModel):
     start_date: Optional[str] = None

isa-model 0.4.0__py3-none-any.whl → 0.4.4__py3-none-any.whl

isa-model 0.4.0py3-none-any.whl → 0.4.4py3-none-any.whl