PyPI - karaoke-gen - Versions diffs - 0.86.7__py3-none-any.whl → 0.96.0__py3-none-any.whl - Mend

karaoke-gen 0.86.7py3-none-any.whl → 0.96.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (188) hide show

backend/.coveragerc +20 -0
backend/.gitignore +37 -0
backend/Dockerfile +43 -0
backend/Dockerfile.base +74 -0
backend/README.md +242 -0
backend/__init__.py +0 -0
backend/api/__init__.py +0 -0
backend/api/dependencies.py +457 -0
backend/api/routes/__init__.py +0 -0
backend/api/routes/admin.py +742 -0
backend/api/routes/audio_search.py +903 -0
backend/api/routes/auth.py +348 -0
backend/api/routes/file_upload.py +2076 -0
backend/api/routes/health.py +344 -0
backend/api/routes/internal.py +435 -0
backend/api/routes/jobs.py +1610 -0
backend/api/routes/review.py +652 -0
backend/api/routes/themes.py +162 -0
backend/api/routes/users.py +1014 -0
backend/config.py +172 -0
backend/main.py +133 -0
backend/middleware/__init__.py +5 -0
backend/middleware/audit_logging.py +124 -0
backend/models/__init__.py +0 -0
backend/models/job.py +519 -0
backend/models/requests.py +123 -0
backend/models/theme.py +153 -0
backend/models/user.py +254 -0
backend/models/worker_log.py +164 -0
backend/pyproject.toml +29 -0
backend/quick-check.sh +93 -0
backend/requirements.txt +29 -0
backend/run_tests.sh +60 -0
backend/services/__init__.py +0 -0
backend/services/audio_analysis_service.py +243 -0
backend/services/audio_editing_service.py +278 -0
backend/services/audio_search_service.py +702 -0
backend/services/auth_service.py +630 -0
backend/services/credential_manager.py +792 -0
backend/services/discord_service.py +172 -0
backend/services/dropbox_service.py +301 -0
backend/services/email_service.py +1093 -0
backend/services/encoding_interface.py +454 -0
backend/services/encoding_service.py +405 -0
backend/services/firestore_service.py +512 -0
backend/services/flacfetch_client.py +573 -0
backend/services/gce_encoding/README.md +72 -0
backend/services/gce_encoding/__init__.py +22 -0
backend/services/gce_encoding/main.py +589 -0
backend/services/gce_encoding/requirements.txt +16 -0
backend/services/gdrive_service.py +356 -0
backend/services/job_logging.py +258 -0
backend/services/job_manager.py +842 -0
backend/services/job_notification_service.py +271 -0
backend/services/local_encoding_service.py +590 -0
backend/services/local_preview_encoding_service.py +407 -0
backend/services/lyrics_cache_service.py +216 -0
backend/services/metrics.py +413 -0
backend/services/packaging_service.py +287 -0
backend/services/rclone_service.py +106 -0
backend/services/storage_service.py +209 -0
backend/services/stripe_service.py +275 -0
backend/services/structured_logging.py +254 -0
backend/services/template_service.py +330 -0
backend/services/theme_service.py +469 -0
backend/services/tracing.py +543 -0
backend/services/user_service.py +721 -0
backend/services/worker_service.py +558 -0
backend/services/youtube_service.py +112 -0
backend/services/youtube_upload_service.py +445 -0
backend/tests/__init__.py +4 -0
backend/tests/conftest.py +224 -0
backend/tests/emulator/__init__.py +7 -0
backend/tests/emulator/conftest.py +88 -0
backend/tests/emulator/test_e2e_cli_backend.py +1053 -0
backend/tests/emulator/test_emulator_integration.py +356 -0
backend/tests/emulator/test_style_loading_direct.py +436 -0
backend/tests/emulator/test_worker_logs_direct.py +229 -0
backend/tests/emulator/test_worker_logs_subcollection.py +443 -0
backend/tests/requirements-test.txt +10 -0
backend/tests/requirements.txt +6 -0
backend/tests/test_admin_email_endpoints.py +411 -0
backend/tests/test_api_integration.py +460 -0
backend/tests/test_api_routes.py +93 -0
backend/tests/test_audio_analysis_service.py +294 -0
backend/tests/test_audio_editing_service.py +386 -0
backend/tests/test_audio_search.py +1398 -0
backend/tests/test_audio_services.py +378 -0
backend/tests/test_auth_firestore.py +231 -0
backend/tests/test_config_extended.py +68 -0
backend/tests/test_credential_manager.py +377 -0
backend/tests/test_dependencies.py +54 -0
backend/tests/test_discord_service.py +244 -0
backend/tests/test_distribution_services.py +820 -0
backend/tests/test_dropbox_service.py +472 -0
backend/tests/test_email_service.py +492 -0
backend/tests/test_emulator_integration.py +322 -0
backend/tests/test_encoding_interface.py +412 -0
backend/tests/test_file_upload.py +1739 -0
backend/tests/test_flacfetch_client.py +632 -0
backend/tests/test_gdrive_service.py +524 -0
backend/tests/test_instrumental_api.py +431 -0
backend/tests/test_internal_api.py +343 -0
backend/tests/test_job_creation_regression.py +583 -0
backend/tests/test_job_manager.py +339 -0
backend/tests/test_job_manager_notifications.py +329 -0
backend/tests/test_job_notification_service.py +443 -0
backend/tests/test_jobs_api.py +273 -0
backend/tests/test_local_encoding_service.py +423 -0
backend/tests/test_local_preview_encoding_service.py +567 -0
backend/tests/test_main.py +87 -0
backend/tests/test_models.py +918 -0
backend/tests/test_packaging_service.py +382 -0
backend/tests/test_requests.py +201 -0
backend/tests/test_routes_jobs.py +282 -0
backend/tests/test_routes_review.py +337 -0
backend/tests/test_services.py +556 -0
backend/tests/test_services_extended.py +112 -0
backend/tests/test_storage_service.py +448 -0
backend/tests/test_style_upload.py +261 -0
backend/tests/test_template_service.py +295 -0
backend/tests/test_theme_service.py +516 -0
backend/tests/test_unicode_sanitization.py +522 -0
backend/tests/test_upload_api.py +256 -0
backend/tests/test_validate.py +156 -0
backend/tests/test_video_worker_orchestrator.py +847 -0
backend/tests/test_worker_log_subcollection.py +509 -0
backend/tests/test_worker_logging.py +365 -0
backend/tests/test_workers.py +1116 -0
backend/tests/test_workers_extended.py +178 -0
backend/tests/test_youtube_service.py +247 -0
backend/tests/test_youtube_upload_service.py +568 -0
backend/validate.py +173 -0
backend/version.py +27 -0
backend/workers/README.md +597 -0
backend/workers/__init__.py +11 -0
backend/workers/audio_worker.py +618 -0
backend/workers/lyrics_worker.py +683 -0
backend/workers/render_video_worker.py +483 -0
backend/workers/screens_worker.py +525 -0
backend/workers/style_helper.py +198 -0
backend/workers/video_worker.py +1277 -0
backend/workers/video_worker_orchestrator.py +701 -0
backend/workers/worker_logging.py +278 -0
karaoke_gen/instrumental_review/static/index.html +7 -4
karaoke_gen/karaoke_finalise/karaoke_finalise.py +6 -1
karaoke_gen/style_loader.py +3 -1
karaoke_gen/utils/__init__.py +163 -8
karaoke_gen/video_background_processor.py +9 -4
{karaoke_gen-0.86.7.dist-info → karaoke_gen-0.96.0.dist-info}/METADATA +2 -1
{karaoke_gen-0.86.7.dist-info → karaoke_gen-0.96.0.dist-info}/RECORD +187 -42
lyrics_transcriber/correction/agentic/providers/config.py +9 -5
lyrics_transcriber/correction/agentic/providers/langchain_bridge.py +1 -51
lyrics_transcriber/correction/corrector.py +192 -130
lyrics_transcriber/correction/operations.py +24 -9
lyrics_transcriber/frontend/package-lock.json +2 -2
lyrics_transcriber/frontend/package.json +1 -1
lyrics_transcriber/frontend/src/components/AIFeedbackModal.tsx +1 -1
lyrics_transcriber/frontend/src/components/CorrectedWordWithActions.tsx +11 -7
lyrics_transcriber/frontend/src/components/EditActionBar.tsx +31 -5
lyrics_transcriber/frontend/src/components/EditModal.tsx +28 -10
lyrics_transcriber/frontend/src/components/EditTimelineSection.tsx +123 -27
lyrics_transcriber/frontend/src/components/EditWordList.tsx +112 -60
lyrics_transcriber/frontend/src/components/Header.tsx +90 -76
lyrics_transcriber/frontend/src/components/LyricsAnalyzer.tsx +53 -31
lyrics_transcriber/frontend/src/components/LyricsSynchronizer/SyncControls.tsx +44 -13
lyrics_transcriber/frontend/src/components/LyricsSynchronizer/TimelineCanvas.tsx +66 -50
lyrics_transcriber/frontend/src/components/LyricsSynchronizer/index.tsx +124 -30
lyrics_transcriber/frontend/src/components/ReferenceView.tsx +1 -1
lyrics_transcriber/frontend/src/components/TimelineEditor.tsx +12 -5
lyrics_transcriber/frontend/src/components/TimingOffsetModal.tsx +3 -3
lyrics_transcriber/frontend/src/components/TranscriptionView.tsx +1 -1
lyrics_transcriber/frontend/src/components/WordDivider.tsx +11 -7
lyrics_transcriber/frontend/src/components/shared/components/Word.tsx +4 -2
lyrics_transcriber/frontend/src/hooks/useManualSync.ts +103 -1
lyrics_transcriber/frontend/src/theme.ts +42 -15
lyrics_transcriber/frontend/tsconfig.tsbuildinfo +1 -1
lyrics_transcriber/frontend/vite.config.js +5 -0
lyrics_transcriber/frontend/web_assets/assets/{index-BECn1o8Q.js → index-BSMgOq4Z.js} +6959 -5782
lyrics_transcriber/frontend/web_assets/assets/index-BSMgOq4Z.js.map +1 -0
lyrics_transcriber/frontend/web_assets/index.html +6 -2
lyrics_transcriber/frontend/web_assets/nomad-karaoke-logo.svg +5 -0
lyrics_transcriber/output/generator.py +17 -3
lyrics_transcriber/output/video.py +60 -95
lyrics_transcriber/frontend/web_assets/assets/index-BECn1o8Q.js.map +0 -1
{karaoke_gen-0.86.7.dist-info → karaoke_gen-0.96.0.dist-info}/WHEEL +0 -0
{karaoke_gen-0.86.7.dist-info → karaoke_gen-0.96.0.dist-info}/entry_points.txt +0 -0
{karaoke_gen-0.86.7.dist-info → karaoke_gen-0.96.0.dist-info}/licenses/LICENSE +0 -0

backend/services/job_manager.py ADDED Viewed

@@ -0,0 +1,842 @@
+"""
+Job management and queue operations.
+This module handles the complete job lifecycle including:
+- Job creation and initialization
+- State transitions and validation
+- Worker coordination (parallel audio + lyrics processing)
+- Progress tracking and timeline events
+- Error handling and retries
+"""
+import logging
+import uuid
+from datetime import datetime
+from typing import Optional, Dict, Any, List
+from backend.config import settings
+from backend.models.job import Job, JobStatus, JobCreate, STATE_TRANSITIONS
+from backend.models.worker_log import WorkerLogEntry
+from backend.services.firestore_service import FirestoreService
+from backend.services.storage_service import StorageService
+logger = logging.getLogger(__name__)
+class JobManager:
+    """Manager for job lifecycle and state."""
+    def __init__(self):
+        """Initialize job manager with required services."""
+        self.firestore = FirestoreService()
+        self.storage = StorageService()
+    def create_job(self, job_create: JobCreate) -> Job:
+        """
+        Create a new job with initial state PENDING.
+        Jobs start in PENDING state and transition to DOWNLOADING
+        when a worker picks them up.
+        """
+        job_id = str(uuid.uuid4())[:8]
+        now = datetime.utcnow()
+        job = Job(
+            job_id=job_id,
+            status=JobStatus.PENDING,  # New state machine starts with PENDING
+            progress=0,
+            created_at=now,
+            updated_at=now,
+            url=str(job_create.url) if job_create.url else None,
+            artist=job_create.artist,
+            title=job_create.title,
+            # User preferences
+            enable_cdg=job_create.enable_cdg,
+            enable_txt=job_create.enable_txt,
+            enable_youtube_upload=job_create.enable_youtube_upload,
+            youtube_description=job_create.youtube_description,
+            youtube_description_template=job_create.youtube_description_template,  # video_worker reads this
+            webhook_url=job_create.webhook_url,
+            user_email=job_create.user_email,
+            # Distribution settings
+            brand_prefix=job_create.brand_prefix,
+            discord_webhook_url=job_create.discord_webhook_url,
+            dropbox_path=job_create.dropbox_path,
+            gdrive_folder_id=job_create.gdrive_folder_id,
+            # Theme configuration
+            theme_id=job_create.theme_id,
+            color_overrides=job_create.color_overrides,
+            style_params_gcs_path=job_create.style_params_gcs_path,
+            style_assets=job_create.style_assets,
+            # Two-phase workflow (Batch 6)
+            prep_only=job_create.prep_only,
+            finalise_only=job_create.finalise_only,
+            keep_brand_code=job_create.keep_brand_code,
+            # Request metadata (for tracking and filtering)
+            request_metadata=job_create.request_metadata,
+        )
+        self.firestore.create_job(job)
+        logger.info(f"Created new job {job_id} with status PENDING")
+        return job
+    def get_job(self, job_id: str) -> Optional[Job]:
+        """Get a job by ID."""
+        return self.firestore.get_job(job_id)
+    def update_job_status(
+        self,
+        job_id: str,
+        status: JobStatus,
+        progress: Optional[int] = None,
+        message: Optional[str] = None,
+        **kwargs
+    ) -> None:
+        """Update job status with timeline tracking."""
+        self.firestore.update_job_status(
+            job_id=job_id,
+            status=status,
+            progress=progress,
+            message=message,
+            **kwargs
+        )
+    def update_job(self, job_id: str, updates: Dict[str, Any]) -> None:
+        """Update job with arbitrary fields."""
+        self.firestore.update_job(job_id, updates)
+    def list_jobs(
+        self,
+        status: Optional[JobStatus] = None,
+        environment: Optional[str] = None,
+        client_id: Optional[str] = None,
+        created_after: Optional[datetime] = None,
+        created_before: Optional[datetime] = None,
+        user_email: Optional[str] = None,
+        limit: int = 100
+    ) -> List[Job]:
+        """
+        List jobs with optional filtering.
+        Args:
+            status: Filter by job status
+            environment: Filter by request_metadata.environment (test/production/development)
+            client_id: Filter by request_metadata.client_id (customer identifier)
+            created_after: Filter jobs created after this datetime
+            created_before: Filter jobs created before this datetime
+            user_email: Filter by user_email (job owner)
+            limit: Maximum number of jobs to return
+        Returns:
+            List of Job objects matching filters
+        """
+        return self.firestore.list_jobs(
+            status=status,
+            environment=environment,
+            client_id=client_id,
+            created_after=created_after,
+            created_before=created_before,
+            user_email=user_email,
+            limit=limit
+        )
+    def delete_jobs_by_filter(
+        self,
+        environment: Optional[str] = None,
+        client_id: Optional[str] = None,
+        status: Optional[JobStatus] = None,
+        created_before: Optional[datetime] = None,
+        delete_files: bool = True
+    ) -> Dict[str, Any]:
+        """
+        Delete multiple jobs matching filter criteria.
+        CAUTION: This is a destructive operation. Use carefully.
+        Args:
+            environment: Delete jobs with this environment (e.g., "test")
+            client_id: Delete jobs from this client
+            status: Delete jobs with this status
+            created_before: Delete jobs created before this datetime
+            delete_files: Also delete GCS files (default True)
+        Returns:
+            Dict with deletion statistics
+        """
+        # First get matching jobs to delete their files
+        if delete_files:
+            jobs = self.firestore.list_jobs(
+                status=status,
+                environment=environment,
+                client_id=client_id,
+                created_before=created_before,
+                limit=10000  # High limit for deletion
+            )
+            files_deleted = 0
+            for job in jobs:
+                # Delete files from various locations
+                try:
+                    # Delete uploads folder
+                    self.storage.delete_folder(f"uploads/{job.job_id}/")
+                    # Delete jobs folder
+                    self.storage.delete_folder(f"jobs/{job.job_id}/")
+                    files_deleted += 1
+                except Exception as e:
+                    logger.warning(f"Error deleting files for job {job.job_id}: {e}")
+        # Delete the jobs from Firestore
+        deleted_count = self.firestore.delete_jobs_by_filter(
+            environment=environment,
+            client_id=client_id,
+            status=status,
+            created_before=created_before
+        )
+        return {
+            'jobs_deleted': deleted_count,
+            'files_deleted': files_deleted if delete_files else 0
+        }
+    def mark_job_error(self, job_id: str, error_message: str) -> None:
+        """Mark a job as errored."""
+        self.firestore.update_job_status(
+            job_id=job_id,
+            status=JobStatus.ERROR,
+            progress=0,
+            message=error_message,
+            error_message=error_message
+        )
+        logger.error(f"Job {job_id} marked as error: {error_message}")
+    def get_output_urls(self, job_id: str) -> Dict[str, str]:
+        """Generate signed URLs for job output files."""
+        job = self.get_job(job_id)
+        if not job or not job.output_files:
+            return {}
+        urls = {}
+        for file_type, gcs_path in job.output_files.items():
+            try:
+                urls[file_type] = self.storage.generate_signed_url(gcs_path, expiration_minutes=120)
+            except Exception as e:
+                logger.error(f"Error generating URL for {file_type}: {e}")
+        return urls
+    def delete_job(self, job_id: str, delete_files: bool = True) -> None:
+        """Delete a job, its files, and its logs subcollection."""
+        if delete_files:
+            job = self.get_job(job_id)
+            if job and job.output_files:
+                for gcs_path in job.output_files.values():
+                    try:
+                        self.storage.delete_file(gcs_path)
+                    except Exception as e:
+                        logger.error(f"Error deleting file {gcs_path}: {e}")
+        # Delete logs subcollection first (must be done before deleting parent doc)
+        try:
+            deleted_logs = self.firestore.delete_logs_subcollection(job_id)
+            if deleted_logs > 0:
+                logger.info(f"Deleted {deleted_logs} log entries for job {job_id}")
+        except Exception as e:
+            logger.warning(f"Error deleting logs subcollection for job {job_id}: {e}")
+        self.firestore.delete_job(job_id)
+        logger.info(f"Deleted job {job_id}")
+    def validate_state_transition(self, job_id: str, new_status: JobStatus) -> bool:
+        """
+        Validate that a state transition is legal.
+        Returns:
+            True if transition is valid, False otherwise
+        """
+        job = self.get_job(job_id)
+        if not job:
+            logger.error(f"Job {job_id} not found")
+            return False
+        current_status = job.status
+        valid_transitions = STATE_TRANSITIONS.get(current_status, [])
+        if new_status not in valid_transitions:
+            logger.error(
+                f"Invalid state transition for job {job_id}: "
+                f"{current_status} -> {new_status}. "
+                f"Valid transitions: {valid_transitions}"
+            )
+            return False
+        return True
+    def transition_to_state(
+        self,
+        job_id: str,
+        new_status: JobStatus,
+        progress: Optional[int] = None,
+        message: Optional[str] = None,
+        state_data_updates: Optional[Dict[str, Any]] = None
+    ) -> bool:
+        """
+        Transition job to new state with validation.
+        Args:
+            job_id: Job ID
+            new_status: Target state
+            progress: Progress percentage (0-100)
+            message: Timeline message
+            state_data_updates: Updates to state_data field
+        Returns:
+            True if transition succeeded, False otherwise
+        """
+        if not self.validate_state_transition(job_id, new_status):
+            return False
+        updates = {
+            'status': new_status,
+            'updated_at': datetime.utcnow()
+        }
+        if progress is not None:
+            updates['progress'] = progress
+        # Generate review token when entering AWAITING_REVIEW state
+        if new_status == JobStatus.AWAITING_REVIEW:
+            from backend.api.dependencies import generate_review_token, get_review_token_expiry
+            review_token = generate_review_token()
+            review_token_expires = get_review_token_expiry(hours=48)  # 48 hour expiry
+            updates['review_token'] = review_token
+            updates['review_token_expires_at'] = review_token_expires
+            logger.info(f"Generated review token for job {job_id}, expires in 48 hours")
+        # Generate instrumental token when entering AWAITING_INSTRUMENTAL_SELECTION state
+        if new_status == JobStatus.AWAITING_INSTRUMENTAL_SELECTION:
+            from backend.api.dependencies import generate_review_token, get_review_token_expiry
+            instrumental_token = generate_review_token()  # Reuse same token generator
+            instrumental_token_expires = get_review_token_expiry(hours=48)  # 48 hour expiry
+            updates['instrumental_token'] = instrumental_token
+            updates['instrumental_token_expires_at'] = instrumental_token_expires
+            logger.info(f"Generated instrumental token for job {job_id}, expires in 48 hours")
+        # If we have state_data_updates, merge them with existing state_data
+        merged_state_data = None
+        if state_data_updates:
+            job = self.get_job(job_id)
+            if job:
+                merged_state_data = {**job.state_data, **state_data_updates}
+        # Update job status (includes timeline event), passing state_data if present
+        if merged_state_data is not None:
+            self.update_job_status(
+                job_id=job_id,
+                status=new_status,
+                progress=progress,
+                message=message,
+                state_data=merged_state_data
+            )
+        else:
+            self.update_job_status(
+                job_id=job_id,
+                status=new_status,
+                progress=progress,
+                message=message
+            )
+        # Apply review token update separately if generated
+        if new_status == JobStatus.AWAITING_REVIEW and 'review_token' in updates:
+            self.firestore.update_job(job_id, {
+                'review_token': updates['review_token'],
+                'review_token_expires_at': updates['review_token_expires_at']
+            })
+        # Apply instrumental token update separately if generated
+        if new_status == JobStatus.AWAITING_INSTRUMENTAL_SELECTION and 'instrumental_token' in updates:
+            self.firestore.update_job(job_id, {
+                'instrumental_token': updates['instrumental_token'],
+                'instrumental_token_expires_at': updates['instrumental_token_expires_at']
+            })
+        logger.info(f"Job {job_id} transitioned to {new_status}")
+        # Trigger notifications asynchronously (fire-and-forget)
+        self._trigger_state_notifications(job_id, new_status)
+        return True
+    def _trigger_state_notifications(self, job_id: str, new_status: JobStatus) -> None:
+        """
+        Trigger email notifications based on state transitions.
+        This is fire-and-forget - notification failures don't affect job processing.
+        Args:
+            job_id: Job ID
+            new_status: New job status
+        """
+        import asyncio
+        try:
+            # Get the job to access user info
+            job = self.get_job(job_id)
+            if not job or not job.user_email:
+                logger.debug(f"No user email for job {job_id}, skipping notifications")
+                return
+            # Job completion notification
+            if new_status == JobStatus.COMPLETE:
+                self._schedule_completion_email(job)
+            # Idle reminder scheduling for blocking states
+            elif new_status in [JobStatus.AWAITING_REVIEW, JobStatus.AWAITING_INSTRUMENTAL_SELECTION]:
+                self._schedule_idle_reminder(job, new_status)
+        except Exception as e:
+            # Never let notification failures affect job processing
+            logger.error(f"Error triggering notifications for job {job_id}: {e}")
+    def _schedule_completion_email(self, job: Job) -> None:
+        """
+        Schedule sending a job completion email.
+        Uses asyncio to fire-and-forget the email sending.
+        """
+        import asyncio
+        import threading
+        try:
+            from backend.services.job_notification_service import get_job_notification_service
+            notification_service = get_job_notification_service()
+            # Get youtube, dropbox URLs, and brand_code from state_data (may be None)
+            state_data = job.state_data or {}
+            youtube_url = state_data.get('youtube_url')
+            dropbox_url = state_data.get('dropbox_link')
+            brand_code = state_data.get('brand_code')
+            # Create async task (fire-and-forget)
+            async def send_email():
+                await notification_service.send_job_completion_email(
+                    job_id=job.job_id,
+                    user_email=job.user_email,
+                    user_name=None,  # Could fetch from user service if needed
+                    artist=job.artist,
+                    title=job.title,
+                    youtube_url=youtube_url,
+                    dropbox_url=dropbox_url,
+                    brand_code=brand_code,
+                )
+            # Try to get existing event loop, create new one if none exists
+            try:
+                loop = asyncio.get_running_loop()
+                # If we're in an async context, create a task
+                loop.create_task(send_email())
+            except RuntimeError:
+                # No event loop - we're likely in a sync context
+                # Use daemon thread to avoid blocking job completion
+                def run_in_thread():
+                    asyncio.run(send_email())
+                thread = threading.Thread(target=run_in_thread, daemon=True)
+                thread.start()
+            logger.info(f"Scheduled completion email for job {job.job_id}")
+        except Exception as e:
+            logger.error(f"Failed to schedule completion email for job {job.job_id}: {e}")
+    def _schedule_idle_reminder(self, job: Job, new_status: JobStatus) -> None:
+        """
+        Schedule an idle reminder for a blocking state.
+        Records the timestamp when the blocking state was entered and
+        schedules a Cloud Tasks task for 5 minutes later.
+        """
+        import asyncio
+        import threading
+        try:
+            # Record when we entered blocking state (for idle detection)
+            blocking_entered_at = datetime.utcnow().isoformat()
+            action_type = "lyrics" if new_status == JobStatus.AWAITING_REVIEW else "instrumental"
+            # Update state_data with blocking state info (handle None state_data)
+            existing_state_data = job.state_data or {}
+            state_data_update = {
+                'blocking_state_entered_at': blocking_entered_at,
+                'blocking_action_type': action_type,
+                'reminder_sent': False,  # Will be set to True after reminder is sent
+            }
+            self.firestore.update_job(job.job_id, {
+                'state_data': {**existing_state_data, **state_data_update}
+            })
+            # Schedule the idle reminder check via worker service (5 min delay)
+            from backend.services.worker_service import get_worker_service
+            async def schedule_reminder():
+                worker_service = get_worker_service()
+                await worker_service.schedule_idle_reminder(job.job_id)
+            # Try to get existing event loop, create new one if none exists
+            try:
+                loop = asyncio.get_running_loop()
+                loop.create_task(schedule_reminder())
+            except RuntimeError:
+                # No event loop - we're in a sync context
+                # Use daemon thread to avoid blocking job processing
+                def run_in_thread():
+                    asyncio.run(schedule_reminder())
+                thread = threading.Thread(target=run_in_thread, daemon=True)
+                thread.start()
+            logger.info(f"Scheduled idle reminder for job {job.job_id} ({action_type})")
+        except Exception as e:
+            logger.error(f"Failed to schedule idle reminder for job {job.job_id}: {e}")
+    def update_state_data(self, job_id: str, key: str, value: Any) -> None:
+        """
+        Update a specific key in the job's state_data field.
+        This is used by workers to store stage-specific metadata.
+        """
+        job = self.get_job(job_id)
+        if not job:
+            logger.error(f"Job {job_id} not found")
+            return
+        state_data = job.state_data.copy()
+        state_data[key] = value
+        self.update_job(job_id, {'state_data': state_data})
+        logger.debug(f"Job {job_id} state_data updated: {key} = {value}")
+    def fail_job(self, job_id: str, error_message: str, error_details: Optional[Dict[str, Any]] = None) -> bool:
+        """
+        Mark a job as failed with error information.
+        Args:
+            job_id: Job ID
+            error_message: Human-readable error message
+            error_details: Optional structured error details
+        Returns:
+            True if successful
+        """
+        try:
+            # Update error fields
+            self.update_job(job_id, {
+                'error_message': error_message,
+                'error_details': error_details or {}
+            })
+            # Use update_job_status which handles timeline
+            self.update_job_status(
+                job_id=job_id,
+                status=JobStatus.FAILED,
+                message=error_message
+            )
+            logger.error(f"Job {job_id} failed: {error_message}")
+            return True
+        except Exception as e:
+            logger.error(f"Error marking job {job_id} as failed: {e}")
+            return False
+    def update_file_url(self, job_id: str, category: str, file_type: str, url: str) -> None:
+        """
+        Update a file URL in the job's file_urls structure.
+        Args:
+            job_id: Job ID
+            category: Category (e.g., "stems", "lyrics", "finals")
+            file_type: File type within category (e.g., "clean", "lrc", "lossless_4k_mp4")
+            url: GCS URL
+        """
+        job = self.get_job(job_id)
+        if not job:
+            logger.error(f"Job {job_id} not found")
+            return
+        file_urls = job.file_urls.copy()
+        if category not in file_urls:
+            file_urls[category] = {}
+        file_urls[category][file_type] = url
+        self.update_job(job_id, {'file_urls': file_urls})
+        logger.debug(f"Job {job_id} file URL updated: {category}.{file_type}")
+    def check_parallel_processing_complete(self, job_id: str) -> bool:
+        """
+        Check if both parallel tracks (audio + lyrics) are complete.
+        This is called after audio_complete or lyrics_complete to determine
+        if we can proceed to screen generation.
+        Returns:
+            True if both tracks complete, False otherwise
+        """
+        job = self.get_job(job_id)
+        if not job:
+            return False
+        audio_complete = job.state_data.get('audio_complete', False)
+        lyrics_complete = job.state_data.get('lyrics_complete', False)
+        return audio_complete and lyrics_complete
+    def mark_audio_complete(self, job_id: str) -> None:
+        """
+        Mark audio processing as complete and check if can proceed.
+        If lyrics are also complete, automatically triggers screens worker.
+        """
+        self.update_state_data(job_id, 'audio_complete', True)
+        if self.check_parallel_processing_complete(job_id):
+            logger.info(f"Job {job_id}: Both audio and lyrics complete, triggering screens worker")
+            # Transition happens in screens worker
+            # We just trigger it here
+            self._trigger_screens_worker(job_id)
+    def mark_lyrics_complete(self, job_id: str) -> None:
+        """
+        Mark lyrics processing as complete and check if can proceed.
+        If audio is also complete, automatically triggers screens worker.
+        """
+        self.update_state_data(job_id, 'lyrics_complete', True)
+        if self.check_parallel_processing_complete(job_id):
+            logger.info(f"Job {job_id}: Both audio and lyrics complete, triggering screens worker")
+            # Transition happens in screens worker
+            # We just trigger it here
+            self._trigger_screens_worker(job_id)
+    def _trigger_screens_worker(self, job_id: str) -> None:
+        """
+        Trigger screens generation worker.
+        Uses WorkerService to make HTTP call to internal API.
+        This must be async, so we use asyncio to create a task.
+        """
+        import asyncio
+        from backend.services.worker_service import get_worker_service
+        logger.info(f"Job {job_id}: Triggering screens worker")
+        # Create async task to trigger worker
+        # This allows us to call async code from sync context
+        async def _trigger():
+            worker_service = get_worker_service()
+            await worker_service.trigger_screens_worker(job_id)
+        # Create task in event loop
+        try:
+            loop = asyncio.get_event_loop()
+            if loop.is_running():
+                # If loop is already running, create task
+                asyncio.create_task(_trigger())
+            else:
+                # If no loop, run directly
+                asyncio.run(_trigger())
+        except RuntimeError:
+            # Fallback: just log
+            logger.warning(f"Job {job_id}: Could not trigger screens worker (no event loop)")
+            # TODO: In production, use message queue instead
+    def cancel_job(self, job_id: str, reason: Optional[str] = None) -> bool:
+        """
+        Cancel a job.
+        Only jobs in non-terminal states can be cancelled.
+        """
+        job = self.get_job(job_id)
+        if not job:
+            return False
+        terminal_states = [JobStatus.COMPLETE, JobStatus.FAILED, JobStatus.CANCELLED]
+        if job.status in terminal_states:
+            logger.warning(f"Cannot cancel job {job_id} in terminal state {job.status}")
+            return False
+        message = f"Job cancelled{f': {reason}' if reason else ''}"
+        self.update_job_status(
+            job_id=job_id,
+            status=JobStatus.CANCELLED,
+            message=message
+        )
+        logger.info(f"Job {job_id} cancelled")
+        return True
+    def mark_job_failed(
+        self,
+        job_id: str,
+        error_message: str,
+        error_details: Optional[Dict[str, Any]] = None
+    ) -> None:
+        """
+        Mark a job as failed with error details.
+        This replaces mark_job_error() with better error tracking.
+        """
+        updates = {
+            'error_message': error_message
+        }
+        if error_details:
+            updates['error_details'] = error_details
+        self.firestore.update_job_status(
+            job_id=job_id,
+            status=JobStatus.FAILED,
+            progress=0,
+            message=f"Failed: {error_message}",
+            **updates
+        )
+        logger.error(f"Job {job_id} failed: {error_message}")
+    def increment_retry_count(self, job_id: str) -> int:
+        """
+        Increment retry count for a job.
+        Returns:
+            New retry count
+        """
+        job = self.get_job(job_id)
+        if not job:
+            return 0
+        new_count = job.retry_count + 1
+        self.update_job(job_id, {'retry_count': new_count})
+        return new_count
+    def append_worker_log(
+        self,
+        job_id: str,
+        worker: str,
+        level: str,
+        message: str,
+        max_logs: int = 500,
+        metadata: Optional[Dict[str, Any]] = None
+    ) -> None:
+        """
+        Append a log entry to the job's logs.
+        By default (USE_LOG_SUBCOLLECTION=true), logs are stored in a Firestore
+        subcollection (jobs/{job_id}/logs) to avoid the 1MB document size limit.
+        For backward compatibility (USE_LOG_SUBCOLLECTION=false), logs are stored
+        in the embedded worker_logs array using atomic ArrayUnion.
+        Args:
+            job_id: Job ID
+            worker: Worker name (audio, lyrics, screens, video, render, distribution)
+            level: Log level (DEBUG, INFO, WARNING, ERROR)
+            message: Log message
+            max_logs: Not used (kept for API compatibility)
+            metadata: Optional additional metadata dict
+        """
+        if settings.use_log_subcollection:
+            # New subcollection approach - avoids 1MB limit
+            log_entry = WorkerLogEntry.create(
+                job_id=job_id,
+                worker=worker,
+                level=level,
+                message=message,
+                metadata=metadata
+            )
+            self.firestore.append_log_to_subcollection(job_id, log_entry)
+        else:
+            # Legacy embedded array approach
+            log_entry = {
+                'timestamp': datetime.utcnow().isoformat() + 'Z',
+                'level': level,
+                'worker': worker,
+                'message': message[:1000]  # Truncate long messages
+            }
+            self.firestore.append_worker_log(job_id, log_entry)
+    def get_worker_logs(
+        self,
+        job_id: str,
+        since_index: int = 0,
+        worker: Optional[str] = None
+    ) -> List[Dict[str, Any]]:
+        """
+        Get worker logs for a job, optionally filtered by worker and index.
+        By default (USE_LOG_SUBCOLLECTION=true), logs are read from the
+        subcollection. Falls back to embedded array for older jobs.
+        Args:
+            job_id: Job ID
+            since_index: Return only logs after this index (for pagination)
+            worker: Filter by worker name (optional)
+        Returns:
+            List of log entries as dicts (in legacy format for API compatibility)
+        """
+        if settings.use_log_subcollection:
+            # Try subcollection first
+            subcollection_logs = self.firestore.get_logs_from_subcollection(
+                job_id=job_id,
+                offset=since_index,
+                worker=worker,
+                limit=500
+            )
+            if subcollection_logs:
+                # Convert to legacy format for API compatibility
+                return [log.to_legacy_dict() for log in subcollection_logs]
+            # Fall through to check embedded array for older jobs
+        # Embedded array approach (legacy jobs or fallback)
+        job = self.get_job(job_id)
+        if not job or not job.worker_logs:
+            return []
+        logs = [log.dict() if hasattr(log, 'dict') else log for log in job.worker_logs]
+        # Filter by index
+        if since_index > 0:
+            logs = logs[since_index:]
+        # Filter by worker
+        if worker:
+            logs = [log for log in logs if log.get('worker') == worker]
+        return logs
+    def get_worker_logs_count(self, job_id: str) -> int:
+        """
+        Get the total count of worker logs for a job.
+        Args:
+            job_id: Job ID
+        Returns:
+            Total count of logs
+        """
+        if settings.use_log_subcollection:
+            # Try subcollection first
+            count = self.firestore.get_logs_count_from_subcollection(job_id)
+            if count > 0:
+                return count
+            # Fall through to check embedded array
+        # Embedded array (legacy jobs or fallback)
+        job = self.get_job(job_id)
+        if not job or not job.worker_logs:
+            return 0
+        return len(job.worker_logs)

karaoke-gen 0.86.7__py3-none-any.whl → 0.96.0__py3-none-any.whl

karaoke-gen 0.86.7py3-none-any.whl → 0.96.0py3-none-any.whl