PyPI - karaoke-gen - Versions diffs - 0.90.1__py3-none-any.whl → 0.99.3__py3-none-any.whl - Mend

karaoke-gen 0.90.1py3-none-any.whl → 0.99.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (197) hide show

backend/.coveragerc +20 -0
backend/.gitignore +37 -0
backend/Dockerfile +43 -0
backend/Dockerfile.base +74 -0
backend/README.md +242 -0
backend/__init__.py +0 -0
backend/api/__init__.py +0 -0
backend/api/dependencies.py +457 -0
backend/api/routes/__init__.py +0 -0
backend/api/routes/admin.py +835 -0
backend/api/routes/audio_search.py +913 -0
backend/api/routes/auth.py +348 -0
backend/api/routes/file_upload.py +2112 -0
backend/api/routes/health.py +409 -0
backend/api/routes/internal.py +435 -0
backend/api/routes/jobs.py +1629 -0
backend/api/routes/review.py +652 -0
backend/api/routes/themes.py +162 -0
backend/api/routes/users.py +1513 -0
backend/config.py +172 -0
backend/main.py +157 -0
backend/middleware/__init__.py +5 -0
backend/middleware/audit_logging.py +124 -0
backend/models/__init__.py +0 -0
backend/models/job.py +519 -0
backend/models/requests.py +123 -0
backend/models/theme.py +153 -0
backend/models/user.py +254 -0
backend/models/worker_log.py +164 -0
backend/pyproject.toml +29 -0
backend/quick-check.sh +93 -0
backend/requirements.txt +29 -0
backend/run_tests.sh +60 -0
backend/services/__init__.py +0 -0
backend/services/audio_analysis_service.py +243 -0
backend/services/audio_editing_service.py +278 -0
backend/services/audio_search_service.py +702 -0
backend/services/auth_service.py +630 -0
backend/services/credential_manager.py +792 -0
backend/services/discord_service.py +172 -0
backend/services/dropbox_service.py +301 -0
backend/services/email_service.py +1093 -0
backend/services/encoding_interface.py +454 -0
backend/services/encoding_service.py +502 -0
backend/services/firestore_service.py +512 -0
backend/services/flacfetch_client.py +573 -0
backend/services/gce_encoding/README.md +72 -0
backend/services/gce_encoding/__init__.py +22 -0
backend/services/gce_encoding/main.py +589 -0
backend/services/gce_encoding/requirements.txt +16 -0
backend/services/gdrive_service.py +356 -0
backend/services/job_logging.py +258 -0
backend/services/job_manager.py +853 -0
backend/services/job_notification_service.py +271 -0
backend/services/langfuse_preloader.py +98 -0
backend/services/local_encoding_service.py +590 -0
backend/services/local_preview_encoding_service.py +407 -0
backend/services/lyrics_cache_service.py +216 -0
backend/services/metrics.py +413 -0
backend/services/nltk_preloader.py +122 -0
backend/services/packaging_service.py +287 -0
backend/services/rclone_service.py +106 -0
backend/services/spacy_preloader.py +65 -0
backend/services/storage_service.py +209 -0
backend/services/stripe_service.py +371 -0
backend/services/structured_logging.py +254 -0
backend/services/template_service.py +330 -0
backend/services/theme_service.py +469 -0
backend/services/tracing.py +543 -0
backend/services/user_service.py +721 -0
backend/services/worker_service.py +558 -0
backend/services/youtube_service.py +112 -0
backend/services/youtube_upload_service.py +445 -0
backend/tests/__init__.py +4 -0
backend/tests/conftest.py +224 -0
backend/tests/emulator/__init__.py +7 -0
backend/tests/emulator/conftest.py +109 -0
backend/tests/emulator/test_e2e_cli_backend.py +1053 -0
backend/tests/emulator/test_emulator_integration.py +356 -0
backend/tests/emulator/test_style_loading_direct.py +436 -0
backend/tests/emulator/test_worker_logs_direct.py +229 -0
backend/tests/emulator/test_worker_logs_subcollection.py +443 -0
backend/tests/requirements-test.txt +10 -0
backend/tests/requirements.txt +6 -0
backend/tests/test_admin_email_endpoints.py +411 -0
backend/tests/test_api_integration.py +460 -0
backend/tests/test_api_routes.py +93 -0
backend/tests/test_audio_analysis_service.py +294 -0
backend/tests/test_audio_editing_service.py +386 -0
backend/tests/test_audio_search.py +1398 -0
backend/tests/test_audio_services.py +378 -0
backend/tests/test_auth_firestore.py +231 -0
backend/tests/test_config_extended.py +68 -0
backend/tests/test_credential_manager.py +377 -0
backend/tests/test_dependencies.py +54 -0
backend/tests/test_discord_service.py +244 -0
backend/tests/test_distribution_services.py +820 -0
backend/tests/test_dropbox_service.py +472 -0
backend/tests/test_email_service.py +492 -0
backend/tests/test_emulator_integration.py +322 -0
backend/tests/test_encoding_interface.py +412 -0
backend/tests/test_file_upload.py +1739 -0
backend/tests/test_flacfetch_client.py +632 -0
backend/tests/test_gdrive_service.py +524 -0
backend/tests/test_instrumental_api.py +431 -0
backend/tests/test_internal_api.py +343 -0
backend/tests/test_job_creation_regression.py +583 -0
backend/tests/test_job_manager.py +356 -0
backend/tests/test_job_manager_notifications.py +329 -0
backend/tests/test_job_notification_service.py +443 -0
backend/tests/test_jobs_api.py +283 -0
backend/tests/test_local_encoding_service.py +423 -0
backend/tests/test_local_preview_encoding_service.py +567 -0
backend/tests/test_main.py +87 -0
backend/tests/test_models.py +918 -0
backend/tests/test_packaging_service.py +382 -0
backend/tests/test_requests.py +201 -0
backend/tests/test_routes_jobs.py +282 -0
backend/tests/test_routes_review.py +337 -0
backend/tests/test_services.py +556 -0
backend/tests/test_services_extended.py +112 -0
backend/tests/test_spacy_preloader.py +119 -0
backend/tests/test_storage_service.py +448 -0
backend/tests/test_style_upload.py +261 -0
backend/tests/test_template_service.py +295 -0
backend/tests/test_theme_service.py +516 -0
backend/tests/test_unicode_sanitization.py +522 -0
backend/tests/test_upload_api.py +256 -0
backend/tests/test_validate.py +156 -0
backend/tests/test_video_worker_orchestrator.py +847 -0
backend/tests/test_worker_log_subcollection.py +509 -0
backend/tests/test_worker_logging.py +365 -0
backend/tests/test_workers.py +1116 -0
backend/tests/test_workers_extended.py +178 -0
backend/tests/test_youtube_service.py +247 -0
backend/tests/test_youtube_upload_service.py +568 -0
backend/utils/test_data.py +27 -0
backend/validate.py +173 -0
backend/version.py +27 -0
backend/workers/README.md +597 -0
backend/workers/__init__.py +11 -0
backend/workers/audio_worker.py +618 -0
backend/workers/lyrics_worker.py +683 -0
backend/workers/render_video_worker.py +483 -0
backend/workers/screens_worker.py +535 -0
backend/workers/style_helper.py +198 -0
backend/workers/video_worker.py +1277 -0
backend/workers/video_worker_orchestrator.py +701 -0
backend/workers/worker_logging.py +278 -0
karaoke_gen/instrumental_review/static/index.html +7 -4
karaoke_gen/karaoke_finalise/karaoke_finalise.py +6 -1
karaoke_gen/utils/__init__.py +163 -8
karaoke_gen/video_background_processor.py +9 -4
{karaoke_gen-0.90.1.dist-info → karaoke_gen-0.99.3.dist-info}/METADATA +1 -1
{karaoke_gen-0.90.1.dist-info → karaoke_gen-0.99.3.dist-info}/RECORD +196 -46
lyrics_transcriber/correction/agentic/agent.py +17 -6
lyrics_transcriber/correction/agentic/providers/config.py +9 -5
lyrics_transcriber/correction/agentic/providers/langchain_bridge.py +96 -93
lyrics_transcriber/correction/agentic/providers/model_factory.py +27 -6
lyrics_transcriber/correction/anchor_sequence.py +151 -37
lyrics_transcriber/correction/corrector.py +192 -130
lyrics_transcriber/correction/handlers/syllables_match.py +44 -2
lyrics_transcriber/correction/operations.py +24 -9
lyrics_transcriber/correction/phrase_analyzer.py +18 -0
lyrics_transcriber/frontend/package-lock.json +2 -2
lyrics_transcriber/frontend/package.json +1 -1
lyrics_transcriber/frontend/src/components/AIFeedbackModal.tsx +1 -1
lyrics_transcriber/frontend/src/components/CorrectedWordWithActions.tsx +11 -7
lyrics_transcriber/frontend/src/components/EditActionBar.tsx +31 -5
lyrics_transcriber/frontend/src/components/EditModal.tsx +28 -10
lyrics_transcriber/frontend/src/components/EditTimelineSection.tsx +123 -27
lyrics_transcriber/frontend/src/components/EditWordList.tsx +112 -60
lyrics_transcriber/frontend/src/components/Header.tsx +90 -76
lyrics_transcriber/frontend/src/components/LyricsAnalyzer.tsx +53 -31
lyrics_transcriber/frontend/src/components/LyricsSynchronizer/SyncControls.tsx +44 -13
lyrics_transcriber/frontend/src/components/LyricsSynchronizer/TimelineCanvas.tsx +66 -50
lyrics_transcriber/frontend/src/components/LyricsSynchronizer/index.tsx +124 -30
lyrics_transcriber/frontend/src/components/ReferenceView.tsx +1 -1
lyrics_transcriber/frontend/src/components/TimelineEditor.tsx +12 -5
lyrics_transcriber/frontend/src/components/TimingOffsetModal.tsx +3 -3
lyrics_transcriber/frontend/src/components/TranscriptionView.tsx +1 -1
lyrics_transcriber/frontend/src/components/WordDivider.tsx +11 -7
lyrics_transcriber/frontend/src/components/shared/components/Word.tsx +4 -2
lyrics_transcriber/frontend/src/hooks/useManualSync.ts +103 -1
lyrics_transcriber/frontend/src/theme.ts +42 -15
lyrics_transcriber/frontend/tsconfig.tsbuildinfo +1 -1
lyrics_transcriber/frontend/vite.config.js +5 -0
lyrics_transcriber/frontend/web_assets/assets/{index-BECn1o8Q.js → index-BSMgOq4Z.js} +6959 -5782
lyrics_transcriber/frontend/web_assets/assets/index-BSMgOq4Z.js.map +1 -0
lyrics_transcriber/frontend/web_assets/index.html +6 -2
lyrics_transcriber/frontend/web_assets/nomad-karaoke-logo.svg +5 -0
lyrics_transcriber/output/generator.py +17 -3
lyrics_transcriber/output/video.py +60 -95
lyrics_transcriber/frontend/web_assets/assets/index-BECn1o8Q.js.map +0 -1
{karaoke_gen-0.90.1.dist-info → karaoke_gen-0.99.3.dist-info}/WHEEL +0 -0
{karaoke_gen-0.90.1.dist-info → karaoke_gen-0.99.3.dist-info}/entry_points.txt +0 -0
{karaoke_gen-0.90.1.dist-info → karaoke_gen-0.99.3.dist-info}/licenses/LICENSE +0 -0

backend/api/routes/admin.py ADDED Viewed

@@ -0,0 +1,835 @@
+"""
+Admin API routes for dashboard statistics and management.
+Handles:
+- Dashboard overview statistics
+- System-wide metrics
+- Admin-only operations
+- Audio search cache management
+"""
+import logging
+from datetime import datetime, timedelta
+from typing import Tuple, List, Optional, Any, Dict
+from fastapi import APIRouter, Depends, HTTPException
+from pydantic import BaseModel
+from backend.api.dependencies import require_admin
+from backend.services.auth_service import UserType
+from backend.services.user_service import get_user_service, UserService, USERS_COLLECTION
+from backend.services.job_manager import JobManager
+from backend.services.flacfetch_client import get_flacfetch_client, FlacfetchServiceError
+from backend.models.job import JobStatus
+from backend.utils.test_data import is_test_email
+from karaoke_gen.utils import sanitize_filename
+logger = logging.getLogger(__name__)
+router = APIRouter(prefix="/admin", tags=["admin"])
+# =============================================================================
+# Response Models
+# =============================================================================
+class JobsByStatusResponse(BaseModel):
+    """Breakdown of jobs by status."""
+    pending: int = 0
+    processing: int = 0
+    awaiting_review: int = 0
+    awaiting_instrumental: int = 0
+    complete: int = 0
+    failed: int = 0
+    cancelled: int = 0
+class AdminStatsOverview(BaseModel):
+    """Overview statistics for admin dashboard."""
+    total_users: int
+    active_users_7d: int
+    active_users_30d: int
+    total_jobs: int
+    jobs_last_7d: int
+    jobs_last_30d: int
+    jobs_by_status: JobsByStatusResponse
+    total_credits_issued_30d: int
+    total_beta_testers: int
+# =============================================================================
+# Admin Stats Endpoints
+# =============================================================================
+@router.get("/stats/overview", response_model=AdminStatsOverview)
+async def get_admin_stats_overview(
+    exclude_test: bool = True,
+    auth_data: Tuple[str, UserType, int] = Depends(require_admin),
+    user_service: UserService = Depends(get_user_service),
+):
+    """
+    Get overview statistics for admin dashboard.
+    Args:
+        exclude_test: If True (default), exclude test data (users with @inbox.testmail.app emails
+                     and jobs created by test users) from all counts.
+    Includes:
+    - User counts (total, active in 7d, active in 30d)
+    - Job counts (total, by status, recent)
+    - Credit statistics
+    - Beta program stats
+    """
+    from google.cloud.firestore_v1 import FieldFilter
+    from google.cloud.firestore_v1 import aggregation
+    db = user_service.db
+    now = datetime.utcnow()
+    seven_days_ago = now - timedelta(days=7)
+    thirty_days_ago = now - timedelta(days=30)
+    users_collection = db.collection(USERS_COLLECTION)
+    jobs_collection = db.collection("jobs")
+    # Jobs by status category mapping
+    processing_statuses = [
+        "downloading", "downloading_audio", "searching_audio", "awaiting_audio_selection",
+        "separating_stage1", "separating_stage2", "transcribing", "correcting",
+        "generating_screens", "applying_padding", "rendering_video",
+        "instrumental_selected", "generating_video", "encoding", "packaging",
+        "uploading", "notifying"
+    ]
+    # Limits for streaming queries - these are safety limits to prevent memory issues
+    # If hit, stats may be incomplete so we log a warning
+    USERS_STREAM_LIMIT = 2000
+    JOBS_STREAM_LIMIT = 10000
+    if exclude_test:
+        # When excluding test data, we must stream and filter in Python
+        # because Firestore doesn't support "not ends with" queries
+        # Stream all users and filter
+        all_users = []
+        users_fetched = 0
+        for doc in users_collection.limit(USERS_STREAM_LIMIT).stream():
+            users_fetched += 1
+            user_data = doc.to_dict()
+            email = user_data.get("email", "")
+            if not is_test_email(email):
+                all_users.append(user_data)
+        if users_fetched >= USERS_STREAM_LIMIT:
+            logger.warning(f"Users stream hit limit ({USERS_STREAM_LIMIT}), stats may be incomplete")
+        # Calculate user stats from filtered list
+        total_users = len(all_users)
+        active_users_7d = sum(
+            1 for u in all_users
+            if u.get("last_login_at") and _normalize_datetime(u["last_login_at"]) >= seven_days_ago
+        )
+        active_users_30d = sum(
+            1 for u in all_users
+            if u.get("last_login_at") and _normalize_datetime(u["last_login_at"]) >= thirty_days_ago
+        )
+        total_beta_testers = sum(1 for u in all_users if u.get("is_beta_tester"))
+        # Calculate credits from filtered users
+        total_credits_issued_30d = 0
+        for user_data in all_users:
+            transactions = user_data.get("credit_transactions", [])
+            for txn in transactions:
+                txn_date = _normalize_datetime(txn.get("created_at"))
+                if txn_date and txn_date >= thirty_days_ago:
+                    amount = txn.get("amount", 0)
+                    if amount > 0:
+                        total_credits_issued_30d += amount
+        # Stream all jobs and filter by user_email
+        all_jobs = []
+        jobs_fetched = 0
+        for doc in jobs_collection.limit(JOBS_STREAM_LIMIT).stream():
+            jobs_fetched += 1
+            job_data = doc.to_dict()
+            user_email = job_data.get("user_email", "")
+            if not is_test_email(user_email):
+                all_jobs.append(job_data)
+        if jobs_fetched >= JOBS_STREAM_LIMIT:
+            logger.warning(f"Jobs stream hit limit ({JOBS_STREAM_LIMIT}), stats may be incomplete")
+        # Calculate job stats from filtered list
+        total_jobs = len(all_jobs)
+        jobs_last_7d = sum(
+            1 for j in all_jobs
+            if j.get("created_at") and _normalize_datetime(j["created_at"]) >= seven_days_ago
+        )
+        jobs_last_30d = sum(
+            1 for j in all_jobs
+            if j.get("created_at") and _normalize_datetime(j["created_at"]) >= thirty_days_ago
+        )
+        # Jobs by status
+        jobs_by_status = JobsByStatusResponse(
+            pending=sum(1 for j in all_jobs if j.get("status") == "pending"),
+            processing=sum(1 for j in all_jobs if j.get("status") in processing_statuses),
+            awaiting_review=sum(1 for j in all_jobs if j.get("status") in ["awaiting_review", "in_review"]),
+            awaiting_instrumental=sum(1 for j in all_jobs if j.get("status") == "awaiting_instrumental_selection"),
+            complete=sum(1 for j in all_jobs if j.get("status") in ["complete", "prep_complete"]),
+            failed=sum(1 for j in all_jobs if j.get("status") == "failed"),
+            cancelled=sum(1 for j in all_jobs if j.get("status") == "cancelled"),
+        )
+    else:
+        # When including test data, use efficient aggregation queries
+        def get_count(query) -> int:
+            try:
+                agg_query = aggregation.AggregationQuery(query)
+                agg_query.count(alias="count")
+                results = agg_query.get()
+                return results[0][0].value if results else 0
+            except Exception as e:
+                logger.warning(f"Aggregation query failed: {e}")
+                return 0
+        # User statistics
+        total_users = get_count(users_collection)
+        active_users_7d = get_count(
+            users_collection.where(filter=FieldFilter("last_login_at", ">=", seven_days_ago))
+        )
+        active_users_30d = get_count(
+            users_collection.where(filter=FieldFilter("last_login_at", ">=", thirty_days_ago))
+        )
+        total_beta_testers = get_count(
+            users_collection.where(filter=FieldFilter("is_beta_tester", "==", True))
+        )
+        # Job statistics
+        total_jobs = get_count(jobs_collection)
+        jobs_last_7d = get_count(
+            jobs_collection.where(filter=FieldFilter("created_at", ">=", seven_days_ago))
+        )
+        jobs_last_30d = get_count(
+            jobs_collection.where(filter=FieldFilter("created_at", ">=", thirty_days_ago))
+        )
+        # Jobs by status
+        jobs_by_status = JobsByStatusResponse(
+            pending=get_count(
+                jobs_collection.where(filter=FieldFilter("status", "==", "pending"))
+            ),
+            processing=sum(
+                get_count(jobs_collection.where(filter=FieldFilter("status", "==", status)))
+                for status in processing_statuses
+            ),
+            awaiting_review=get_count(
+                jobs_collection.where(filter=FieldFilter("status", "==", "awaiting_review"))
+            ) + get_count(
+                jobs_collection.where(filter=FieldFilter("status", "==", "in_review"))
+            ),
+            awaiting_instrumental=get_count(
+                jobs_collection.where(filter=FieldFilter("status", "==", "awaiting_instrumental_selection"))
+            ),
+            complete=get_count(
+                jobs_collection.where(filter=FieldFilter("status", "==", "complete"))
+            ) + get_count(
+                jobs_collection.where(filter=FieldFilter("status", "==", "prep_complete"))
+            ),
+            failed=get_count(
+                jobs_collection.where(filter=FieldFilter("status", "==", "failed"))
+            ),
+            cancelled=get_count(
+                jobs_collection.where(filter=FieldFilter("status", "==", "cancelled"))
+            ),
+        )
+        # Credit statistics - sum credits added in last 30 days
+        total_credits_issued_30d = 0
+        try:
+            users_fetched = 0
+            for user_doc in users_collection.limit(USERS_STREAM_LIMIT).stream():
+                users_fetched += 1
+                user_data = user_doc.to_dict()
+                transactions = user_data.get("credit_transactions", [])
+                for txn in transactions:
+                    txn_date = _normalize_datetime(txn.get("created_at"))
+                    if txn_date and txn_date >= thirty_days_ago:
+                        amount = txn.get("amount", 0)
+                        if amount > 0:
+                            total_credits_issued_30d += amount
+            if users_fetched >= USERS_STREAM_LIMIT:
+                logger.warning(f"Credit calculation hit user limit ({USERS_STREAM_LIMIT}), total may be incomplete")
+        except Exception as e:
+            logger.warning(f"Error calculating credits: {e}")
+    return AdminStatsOverview(
+        total_users=total_users,
+        active_users_7d=active_users_7d,
+        active_users_30d=active_users_30d,
+        total_jobs=total_jobs,
+        jobs_last_7d=jobs_last_7d,
+        jobs_last_30d=jobs_last_30d,
+        jobs_by_status=jobs_by_status,
+        total_credits_issued_30d=total_credits_issued_30d,
+        total_beta_testers=total_beta_testers,
+    )
+def _normalize_datetime(dt_value) -> Optional[datetime]:
+    """Normalize datetime values from Firestore (can be datetime or ISO string)."""
+    if dt_value is None:
+        return None
+    if isinstance(dt_value, datetime):
+        return dt_value.replace(tzinfo=None)
+    if isinstance(dt_value, str):
+        try:
+            parsed = datetime.fromisoformat(dt_value.replace("Z", "+00:00"))
+            return parsed.replace(tzinfo=None)
+        except Exception:
+            return None
+    return None
+# =============================================================================
+# Audio Search Management Models
+# =============================================================================
+class AudioSearchResultSummary(BaseModel):
+    """Summary of a single audio search result."""
+    index: int
+    provider: str
+    artist: str
+    title: str
+    is_lossless: bool
+    quality: Optional[str] = None
+    seeders: Optional[int] = None
+class AudioSearchJobSummary(BaseModel):
+    """Summary of a job with audio search results."""
+    job_id: str
+    status: str
+    user_email: Optional[str] = None
+    audio_search_artist: Optional[str] = None
+    audio_search_title: Optional[str] = None
+    created_at: Optional[datetime] = None
+    results_count: int
+    results_summary: List[AudioSearchResultSummary]
+    has_lossless: bool
+    providers: List[str]
+class AudioSearchListResponse(BaseModel):
+    """Response for listing audio search jobs."""
+    jobs: List[AudioSearchJobSummary]
+    total: int
+class ClearSearchCacheResponse(BaseModel):
+    """Response for clearing search cache."""
+    status: str
+    job_id: str
+    message: str
+    previous_status: str
+    new_status: str
+    results_cleared: int
+    flacfetch_cache_cleared: bool = False
+    flacfetch_error: Optional[str] = None
+class ClearAllCacheResponse(BaseModel):
+    """Response for clearing all flacfetch cache."""
+    status: str
+    message: str
+    deleted_count: int
+class CacheStatsResponse(BaseModel):
+    """Response for cache statistics."""
+    count: int
+    total_size_bytes: int
+    oldest_entry: Optional[str] = None
+    newest_entry: Optional[str] = None
+    configured: bool
+# =============================================================================
+# Audio Search Management Endpoints
+# =============================================================================
+@router.get("/audio-searches", response_model=AudioSearchListResponse)
+async def list_audio_searches(
+    limit: int = 50,
+    status_filter: Optional[str] = None,
+    exclude_test: bool = True,
+    auth_data: Tuple[str, UserType, int] = Depends(require_admin),
+    user_service: UserService = Depends(get_user_service),
+):
+    """
+    List jobs with audio search results.
+    Returns jobs that have cached audio search results, useful for:
+    - Monitoring search activity
+    - Identifying stale cached results
+    - Clearing cache for specific jobs
+    Args:
+        limit: Maximum number of jobs to return (default 50)
+        status_filter: Optional filter by job status (e.g., 'awaiting_audio_selection')
+        exclude_test: If True (default), exclude jobs from test users
+    """
+    from google.cloud.firestore_v1 import FieldFilter
+    db = user_service.db
+    jobs_collection = db.collection("jobs")
+    # Query jobs - we'll filter for those with audio_search_results in Python
+    # since Firestore can't query for existence of nested fields efficiently
+    query = jobs_collection.order_by("created_at", direction="DESCENDING").limit(500)
+    if status_filter:
+        query = jobs_collection.where(
+            filter=FieldFilter("status", "==", status_filter)
+        ).order_by("created_at", direction="DESCENDING").limit(500)
+    jobs_with_searches = []
+    for doc in query.stream():
+        data = doc.to_dict()
+        # Filter out test users if exclude_test is True
+        if exclude_test and is_test_email(data.get("user_email", "")):
+            continue
+        state_data = data.get("state_data", {})
+        audio_results = state_data.get("audio_search_results", [])
+        if not audio_results:
+            continue
+        # Compute has_lossless and providers from ALL results (not just first 10)
+        has_lossless = any(r.get("is_lossless", False) for r in audio_results)
+        providers = {r.get("provider", "Unknown") for r in audio_results}
+        # Build summary from first 10 results only
+        results_summary = []
+        for r in audio_results[:10]:
+            results_summary.append(AudioSearchResultSummary(
+                index=r.get("index", 0),
+                provider=r.get("provider", "Unknown"),
+                artist=r.get("artist", ""),
+                title=r.get("title", ""),
+                is_lossless=r.get("is_lossless", False),
+                quality=r.get("quality"),
+                seeders=r.get("seeders"),
+            ))
+        jobs_with_searches.append(AudioSearchJobSummary(
+            job_id=doc.id,
+            status=data.get("status", "unknown"),
+            user_email=data.get("user_email"),
+            audio_search_artist=data.get("audio_search_artist"),
+            audio_search_title=data.get("audio_search_title"),
+            created_at=data.get("created_at"),
+            results_count=len(audio_results),
+            results_summary=results_summary,
+            has_lossless=has_lossless,
+            providers=sorted(providers),
+        ))
+        if len(jobs_with_searches) >= limit:
+            break
+    return AudioSearchListResponse(
+        jobs=jobs_with_searches,
+        total=len(jobs_with_searches),
+    )
+@router.post("/audio-searches/{job_id}/clear-cache", response_model=ClearSearchCacheResponse)
+async def clear_audio_search_cache(
+    job_id: str,
+    auth_data: Tuple[str, UserType, int] = Depends(require_admin),
+    user_service: UserService = Depends(get_user_service),
+):
+    """
+    Clear the cached audio search results for a job.
+    This will:
+    1. Remove the cached search results from job.state_data
+    2. Reset the job status to 'pending' so a new search can be performed
+    3. Clear the flacfetch GCS cache for this artist/title (if available)
+    Use this when:
+    - Cached results are stale (e.g., flacfetch was updated)
+    - User wants to search again with different terms
+    - Results appear incomplete or incorrect
+    """
+    job_manager = JobManager()
+    job = job_manager.get_job(job_id)
+    if not job:
+        raise HTTPException(status_code=404, detail=f"Job {job_id} not found")
+    # Get current state
+    state_data = job.state_data or {}
+    audio_results = state_data.get("audio_search_results", [])
+    results_count = len(audio_results)
+    previous_status = job.status
+    if not audio_results:
+        raise HTTPException(
+            status_code=400,
+            detail=f"Job {job_id} has no cached audio search results"
+        )
+    # Validate job status - only allow cache clear for appropriate states
+    # Don't allow clearing cache for jobs that are actively processing or complete
+    forbidden_statuses = {
+        "downloading", "downloading_audio", "searching_audio",
+        "separating_stage1", "separating_stage2", "transcribing", "correcting",
+        "generating_screens", "applying_padding", "rendering_video",
+        "generating_video", "encoding", "packaging", "uploading",
+        "complete", "prep_complete",
+    }
+    if previous_status in forbidden_statuses:
+        raise HTTPException(
+            status_code=400,
+            detail=f"Cannot clear cache for job in '{previous_status}' state. "
+            f"Only jobs in pending, awaiting_audio_selection, failed, or cancelled states can have cache cleared."
+        )
+    # Clear the cache by removing the keys
+    db = user_service.db
+    job_ref = db.collection("jobs").document(job_id)
+    from google.cloud.firestore_v1 import DELETE_FIELD
+    # Update job: clear cache and reset status
+    job_ref.update({
+        "state_data.audio_search_results": DELETE_FIELD,
+        "state_data.audio_search_count": DELETE_FIELD,
+        "state_data.remote_search_id": DELETE_FIELD,
+        "status": "pending",
+        "progress": 0,
+        "message": "Audio search cache cleared by admin. Ready for new search.",
+        "updated_at": datetime.utcnow(),
+    })
+    # Also clear flacfetch's GCS cache if we have artist/title
+    flacfetch_cache_cleared = False
+    flacfetch_error = None
+    artist = job.audio_search_artist
+    title = job.audio_search_title
+    if artist and title:
+        flacfetch_client = get_flacfetch_client()
+        if flacfetch_client:
+            try:
+                flacfetch_cache_cleared = await flacfetch_client.clear_search_cache(artist, title)
+                logger.info(
+                    f"Cleared flacfetch cache for '{artist}' - '{title}': "
+                    f"{'deleted' if flacfetch_cache_cleared else 'no entry found'}"
+                )
+            except FlacfetchServiceError as e:
+                flacfetch_error = str(e)
+                logger.warning(f"Failed to clear flacfetch cache: {e}")
+        else:
+            flacfetch_error = "flacfetch client not configured"
+            logger.debug("Skipping flacfetch cache clear - client not configured")
+    else:
+        flacfetch_error = "missing artist or title"
+        logger.debug(f"Skipping flacfetch cache clear - missing artist ({artist}) or title ({title})")
+    logger.info(
+        f"Admin {auth_data[0]} cleared audio search cache for job {job_id}. "
+        f"Cleared {results_count} results. Status changed from {previous_status} to pending. "
+        f"Flacfetch cache cleared: {flacfetch_cache_cleared}"
+    )
+    message = f"Cleared {results_count} cached search results. Job reset to pending."
+    if flacfetch_cache_cleared:
+        message += " Flacfetch cache also cleared."
+    elif flacfetch_error:
+        message += f" Note: flacfetch cache not cleared ({flacfetch_error})."
+    return ClearSearchCacheResponse(
+        status="success",
+        job_id=job_id,
+        message=message,
+        previous_status=previous_status,
+        new_status="pending",
+        results_cleared=results_count,
+        flacfetch_cache_cleared=flacfetch_cache_cleared,
+        flacfetch_error=flacfetch_error,
+    )
+@router.post("/jobs/{job_id}/reset-worker-state")
+async def reset_worker_state(
+    job_id: str,
+    auth_data: Tuple[str, UserType, int] = Depends(require_admin),
+):
+    """
+    Reset stale worker progress state for a job.
+    This clears the video_progress, render_progress, and screens_progress
+    from state_data, allowing workers to be re-triggered.
+    Use this when a job is stuck because worker progress shows 'running'
+    from a previous failed attempt.
+    """
+    from backend.services.job_manager import JobManager
+    job_manager = JobManager()
+    job = job_manager.get_job(job_id)
+    if not job:
+        raise HTTPException(status_code=404, detail=f"Job {job_id} not found")
+    # Reset worker progress states
+    job_manager.update_state_data(job_id, 'video_progress', {'stage': 'pending'})
+    job_manager.update_state_data(job_id, 'render_progress', {'stage': 'pending'})
+    job_manager.update_state_data(job_id, 'screens_progress', {'stage': 'pending'})
+    logger.info(f"Admin {auth_data[0]} reset worker state for job {job_id}")
+    return {
+        "status": "success",
+        "job_id": job_id,
+        "message": "Worker progress states reset to pending"
+    }
+@router.delete("/cache", response_model=ClearAllCacheResponse)
+async def clear_all_flacfetch_cache(
+    auth_data: Tuple[str, UserType, int] = Depends(require_admin),
+):
+    """
+    Clear the entire flacfetch search cache.
+    This will delete all cached search results from flacfetch's GCS cache.
+    Use with caution - this will cause all subsequent searches to hit
+    the trackers fresh.
+    Note: This does NOT clear Firestore job.state_data caches, only the
+    flacfetch-side GCS cache.
+    """
+    flacfetch_client = get_flacfetch_client()
+    if not flacfetch_client:
+        raise HTTPException(
+            status_code=503,
+            detail="flacfetch client not configured"
+        )
+    try:
+        deleted_count = await flacfetch_client.clear_all_cache()
+        logger.info(
+            f"Admin {auth_data[0]} cleared all flacfetch cache. "
+            f"Deleted {deleted_count} entries."
+        )
+        return ClearAllCacheResponse(
+            status="success",
+            message=f"Cleared {deleted_count} cache entries from flacfetch.",
+            deleted_count=deleted_count,
+        )
+    except FlacfetchServiceError as e:
+        logger.error(f"Failed to clear all flacfetch cache: {e}")
+        raise HTTPException(
+            status_code=502,
+            detail=f"Failed to clear flacfetch cache: {e}"
+        )
+@router.get("/cache/stats", response_model=CacheStatsResponse)
+async def get_flacfetch_cache_stats(
+    auth_data: Tuple[str, UserType, int] = Depends(require_admin),
+):
+    """
+    Get statistics about the flacfetch search cache.
+    Returns information about:
+    - Number of cached entries
+    - Total size in bytes
+    - Oldest and newest cache entries
+    - Whether cache is configured
+    """
+    flacfetch_client = get_flacfetch_client()
+    if not flacfetch_client:
+        raise HTTPException(
+            status_code=503,
+            detail="flacfetch client not configured"
+        )
+    try:
+        stats = await flacfetch_client.get_cache_stats()
+        return CacheStatsResponse(
+            count=stats.get("count", 0),
+            total_size_bytes=stats.get("total_size_bytes", 0),
+            oldest_entry=stats.get("oldest_entry"),
+            newest_entry=stats.get("newest_entry"),
+            configured=stats.get("configured", True),
+        )
+    except FlacfetchServiceError as e:
+        logger.error(f"Failed to get flacfetch cache stats: {e}")
+        raise HTTPException(
+            status_code=502,
+            detail=f"Failed to get cache stats: {e}"
+        )
+# =============================================================================
+# Job Completion Message Endpoints (for admin copy/send functionality)
+# =============================================================================
+class CompletionMessageResponse(BaseModel):
+    """Response containing the rendered completion message."""
+    job_id: str
+    message: str
+    subject: str
+    youtube_url: Optional[str] = None
+    dropbox_url: Optional[str] = None
+class SendCompletionEmailRequest(BaseModel):
+    """Request to send a completion email."""
+    to_email: str
+    cc_admin: bool = True
+class SendCompletionEmailResponse(BaseModel):
+    """Response from sending a completion email."""
+    success: bool
+    job_id: str
+    to_email: str
+    message: str
+@router.get("/jobs/{job_id}/completion-message", response_model=CompletionMessageResponse)
+async def get_job_completion_message(
+    job_id: str,
+    auth_data: Tuple[str, UserType, int] = Depends(require_admin),
+):
+    """
+    Get the rendered completion message for a job.
+    Returns the plain text message that would be sent to the user,
+    rendered using the job completion template with the job's details.
+    This is useful for:
+    - Copying the message to clipboard (e.g., for Fiverr)
+    - Previewing the email before sending
+    Requires admin authentication.
+    """
+    from backend.services.job_notification_service import get_job_notification_service
+    job_manager = JobManager()
+    job = job_manager.get_job(job_id)
+    if not job:
+        raise HTTPException(status_code=404, detail=f"Job {job_id} not found")
+    # Get youtube, dropbox URLs, and brand_code from state_data (may be None)
+    state_data = job.state_data or {}
+    youtube_url = state_data.get('youtube_url')
+    dropbox_url = state_data.get('dropbox_link')
+    brand_code = state_data.get('brand_code')
+    # Render the completion message
+    notification_service = get_job_notification_service()
+    message = notification_service.get_completion_message(
+        job_id=job.job_id,
+        user_name=None,  # Use default "there"
+        artist=job.artist,
+        title=job.title,
+        youtube_url=youtube_url,
+        dropbox_url=dropbox_url,
+    )
+    # Build subject: "NOMAD-1178: Artist - Title (Your karaoke video is ready!)"
+    # Sanitize artist/title to handle Unicode characters (curly quotes, em dashes, etc.)
+    # that cause email header encoding issues (MIME headers use latin-1)
+    safe_artist = sanitize_filename(job.artist) if job.artist else None
+    safe_title = sanitize_filename(job.title) if job.title else None
+    if brand_code and safe_artist and safe_title:
+        subject = f"{brand_code}: {safe_artist} - {safe_title} (Your karaoke video is ready!)"
+    elif safe_artist and safe_title:
+        subject = f"{safe_artist} - {safe_title} (Your karaoke video is ready!)"
+    else:
+        subject = "Your karaoke video is ready!"
+    return CompletionMessageResponse(
+        job_id=job_id,
+        message=message,
+        subject=subject,
+        youtube_url=youtube_url,
+        dropbox_url=dropbox_url,
+    )
+@router.post("/jobs/{job_id}/send-completion-email", response_model=SendCompletionEmailResponse)
+async def send_job_completion_email(
+    job_id: str,
+    request: SendCompletionEmailRequest,
+    auth_data: Tuple[str, UserType, int] = Depends(require_admin),
+):
+    """
+    Send a completion email for a job to a specified email address.
+    This allows admins to manually send (or re-send) completion emails,
+    useful for:
+    - Sending to customers who didn't have an email on file
+    - Re-sending if the original email was lost
+    - Sending to alternate email addresses
+    Requires admin authentication.
+    """
+    from backend.services.job_notification_service import get_job_notification_service
+    from backend.services.email_service import get_email_service
+    job_manager = JobManager()
+    job = job_manager.get_job(job_id)
+    if not job:
+        raise HTTPException(status_code=404, detail=f"Job {job_id} not found")
+    # Get youtube, dropbox URLs, and brand_code from state_data (may be None)
+    state_data = job.state_data or {}
+    youtube_url = state_data.get('youtube_url')
+    dropbox_url = state_data.get('dropbox_link')
+    brand_code = state_data.get('brand_code')
+    # Render the completion message
+    notification_service = get_job_notification_service()
+    message = notification_service.get_completion_message(
+        job_id=job.job_id,
+        user_name=None,  # Use default "there"
+        artist=job.artist,
+        title=job.title,
+        youtube_url=youtube_url,
+        dropbox_url=dropbox_url,
+    )
+    # Send the email
+    email_service = get_email_service()
+    success = email_service.send_job_completion(
+        to_email=request.to_email,
+        message_content=message,
+        artist=job.artist,
+        title=job.title,
+        brand_code=brand_code,
+        cc_admin=request.cc_admin,
+    )
+    if success:
+        logger.info(f"Admin sent completion email for job {job_id} to {request.to_email}")
+        return SendCompletionEmailResponse(
+            success=True,
+            job_id=job_id,
+            to_email=request.to_email,
+            message=f"Completion email sent to {request.to_email}",
+        )
+    else:
+        logger.error(f"Failed to send completion email for job {job_id}")
+        raise HTTPException(
+            status_code=500,
+            detail="Failed to send email. Check email service configuration."
+        )

karaoke-gen 0.90.1__py3-none-any.whl → 0.99.3__py3-none-any.whl

karaoke-gen 0.90.1py3-none-any.whl → 0.99.3py3-none-any.whl