PyPI - audiopod - Versions diffs - 1.2.0__py3-none-any.whl → 1.4.0__py3-none-any.whl - Mend

audiopod 1.2.0py3-none-any.whl → 1.4.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

audiopod/__init__.py +10 -64
audiopod/client.py +143 -172
audiopod/config.py +4 -50
audiopod/exceptions.py +16 -71
audiopod/services/__init__.py +8 -6
audiopod/services/base.py +51 -195
audiopod/services/credits.py +26 -30
audiopod/services/denoiser.py +120 -40
audiopod/services/music.py +180 -485
audiopod/services/speaker.py +117 -36
audiopod/services/stem_extraction.py +130 -142
audiopod/services/transcription.py +159 -184
audiopod/services/translation.py +109 -170
audiopod/services/voice.py +141 -424
audiopod/services/wallet.py +235 -0
audiopod-1.4.0.dist-info/METADATA +206 -0
audiopod-1.4.0.dist-info/RECORD +20 -0
{audiopod-1.2.0.dist-info → audiopod-1.4.0.dist-info}/WHEEL +1 -1
audiopod/cli.py +0 -285
audiopod/models.py +0 -250
audiopod/py.typed +0 -2
audiopod/services/karaoke.py +0 -61
audiopod-1.2.0.dist-info/METADATA +0 -454
audiopod-1.2.0.dist-info/RECORD +0 -24
audiopod-1.2.0.dist-info/entry_points.txt +0 -2
{audiopod-1.2.0.dist-info → audiopod-1.4.0.dist-info}/licenses/LICENSE +0 -0
{audiopod-1.2.0.dist-info → audiopod-1.4.0.dist-info}/top_level.txt +0 -0

audiopod/services/transcription.py CHANGED Viewed

@@ -1,212 +1,187 @@
 """
-Transcription Service - Speech-to-text operations
-"""
+Transcription Service - Speech-to-text
-from typing import List, Optional, Dict, Any, Union
+API Routes:
+- POST /api/v1/transcription/transcribe        - Transcribe from URL
+- POST /api/v1/transcription/transcribe-upload - Transcribe from file upload
+- GET  /api/v1/transcription/jobs/{id}         - Get job details
+- GET  /api/v1/transcription/jobs              - List jobs
+- DELETE /api/v1/transcription/jobs/{id}       - Delete job
+"""
+from typing import Optional, Dict, Any, List
 from .base import BaseService
-from ..models import Job, TranscriptionResult
-from ..exceptions import ValidationError
 class TranscriptionService(BaseService):
-    """Service for audio transcription operations"""
-    def transcribe_audio(
+    """Service for speech-to-text transcription."""
+    def transcribe(
         self,
-        audio_file: str,
+        audio_file: Optional[str] = None,
+        url: Optional[str] = None,
         language: Optional[str] = None,
-        model_type: str = "whisperx",
-        enable_speaker_diarization: bool = False,
-        enable_word_timestamps: bool = True,
+        speaker_diarization: bool = False,
         wait_for_completion: bool = False,
-        timeout: int = 600
-    ) -> Union[Job, TranscriptionResult]:
+        timeout: int = 600,
+    ) -> Dict[str, Any]:
         """
-        Transcribe audio to text
+        Transcribe audio to text.
         Args:
-            audio_file: Path to audio file
-            language: Language code (auto-detect if None)
-            model_type: Model to use ('whisperx', 'faster-whisper')
-            enable_speaker_diarization: Enable speaker identification
-            enable_word_timestamps: Include word-level timestamps
-            wait_for_completion: Whether to wait for completion
-            timeout: Maximum time to wait
+            audio_file: Path to local audio file
+            url: URL of audio file (or list of URLs)
+            language: Language code (auto-detected if not provided)
+            speaker_diarization: Enable speaker separation
+            wait_for_completion: Wait for completion
+            timeout: Max wait time in seconds
         Returns:
-            Job object or transcription result
+            Job dict with transcript when completed
         """
-        # Validate inputs
-        if language:
-            language = self._validate_language_code(language)
-        if model_type not in ["whisperx", "faster-whisper"]:
-            raise ValidationError("Model type must be 'whisperx' or 'faster-whisper'")
-        # Prepare file upload
-        files = self._prepare_file_upload(audio_file, "files")
-        # Prepare form data
-        data = {
-            "model_type": model_type,
-            "enable_speaker_diarization": enable_speaker_diarization,
-            "enable_word_timestamps": enable_word_timestamps
-        }
-        if language:
-            data["language"] = language
-        # Make request
-        if self.async_mode:
-            return self._async_transcribe_audio(files, data, wait_for_completion, timeout)
+        if audio_file:
+            # File upload endpoint
+            data = {
+                "enable_speaker_diarization": speaker_diarization,
+            }
+            if language:
+                data["language"] = language
+            files = self._prepare_file_upload(audio_file, "files")
+            if self.async_mode:
+                return self._async_transcribe_upload(data, files, wait_for_completion, timeout)
+            response = self.client.request(
+                "POST", "/api/v1/transcription/transcribe-upload", data=data, files=files
+            )
         else:
+            # URL-based endpoint
+            data = {
+                "source_urls": [url] if isinstance(url, str) else url,
+                "enable_speaker_diarization": speaker_diarization,
+            }
+            if language:
+                data["language"] = language
+            if self.async_mode:
+                return self._async_transcribe(data, wait_for_completion, timeout)
             response = self.client.request(
-                "POST",
-                "/api/v1/transcription/transcribe-upload",
-                data=data,
-                files=files
+                "POST", "/api/v1/transcription/transcribe", json_data=data
             )
-            job = Job.from_dict(response)
-            if wait_for_completion:
-                completed_job = self._wait_for_completion(job.id, timeout)
-                return TranscriptionResult.from_dict(completed_job.result or completed_job.__dict__)
-            return job
-    async def _async_transcribe_audio(
-        self,
-        files: Dict[str, Any],
-        data: Dict[str, Any],
-        wait_for_completion: bool,
-        timeout: int
-    ) -> Union[Job, TranscriptionResult]:
-        """Async version of transcribe_audio"""
+        if wait_for_completion:
+            job_id = response.get("id") or response.get("job_id")
+            return self._wait_for_transcription(job_id, timeout)
+        return response
+    async def _async_transcribe(
+        self, data: Dict, wait_for_completion: bool, timeout: int
+    ) -> Dict[str, Any]:
         response = await self.client.request(
-            "POST",
-            "/api/v1/transcription/transcribe-upload",
-            data=data,
-            files=files
+            "POST", "/api/v1/transcription/transcribe", json_data=data
         )
-        job = Job.from_dict(response)
         if wait_for_completion:
-            completed_job = await self._async_wait_for_completion(job.id, timeout)
-            return TranscriptionResult.from_dict(completed_job.result or completed_job.__dict__)
-        return job
-    def transcribe_url(
-        self,
-        url: str,
-        language: Optional[str] = None,
-        model_type: str = "whisperx",
-        enable_speaker_diarization: bool = False,
-        wait_for_completion: bool = False,
-        timeout: int = 600
-    ) -> Union[Job, TranscriptionResult]:
-        """
-        Transcribe audio from URL (YouTube, etc.)
-        Args:
-            url: URL to audio/video content
-            language: Language code
-            model_type: Model to use
-            enable_speaker_diarization: Enable speaker identification
-            wait_for_completion: Whether to wait for completion
-            timeout: Maximum time to wait
-        Returns:
-            Job object or transcription result
-        """
-        if language:
-            language = self._validate_language_code(language)
-        data = {
-            "source_urls": [url],
-            "model_type": model_type,
-            "enable_speaker_diarization": enable_speaker_diarization
-        }
-        if language:
-            data["language"] = language
-        if self.async_mode:
-            return self._async_transcribe_url(data, wait_for_completion, timeout)
-        else:
-            response = self.client.request("POST", "/api/v1/transcription/transcribe", data=data)
-            job = Job.from_dict(response)
-            if wait_for_completion:
-                completed_job = self._wait_for_completion(job.id, timeout)
-                return TranscriptionResult.from_dict(completed_job.result or completed_job.__dict__)
-            return job
-    async def _async_transcribe_url(
-        self,
-        data: Dict[str, Any],
-        wait_for_completion: bool,
-        timeout: int
-    ) -> Union[Job, TranscriptionResult]:
-        """Async version of transcribe_url"""
-        response = await self.client.request("POST", "/api/v1/transcription/transcribe", data=data)
-        job = Job.from_dict(response)
+            job_id = response.get("id") or response.get("job_id")
+            return await self._async_wait_for_transcription(job_id, timeout)
+        return response
+    async def _async_transcribe_upload(
+        self, data: Dict, files: Dict, wait_for_completion: bool, timeout: int
+    ) -> Dict[str, Any]:
+        response = await self.client.request(
+            "POST", "/api/v1/transcription/transcribe-upload", data=data, files=files
+        )
         if wait_for_completion:
-            completed_job = await self._async_wait_for_completion(job.id, timeout)
-            return TranscriptionResult.from_dict(completed_job.result or completed_job.__dict__)
-        return job
-    def get_transcription_job(self, job_id: int) -> TranscriptionResult:
-        """Get transcription job details"""
+            job_id = response.get("id") or response.get("job_id")
+            return await self._async_wait_for_transcription(job_id, timeout)
+        return response
+    def get_job(self, job_id: int) -> Dict[str, Any]:
+        """Get transcription job details and status."""
         if self.async_mode:
-            return self._async_get_transcription_job(job_id)
-        else:
-            response = self.client.request("GET", f"/api/v1/transcription/jobs/{job_id}")
-            return TranscriptionResult.from_dict(response)
-    async def _async_get_transcription_job(self, job_id: int) -> TranscriptionResult:
-        """Async version of get_transcription_job"""
-        response = await self.client.request("GET", f"/api/v1/transcription/jobs/{job_id}")
-        return TranscriptionResult.from_dict(response)
-    def download_transcript(
-        self,
-        job_id: int,
-        format: str = "json"
-    ) -> str:
+            return self._async_get_job(job_id)
+        return self.client.request("GET", f"/api/v1/transcription/jobs/{job_id}")
+    async def _async_get_job(self, job_id: int) -> Dict[str, Any]:
+        return await self.client.request("GET", f"/api/v1/transcription/jobs/{job_id}")
+    def list_jobs(self, skip: int = 0, limit: int = 50) -> List[Dict[str, Any]]:
+        """List transcription jobs."""
+        if self.async_mode:
+            return self._async_list_jobs(skip, limit)
+        return self.client.request(
+            "GET", "/api/v1/transcription/jobs", params={"skip": skip, "limit": limit}
+        )
+    async def _async_list_jobs(self, skip: int, limit: int) -> List[Dict[str, Any]]:
+        return await self.client.request(
+            "GET", "/api/v1/transcription/jobs", params={"skip": skip, "limit": limit}
+        )
+    def delete_job(self, job_id: int) -> Dict[str, str]:
+        """Delete a transcription job."""
+        if self.async_mode:
+            return self._async_delete_job(job_id)
+        return self.client.request("DELETE", f"/api/v1/transcription/jobs/{job_id}")
+    async def _async_delete_job(self, job_id: int) -> Dict[str, str]:
+        return await self.client.request("DELETE", f"/api/v1/transcription/jobs/{job_id}")
+    def get_transcript(self, job_id: int, format: str = "json") -> Any:
         """
-        Download transcript in specified format
+        Get transcript content.
         Args:
-            job_id: Transcription job ID
-            format: Output format ('json', 'txt', 'srt', 'vtt', 'pdf')
-        Returns:
-            Transcript content
+            job_id: Job ID
+            format: Output format - 'json', 'txt', 'srt', 'vtt'
         """
-        if format not in ["json", "txt", "srt", "vtt", "pdf", "docx", "html"]:
-            raise ValidationError("Format must be one of: json, txt, srt, vtt, pdf, docx, html")
-        params = {"format": format}
         if self.async_mode:
-            return self._async_download_transcript(job_id, params)
-        else:
-            response = self.client.request(
-                "GET",
-                f"/api/v1/transcription/jobs/{job_id}/transcript",
-                params=params
-            )
-            return response
-    async def _async_download_transcript(self, job_id: int, params: Dict[str, str]) -> str:
-        """Async version of download_transcript"""
-        response = await self.client.request(
-            "GET",
-            f"/api/v1/transcription/jobs/{job_id}/transcript",
-            params=params
+            return self._async_get_transcript(job_id, format)
+        return self.client.request(
+            "GET", f"/api/v1/transcription/jobs/{job_id}/transcript", params={"format": format}
         )
-        return response
+    async def _async_get_transcript(self, job_id: int, format: str) -> Any:
+        return await self.client.request(
+            "GET", f"/api/v1/transcription/jobs/{job_id}/transcript", params={"format": format}
+        )
+    def _wait_for_transcription(self, job_id: int, timeout: int) -> Dict[str, Any]:
+        """Wait for transcription job completion."""
+        import time
+        start_time = time.time()
+        while time.time() - start_time < timeout:
+            job = self.get_job(job_id)
+            status = job.get("status", "").upper()
+            if status == "COMPLETED":
+                return job
+            elif status in ("FAILED", "ERROR", "CANCELLED"):
+                raise Exception(f"Transcription failed: {job.get('error_message', 'Unknown error')}")
+            time.sleep(3)
+        raise TimeoutError(f"Transcription {job_id} did not complete within {timeout} seconds")
+    async def _async_wait_for_transcription(self, job_id: int, timeout: int) -> Dict[str, Any]:
+        """Async wait for transcription job completion."""
+        import asyncio
+        import time
+        start_time = time.time()
+        while time.time() - start_time < timeout:
+            job = await self.get_job(job_id)
+            status = job.get("status", "").upper()
+            if status == "COMPLETED":
+                return job
+            elif status in ("FAILED", "ERROR", "CANCELLED"):
+                raise Exception(f"Transcription failed: {job.get('error_message', 'Unknown error')}")
+            await asyncio.sleep(3)
+        raise TimeoutError(f"Transcription {job_id} did not complete within {timeout} seconds")

audiopod 1.2.0__py3-none-any.whl → 1.4.0__py3-none-any.whl

audiopod 1.2.0py3-none-any.whl → 1.4.0py3-none-any.whl