PyPI - lyrics-transcriber - Versions diffs - 0.19.2__py3-none-any.whl → 0.30.0__py3-none-any.whl - Mend

lyrics-transcriber 0.19.2py3-none-any.whl → 0.30.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (32) hide show

lyrics_transcriber/__init__.py +2 -5
lyrics_transcriber/cli/main.py +194 -0
lyrics_transcriber/core/__init__.py +0 -0
lyrics_transcriber/core/controller.py +283 -0
lyrics_transcriber/core/corrector.py +56 -0
lyrics_transcriber/core/fetcher.py +143 -0
lyrics_transcriber/output/__init__.py +0 -0
lyrics_transcriber/output/generator.py +210 -0
lyrics_transcriber/storage/__init__.py +0 -0
lyrics_transcriber/storage/dropbox.py +249 -0
lyrics_transcriber/storage/tokens.py +116 -0
lyrics_transcriber/{audioshake_transcriber.py → transcribers/audioshake.py} +44 -15
lyrics_transcriber/transcribers/base.py +31 -0
lyrics_transcriber/transcribers/whisper.py +186 -0
{lyrics_transcriber-0.19.2.dist-info → lyrics_transcriber-0.30.0.dist-info}/METADATA +6 -17
lyrics_transcriber-0.30.0.dist-info/RECORD +22 -0
lyrics_transcriber-0.30.0.dist-info/entry_points.txt +3 -0
lyrics_transcriber/llm_prompts/README.md +0 -10
lyrics_transcriber/llm_prompts/llm_prompt_lyrics_correction_andrew_handwritten_20231118.txt +0 -55
lyrics_transcriber/llm_prompts/llm_prompt_lyrics_correction_gpt_optimised_20231119.txt +0 -36
lyrics_transcriber/llm_prompts/llm_prompt_lyrics_matching_andrew_handwritten_20231118.txt +0 -19
lyrics_transcriber/llm_prompts/promptfooconfig.yaml +0 -61
lyrics_transcriber/llm_prompts/test_data/ABBA-UnderAttack-Genius.txt +0 -48
lyrics_transcriber/transcriber.py +0 -1128
lyrics_transcriber/utils/cli.py +0 -179
lyrics_transcriber-0.19.2.dist-info/RECORD +0 -18
lyrics_transcriber-0.19.2.dist-info/entry_points.txt +0 -3
/lyrics_transcriber/{utils → cli}/__init__.py +0 -0
/lyrics_transcriber/{utils → output}/ass.py +0 -0
/lyrics_transcriber/{utils → output}/subtitles.py +0 -0
{lyrics_transcriber-0.19.2.dist-info → lyrics_transcriber-0.30.0.dist-info}/LICENSE +0 -0
{lyrics_transcriber-0.19.2.dist-info → lyrics_transcriber-0.30.0.dist-info}/WHEEL +0 -0

lyrics_transcriber/utils/cli.py DELETED Viewed

@@ -1,179 +0,0 @@
-#!/usr/bin/env python
-import argparse
-import logging
-import pkg_resources
-def main():
-    logger = logging.getLogger(__name__)
-    log_handler = logging.StreamHandler()
-    log_formatter = logging.Formatter(fmt="%(asctime)s.%(msecs)03d - %(levelname)s - %(module)s - %(message)s", datefmt="%Y-%m-%d %H:%M:%S")
-    log_handler.setFormatter(log_formatter)
-    logger.addHandler(log_handler)
-    logger.debug("Parsing CLI args")
-    parser = argparse.ArgumentParser(
-        description="Create synchronised lyrics files in ASS and MidiCo LRC formats with word-level timestamps, from any input song file",
-        formatter_class=lambda prog: argparse.HelpFormatter(prog, max_help_position=40),
-    )
-    parser.add_argument("audio_filepath", nargs="?", help="The audio file path to transcribe lyrics for.", default=argparse.SUPPRESS)
-    package_version = pkg_resources.get_distribution("lyrics-transcriber").version
-    parser.add_argument("-v", "--version", action="version", version=f"%(prog)s {package_version}")
-    parser.add_argument("--log_level", default="INFO", help="Optional: Logging level, e.g. info, debug, warning. Default: INFO")
-    parser.add_argument(
-        "--artist",
-        default=None,
-        help="Optional: song artist for lyrics lookup and auto-correction",
-    )
-    parser.add_argument(
-        "--title",
-        default=None,
-        help="Optional: song title for lyrics lookup and auto-correction",
-    )
-    parser.add_argument(
-        "--audioshake_api_token",
-        default=None,
-        help="Optional: AudioShake API token for lyrics transcription and alignment. Can also be set with AUDIOSHAKE_API_TOKEN env var.",
-    )
-    parser.add_argument(
-        "--genius_api_token",
-        default=None,
-        help="Optional: Genius API token for lyrics fetching. Can also be set with GENIUS_API_TOKEN env var.",
-    )
-    parser.add_argument(
-        "--spotify_cookie",
-        default=None,
-        help="Optional: Spotify sp_dc cookie value for lyrics fetching. Can also be set with SPOTIFY_COOKIE_SP_DC env var.",
-    )
-    parser.add_argument(
-        "--cache_dir",
-        default="/tmp/lyrics-transcriber-cache/",
-        help="Optional: directory to cache files downloaded or generated during execution",
-    )
-    parser.add_argument(
-        "--output_dir",
-        default=None,
-        help="Optional: directory where the output lyrics files will be saved. Default: current directory",
-    )
-    parser.add_argument(
-        "--transcription_model",
-        default="medium",
-        help="Optional: transcription model to use (currently only supports Whisper models, e.g. medium.en, large-v3). Default: medium",
-    )
-    parser.add_argument(
-        "--llm_model",
-        default="gpt-4o",
-        help="Optional: LLM model to use (currently only supports OpenAI chat completion compatible models",
-    )
-    parser.add_argument(
-        "--render_video",
-        action="store_true",
-        help="Optional: render a karaoke video with the generated lyrics",
-    )
-    parser.add_argument(
-        "--video_resolution",
-        default="360p",
-        help="Optional: resolution of the karaoke video to render. Must be one of: 4k, 1080p, 720p, 360p. Default: 360p",
-    )
-    parser.add_argument(
-        "--video_background_image",
-        default=None,
-        help="Optional: image file path to use for karaoke video background",
-    )
-    parser.add_argument(
-        "--video_background_color",
-        default="black",
-        help="Optional: color to use for karaoke video background, in hex format or FFmpeg color name. Default: black",
-    )
-    parser.add_argument(
-        "--openai_api_key",
-        default=None,
-        help="Optional: OpenAI API key for LLM model usage. Can also be set with OPENAI_API_KEY env var.",
-    )
-    args = parser.parse_args()
-    log_level = getattr(logging, args.log_level.upper())
-    logger.setLevel(log_level)
-    if not hasattr(args, "audio_filepath"):
-        parser.print_help()
-        exit(1)
-    if 1 <= [args.genius_api_token, args.title, args.artist].count(True) < 3:
-        print(f"To use genius lyrics auto-correction, all 3 args genius_api_token, artist, title must be provided")
-        print(args)
-        exit(1)
-    logger.debug("Loading LyricsTranscriber class")
-    # Lazy load this class so help output is printed quickly rather than waiting for heavy libraries to load
-    from lyrics_transcriber import LyricsTranscriber
-    transcriber = LyricsTranscriber(
-        args.audio_filepath,
-        audioshake_api_token=args.audioshake_api_token,
-        genius_api_token=args.genius_api_token,
-        spotify_cookie=args.spotify_cookie,
-        openai_api_key=args.openai_api_key,
-        artist=args.artist,
-        title=args.title,
-        output_dir=args.output_dir,
-        cache_dir=args.cache_dir,
-        log_formatter=log_formatter,
-        log_level=log_level,
-        transcription_model=args.transcription_model,
-        llm_model=args.llm_model,
-        render_video=args.render_video,
-        video_resolution=args.video_resolution,
-        video_background_image=args.video_background_image,
-        video_background_color=args.video_background_color,
-    )
-    outputs = transcriber.generate()
-    logger.info(f"*** Success! ***")
-    formatted_duration = f'{int(outputs["song_duration"] // 60):02d}:{int(outputs["song_duration"] % 60):02d}'
-    logger.info(f"Total Song Duration: {formatted_duration}")
-    formatted_singing_duration = f'{int(outputs["total_singing_duration"] // 60):02d}:{int(outputs["total_singing_duration"] % 60):02d}'
-    logger.info(f"Total Singing Duration: {formatted_singing_duration}")
-    logger.info(f"Singing Percentage: {outputs['singing_percentage']}%")
-    logger.info(f"*** Outputs: ***")
-    logger.info(f"Transcription output data file: {outputs['transcription_data_filepath']}")
-    logger.info(f"Genius lyrics output file: {outputs['genius_lyrics_filepath']}")
-    logger.info(f"Spotify lyrics data file: {outputs['spotify_lyrics_data_filepath']}")
-    logger.info(f"Transcribed lyrics text file: {outputs['transcribed_lyrics_text_filepath']}")
-    logger.info(f"Spotify lyrics text file: {outputs['spotify_lyrics_text_filepath']}")
-    logger.info(f"Corrected lyrics text file: {outputs['corrected_lyrics_text_filepath']}")
-    logger.info(f"MidiCo LRC output file: {outputs['midico_lrc_filepath']}")
-    logger.info(f"ASS subtitles file: {outputs['ass_subtitles_filepath']}")
-    logger.info(f"Karaoke Video file: {outputs['karaoke_video_filepath']}")
-    logger.info(f"LLM Token Usage: input: {outputs['llm_token_usage']['input']} output: {outputs['llm_token_usage']['output']}")
-    logger.info(
-        f'LLM usage costs: {outputs["llm_costs_usd"]["input"]} + {outputs["llm_costs_usd"]["output"]} = ${outputs["llm_costs_usd"]["total"]}'
-    )
-    logger.info(f"Files copied to output dir: {outputs['output_dir']}")
-if __name__ == "__main__":
-    main()

lyrics_transcriber-0.19.2.dist-info/RECORD DELETED Viewed

@@ -1,18 +0,0 @@
-lyrics_transcriber/__init__.py,sha256=bIRjsXAzlghS1rQxWNLU0wppZy0T_iciN9EclHLwNrQ,94
-lyrics_transcriber/audioshake_transcriber.py,sha256=AbIkghvguI1PV0fCMUHGRnidQwLPM_pQ96FI0Qk-aI0,5221
-lyrics_transcriber/llm_prompts/README.md,sha256=DPAGRDVGt9ZNcQAAoQGFhwesLY3D6hD8apL71yHP4yo,196
-lyrics_transcriber/llm_prompts/llm_prompt_lyrics_correction_andrew_handwritten_20231118.txt,sha256=a3XjAYfyhWt1uCKKqm_n2Pc0STdmBdiHHtJ7ODP99Nk,4046
-lyrics_transcriber/llm_prompts/llm_prompt_lyrics_correction_gpt_optimised_20231119.txt,sha256=r6HN3DD_3gwh3B_JPd2R0I4lDXuB5iy7B90J9agOxbQ,2369
-lyrics_transcriber/llm_prompts/llm_prompt_lyrics_matching_andrew_handwritten_20231118.txt,sha256=hvk2Vs3M3Q4zGQsiQnXvnpd8wXWfwsudYeqN5qFyNWs,1754
-lyrics_transcriber/llm_prompts/promptfooconfig.yaml,sha256=O4YxlLV7XSUiSw_1Q9G7ELC2VAbrYUV_N5QxrPbd1jE,3735
-lyrics_transcriber/llm_prompts/test_data/ABBA-UnderAttack-Genius.txt,sha256=8d-RvZtyINKUlpQLwMi-VD--Y59J-epPt7SZSqjFbPI,1690
-lyrics_transcriber/transcriber.py,sha256=AhovzKfAWJERjqBseItHk3rnj3M1rlPHRhbMk0ogqxQ,57568
-lyrics_transcriber/utils/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-lyrics_transcriber/utils/ass.py,sha256=b8lnjgXGD1OD1ld_b1xxUmSOf4nSEfz9BpgSkh16R4g,90291
-lyrics_transcriber/utils/cli.py,sha256=8Poba_9wQw0VmOK73vuK-w-abR9QmO4y4FYDHiAQbc0,6972
-lyrics_transcriber/utils/subtitles.py,sha256=_WG0pFoZMXcrGe6gbARkC9KrWzFNTMOsiqQwNL-H2lU,11812
-lyrics_transcriber-0.19.2.dist-info/LICENSE,sha256=BiPihPDxhxIPEx6yAxVfAljD5Bhm_XG2teCbPEj_m0Y,1069
-lyrics_transcriber-0.19.2.dist-info/METADATA,sha256=J1tlv6r2va-7Q_ygGvEPJ9DrIGa_hzCGWufVhXo6Vcc,5825
-lyrics_transcriber-0.19.2.dist-info/WHEEL,sha256=Nq82e9rUAnEjt98J6MlVmMCZb-t9cYE2Ir1kpBmnWfs,88
-lyrics_transcriber-0.19.2.dist-info/entry_points.txt,sha256=lh6L-iR5CGELaNcouDK94X78eS5Ua_tK9lI4UEkza-k,72
-lyrics_transcriber-0.19.2.dist-info/RECORD,,

lyrics_transcriber-0.19.2.dist-info/entry_points.txt DELETED Viewed

@@ -1,3 +0,0 @@
-[console_scripts]
-lyrics-transcriber=lyrics_transcriber.utils.cli:main

/lyrics_transcriber/{utils → cli}/__init__.py RENAMED Viewed

File without changes

/lyrics_transcriber/{utils → output}/ass.py RENAMED Viewed

File without changes

/lyrics_transcriber/{utils → output}/subtitles.py RENAMED Viewed

File without changes

{lyrics_transcriber-0.19.2.dist-info → lyrics_transcriber-0.30.0.dist-info}/LICENSE RENAMED Viewed

File without changes

{lyrics_transcriber-0.19.2.dist-info → lyrics_transcriber-0.30.0.dist-info}/WHEEL RENAMED Viewed

File without changes

lyrics-transcriber 0.19.2__py3-none-any.whl → 0.30.0__py3-none-any.whl

lyrics-transcriber 0.19.2py3-none-any.whl → 0.30.0py3-none-any.whl