PyPI - torchaudio - Versions diffs - 2.8.0__cp313-cp313-manylinux_2_28_aarch64.whl → 2.9.0__cp313-cp313-manylinux_2_28_aarch64.whl - Mend

torchaudio 2.8.0__cp313-cp313-manylinux_2_28_aarch64.whl → 2.9.0__cp313-cp313-manylinux_2_28_aarch64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of torchaudio might be problematic. Click here for more details.

Files changed (94) hide show

torchaudio/__init__.py +179 -39
torchaudio/_extension/__init__.py +1 -14
torchaudio/_extension/utils.py +0 -47
torchaudio/_internal/module_utils.py +12 -3
torchaudio/_torchcodec.py +73 -85
torchaudio/datasets/cmuarctic.py +1 -1
torchaudio/datasets/utils.py +1 -1
torchaudio/functional/__init__.py +0 -2
torchaudio/functional/_alignment.py +1 -1
torchaudio/functional/filtering.py +70 -55
torchaudio/functional/functional.py +26 -60
torchaudio/lib/_torchaudio.so +0 -0
torchaudio/lib/libtorchaudio.so +0 -0
torchaudio/models/decoder/__init__.py +14 -2
torchaudio/models/decoder/_ctc_decoder.py +6 -6
torchaudio/models/decoder/_cuda_ctc_decoder.py +1 -1
torchaudio/models/squim/objective.py +2 -2
torchaudio/pipelines/_source_separation_pipeline.py +1 -1
torchaudio/pipelines/_squim_pipeline.py +2 -2
torchaudio/pipelines/_tts/utils.py +1 -1
torchaudio/pipelines/rnnt_pipeline.py +4 -4
torchaudio/transforms/__init__.py +1 -0
torchaudio/transforms/_transforms.py +2 -2
torchaudio/utils/__init__.py +2 -9
torchaudio/utils/download.py +1 -3
torchaudio/version.py +2 -2
{torchaudio-2.8.0.dist-info → torchaudio-2.9.0.dist-info}/METADATA +8 -11
torchaudio-2.9.0.dist-info/RECORD +85 -0
{torchaudio-2.8.0.dist-info → torchaudio-2.9.0.dist-info}/top_level.txt +0 -1
torchaudio/_backend/__init__.py +0 -61
torchaudio/_backend/backend.py +0 -53
torchaudio/_backend/common.py +0 -52
torchaudio/_backend/ffmpeg.py +0 -334
torchaudio/_backend/soundfile.py +0 -54
torchaudio/_backend/soundfile_backend.py +0 -457
torchaudio/_backend/sox.py +0 -91
torchaudio/_backend/utils.py +0 -350
torchaudio/backend/__init__.py +0 -8
torchaudio/backend/_no_backend.py +0 -25
torchaudio/backend/_sox_io_backend.py +0 -294
torchaudio/backend/common.py +0 -13
torchaudio/backend/no_backend.py +0 -14
torchaudio/backend/soundfile_backend.py +0 -14
torchaudio/backend/sox_io_backend.py +0 -14
torchaudio/io/__init__.py +0 -20
torchaudio/io/_effector.py +0 -347
torchaudio/io/_playback.py +0 -72
torchaudio/kaldi_io.py +0 -150
torchaudio/lib/_torchaudio_sox.so +0 -0
torchaudio/lib/libtorchaudio_sox.so +0 -0
torchaudio/prototype/__init__.py +0 -0
torchaudio/prototype/datasets/__init__.py +0 -4
torchaudio/prototype/datasets/musan.py +0 -68
torchaudio/prototype/functional/__init__.py +0 -26
torchaudio/prototype/functional/_dsp.py +0 -441
torchaudio/prototype/functional/_rir.py +0 -382
torchaudio/prototype/functional/functional.py +0 -193
torchaudio/prototype/models/__init__.py +0 -39
torchaudio/prototype/models/_conformer_wav2vec2.py +0 -801
torchaudio/prototype/models/_emformer_hubert.py +0 -337
torchaudio/prototype/models/conv_emformer.py +0 -529
torchaudio/prototype/models/hifi_gan.py +0 -342
torchaudio/prototype/models/rnnt.py +0 -717
torchaudio/prototype/models/rnnt_decoder.py +0 -402
torchaudio/prototype/pipelines/__init__.py +0 -21
torchaudio/prototype/pipelines/_vggish/__init__.py +0 -7
torchaudio/prototype/pipelines/_vggish/_vggish_impl.py +0 -236
torchaudio/prototype/pipelines/_vggish/_vggish_pipeline.py +0 -83
torchaudio/prototype/pipelines/hifigan_pipeline.py +0 -233
torchaudio/prototype/pipelines/rnnt_pipeline.py +0 -58
torchaudio/prototype/transforms/__init__.py +0 -9
torchaudio/prototype/transforms/_transforms.py +0 -461
torchaudio/sox_effects/__init__.py +0 -10
torchaudio/sox_effects/sox_effects.py +0 -275
torchaudio/utils/ffmpeg_utils.py +0 -11
torchaudio/utils/sox_utils.py +0 -118
torchaudio-2.8.0.dist-info/RECORD +0 -147
torio/__init__.py +0 -8
torio/_extension/__init__.py +0 -13
torio/_extension/utils.py +0 -147
torio/io/__init__.py +0 -9
torio/io/_streaming_media_decoder.py +0 -977
torio/io/_streaming_media_encoder.py +0 -502
torio/lib/__init__.py +0 -0
torio/lib/_torio_ffmpeg4.so +0 -0
torio/lib/_torio_ffmpeg5.so +0 -0
torio/lib/_torio_ffmpeg6.so +0 -0
torio/lib/libtorio_ffmpeg4.so +0 -0
torio/lib/libtorio_ffmpeg5.so +0 -0
torio/lib/libtorio_ffmpeg6.so +0 -0
torio/utils/__init__.py +0 -4
torio/utils/ffmpeg_utils.py +0 -275
{torchaudio-2.8.0.dist-info → torchaudio-2.9.0.dist-info}/LICENSE +0 -0
{torchaudio-2.8.0.dist-info → torchaudio-2.9.0.dist-info}/WHEEL +0 -0

torchaudio/__init__.py CHANGED Viewed

@@ -1,39 +1,13 @@
-from torchaudio._internal.module_utils import dropping_io_support, dropping_class_io_support
+import os
+from typing import BinaryIO, Optional, Tuple, Union
+import torch
 # Initialize extension and backend first
 from . import _extension  # noqa  # usort: skip
-from ._backend import (  # noqa  # usort: skip
-    AudioMetaData as _AudioMetaData,
-    get_audio_backend as _get_audio_backend,
-    info as _info,
-    list_audio_backends as _list_audio_backends,
-    load,
-    save,
-    set_audio_backend as _set_audio_backend,
-)
+from . import compliance, datasets, functional, models, pipelines, transforms, utils  # noqa: F401
 from ._torchcodec import load_with_torchcodec, save_with_torchcodec
-AudioMetaData = dropping_class_io_support(_AudioMetaData)
-get_audio_backend = dropping_io_support(_get_audio_backend)
-info = dropping_io_support(_info)
-list_audio_backends = dropping_io_support(_list_audio_backends)
-set_audio_backend = dropping_io_support(_set_audio_backend)
-from . import (  # noqa: F401
-    compliance,
-    datasets,
-    functional,
-    io,
-    kaldi_io,
-    models,
-    pipelines,
-    sox_effects,
-    transforms,
-    utils,
-)
-# For BC
-from . import backend  # noqa # usort: skip
 try:
     from .version import __version__, git_version  # noqa: F401
@@ -41,24 +15,190 @@ except ImportError:
     pass
+def load(
+    uri: Union[BinaryIO, str, os.PathLike],
+    frame_offset: int = 0,
+    num_frames: int = -1,
+    normalize: bool = True,
+    channels_first: bool = True,
+    format: Optional[str] = None,
+    buffer_size: int = 4096,
+    backend: Optional[str] = None,
+) -> Tuple[torch.Tensor, int]:
+    """Load audio data from source using TorchCodec's AudioDecoder.
+    .. note::
+        As of TorchAudio 2.9, this function relies on TorchCodec's decoding capabilities under the hood. It is
+        provided for convenience, but we do recommend that you port your code to
+        natively use ``torchcodec``'s ``AudioDecoder`` class for better
+        performance:
+        https://docs.pytorch.org/torchcodec/stable/generated/torchcodec.decoders.AudioDecoder.
+        Because of the reliance on Torchcodec, the parameters ``normalize``, ``buffer_size``, and
+        ``backend`` are ignored and accepted only for backwards compatibility.
+        To install torchcodec, follow the instructions at https://github.com/pytorch/torchcodec#installing-torchcodec.
+    Args:
+        uri (path-like object or file-like object):
+            Source of audio data. The following types are accepted:
+            * ``path-like``: File path or URL.
+            * ``file-like``: Object with ``read(size: int) -> bytes`` method.
+        frame_offset (int, optional):
+            Number of samples to skip before start reading data.
+        num_frames (int, optional):
+            Maximum number of samples to read. ``-1`` reads all the remaining samples,
+            starting from ``frame_offset``.
+        normalize (bool, optional):
+            TorchCodec always returns normalized float32 samples. This parameter
+            is ignored and a warning is issued if set to False.
+            Default: ``True``.
+        channels_first (bool, optional):
+            When True, the returned Tensor has dimension `[channel, time]`.
+            Otherwise, the returned Tensor's dimension is `[time, channel]`.
+        format (str or None, optional):
+            Format hint for the decoder. May not be supported by all TorchCodec
+            decoders. (Default: ``None``)
+        buffer_size (int, optional):
+            Not used by TorchCodec AudioDecoder. Provided for API compatibility.
+        backend (str or None, optional):
+            Not used by TorchCodec AudioDecoder. Provided for API compatibility.
+    Returns:
+        (torch.Tensor, int): Resulting Tensor and sample rate.
+        Always returns float32 tensors. If ``channels_first=True``, shape is
+        `[channel, time]`, otherwise `[time, channel]`.
+    Raises:
+        ImportError: If torchcodec is not available.
+        ValueError: If unsupported parameters are used.
+        RuntimeError: If TorchCodec fails to decode the audio.
+    Note:
+        - TorchCodec always returns normalized float32 samples, so the ``normalize``
+        parameter has no effect.
+        - The ``buffer_size`` and ``backend`` parameters are ignored.
+        - Not all audio formats supported by torchaudio backends may be supported
+        by TorchCodec.
+    """
+    return load_with_torchcodec(
+        uri,
+        frame_offset=frame_offset,
+        num_frames=num_frames,
+        normalize=normalize,
+        channels_first=channels_first,
+        format=format,
+        buffer_size=buffer_size,
+        backend=backend,
+    )
+def save(
+    uri: Union[str, os.PathLike],
+    src: torch.Tensor,
+    sample_rate: int,
+    channels_first: bool = True,
+    format: Optional[str] = None,
+    encoding: Optional[str] = None,
+    bits_per_sample: Optional[int] = None,
+    buffer_size: int = 4096,
+    backend: Optional[str] = None,
+    compression: Optional[Union[float, int]] = None,
+) -> None:
+    """Save audio data to file using TorchCodec's AudioEncoder.
+    .. note::
+        As of TorchAudio 2.9, this function relies on TorchCodec's encoding capabilities under the hood.
+        It is provided for convenience, but we do recommend that you port your code to
+        natively use ``torchcodec``'s ``AudioEncoder`` class for better
+        performance:
+        https://docs.pytorch.org/torchcodec/stable/generated/torchcodec.encoders.AudioEncoder.
+        Because of the reliance on Torchcodec, the parameters ``format``, ``encoding``,
+        ``bits_per_sample``, ``buffer_size``, and ``backend``, are ignored and accepted only for
+        backwards compatibility.
+        To install torchcodec, follow the instructions at https://github.com/pytorch/torchcodec#installing-torchcodec.
+    Args:
+        uri (path-like object):
+            Path to save the audio file. The file extension determines the format.
+        src (torch.Tensor):
+            Audio data to save. Must be a 1D or 2D tensor with float32 values
+            in the range [-1, 1]. If 2D, shape should be [channel, time] when
+            channels_first=True, or [time, channel] when channels_first=False.
+        sample_rate (int):
+            Sample rate of the audio data.
+        channels_first (bool, optional):
+            Indicates whether the input tensor has channels as the first dimension.
+            If True, expects [channel, time]. If False, expects [time, channel].
+            Default: True.
+        format (str or None, optional):
+            Audio format hint. Not used by TorchCodec (format is determined by
+            file extension). A warning is issued if provided.
+            Default: None.
+        encoding (str or None, optional):
+            Audio encoding. Not fully supported by TorchCodec AudioEncoder.
+            A warning is issued if provided. Default: None.
+        bits_per_sample (int or None, optional):
+            Bits per sample. Not directly supported by TorchCodec AudioEncoder.
+            A warning is issued if provided. Default: None.
+        buffer_size (int, optional):
+            Not used by TorchCodec AudioEncoder. Provided for API compatibility.
+            A warning is issued if not default value. Default: 4096.
+        backend (str or None, optional):
+            Not used by TorchCodec AudioEncoder. Provided for API compatibility.
+            A warning is issued if provided. Default: None.
+        compression (float, int or None, optional):
+            Compression level or bit rate. Maps to bit_rate parameter in
+            TorchCodec AudioEncoder. Default: None.
+    Raises:
+        ImportError: If torchcodec is not available.
+        ValueError: If input parameters are invalid.
+        RuntimeError: If TorchCodec fails to encode the audio.
+    Note:
+        - TorchCodec AudioEncoder expects float32 samples in [-1, 1] range.
+        - Some parameters (format, encoding, bits_per_sample, buffer_size, backend)
+        are not used by TorchCodec but are provided for API compatibility.
+        - The output format is determined by the file extension in the uri.
+        - TorchCodec uses FFmpeg under the hood for encoding.
+    """
+    return save_with_torchcodec(
+        uri,
+        src,
+        sample_rate,
+        channels_first=channels_first,
+        format=format,
+        encoding=encoding,
+        bits_per_sample=bits_per_sample,
+        buffer_size=buffer_size,
+        backend=backend,
+        compression=compression,
+    )
 __all__ = [
-    "AudioMetaData",
     "load",
     "load_with_torchcodec",
     "save_with_torchcodec",
-    "info",
     "save",
-    "io",
     "compliance",
     "datasets",
     "functional",
     "models",
     "pipelines",
-    "kaldi_io",
     "utils",
-    "sox_effects",
     "transforms",
-    "list_audio_backends",
-    "get_audio_backend",
-    "set_audio_backend",
 ]

torchaudio/_extension/__init__.py CHANGED Viewed

@@ -4,7 +4,7 @@ import sys
 from torchaudio._internal.module_utils import fail_with_message, is_module_available, no_op
-from .utils import _check_cuda_version, _init_dll_path, _init_sox, _LazyImporter, _load_lib
+from .utils import _check_cuda_version, _init_dll_path, _load_lib
 _LG = logging.getLogger(__name__)
@@ -17,7 +17,6 @@ __all__ = [
     "_check_cuda_version",
     "_IS_TORCHAUDIO_EXT_AVAILABLE",
     "_IS_RIR_AVAILABLE",
-    "lazy_import_sox_ext",
 ]
@@ -44,18 +43,6 @@ if _IS_TORCHAUDIO_EXT_AVAILABLE:
     _IS_ALIGN_AVAILABLE = torchaudio.lib._torchaudio.is_align_available()
-_SOX_EXT = None
-def lazy_import_sox_ext():
-    """Load SoX integration based on availability in lazy manner"""
-    global _SOX_EXT
-    if _SOX_EXT is None:
-        _SOX_EXT = _LazyImporter("_torchaudio_sox", _init_sox)
-    return _SOX_EXT
 fail_if_no_rir = (
     no_op
     if _IS_RIR_AVAILABLE

torchaudio/_extension/utils.py CHANGED Viewed

@@ -4,14 +4,12 @@ The implementations here should be stateless.
 They should not depend on external state.
 Anything that depends on external state should happen in __init__.py
 """
-import importlib
 import logging
 import os
 import types
 from pathlib import Path
 import torch
-from torchaudio._internal.module_utils import eval_env
 _LG = logging.getLogger(__name__)
 _LIB_DIR = Path(__file__).parent.parent / "lib"
@@ -61,51 +59,6 @@ def _load_lib(lib: str) -> bool:
     return True
-def _import_sox_ext():
-    if os.name == "nt":
-        raise RuntimeError("sox extension is not supported on Windows")
-    if not eval_env("TORCHAUDIO_USE_SOX", True):
-        raise RuntimeError("sox extension is disabled. (TORCHAUDIO_USE_SOX=0)")
-    ext = "torchaudio.lib._torchaudio_sox"
-    if not importlib.util.find_spec(ext):
-        raise RuntimeError(
-            # fmt: off
-            "TorchAudio is not built with sox extension. "
-            "Please build TorchAudio with libsox support. (BUILD_SOX=1)"
-            # fmt: on
-        )
-    _load_lib("libtorchaudio_sox")
-    return importlib.import_module(ext)
-def _init_sox():
-    ext = _import_sox_ext()
-    ext.set_verbosity(0)
-    import atexit
-    torch.ops.torchaudio_sox.initialize_sox_effects()
-    atexit.register(torch.ops.torchaudio_sox.shutdown_sox_effects)
-    # Bundle functions registered with TORCH_LIBRARY into extension
-    # so that they can also be accessed in the same (lazy) manner
-    # from the extension.
-    keys = [
-        "get_info",
-        "load_audio_file",
-        "save_audio_file",
-        "apply_effects_tensor",
-        "apply_effects_file",
-    ]
-    for key in keys:
-        setattr(ext, key, getattr(torch.ops.torchaudio_sox, key))
-    return ext
 class _LazyImporter(types.ModuleType):
     """Lazily import module/extension."""

torchaudio/_internal/module_utils.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import importlib.util
 import os
 import warnings
-from functools import wraps, partial
+from functools import partial, wraps
 from typing import Optional
@@ -59,8 +59,10 @@ def requires_module(*modules: str):
     return decorator
 UNSUPPORTED = []
 def wrap_deprecated(func, name, direction: str, version: Optional[str] = None, remove: bool = False):
     @wraps(func)
     def wrapped(*args, **kwargs):
@@ -69,8 +71,10 @@ def wrap_deprecated(func, name, direction: str, version: Optional[str] = None, r
             message += f' It will be removed from {"a future" if version is None else "the " + str(version)} release. '
         warnings.warn(message, stacklevel=2)
         return func(*args, **kwargs)
     return wrapped
 def deprecated(direction: str, version: Optional[str] = None, remove: bool = False):
     """Decorator to add deprecation message
@@ -97,11 +101,11 @@ def deprecated(direction: str, version: Optional[str] = None, remove: bool = Fal
     {func.__doc__}
     """
-        UNSUPPORTED.append(wrapped)
         return wrapped
     return decorator
 DEPRECATION_MSG = (
     "This deprecation is part of a large refactoring effort to transition TorchAudio into a maintenance phase. "
     "Please see https://github.com/pytorch/audio/issues/3902 for more information."
@@ -109,12 +113,14 @@ DEPRECATION_MSG = (
 IO_DEPRECATION_MSG = (
     "This deprecation is part of a large refactoring effort to transition TorchAudio into a maintenance phase. "
-    "The decoding and encoding capabilities of PyTorch for both audio and video are being consolidated into TorchCodec. "
+    "The decoding and encoding capabilities of PyTorch for both audio"
+    " and video are being consolidated into TorchCodec. "
     "Please see https://github.com/pytorch/audio/issues/3902 for more information."
 )
 dropping_support = deprecated(DEPRECATION_MSG, version="2.9", remove=True)
 def dropping_class_support(c, msg=DEPRECATION_MSG):
     c.__init__ = wrap_deprecated(c.__init__, f"{c.__module__}.{c.__name__}", msg, version="2.9", remove=True)
     c.__doc__ = f"""DEPRECATED
@@ -129,6 +135,7 @@ def dropping_class_support(c, msg=DEPRECATION_MSG):
     UNSUPPORTED.append(c)
     return c
 def dropping_const_support(c, msg=DEPRECATION_MSG, name=None):
     c.__doc__ = f"""[DEPRECATED]
@@ -140,10 +147,12 @@ def dropping_const_support(c, msg=DEPRECATION_MSG, name=None):
     """
     return c
 dropping_class_io_support = partial(dropping_class_support, msg=IO_DEPRECATION_MSG)
 dropping_io_support = deprecated(IO_DEPRECATION_MSG, version="2.9", remove=True)
 def fail_with_message(message):
     """Generate decorator to give users message about missing TorchAudio extension."""