PyPI - sonusai - Versions diffs - 0.18.9__py3-none-any.whl → 0.19.5__py3-none-any.whl - Mend

sonusai 0.18.9py3-none-any.whl → 0.19.5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (118) hide show

sonusai/__init__.py +20 -29
sonusai/aawscd_probwrite.py +18 -18
sonusai/audiofe.py +93 -80
sonusai/calc_metric_spenh.py +395 -321
sonusai/data/genmixdb.yml +5 -11
sonusai/{gentcst.py → deprecated/gentcst.py} +146 -149
sonusai/{plot.py → deprecated/plot.py} +177 -131
sonusai/{tplot.py → deprecated/tplot.py} +124 -102
sonusai/doc/__init__.py +1 -1
sonusai/doc/doc.py +112 -177
sonusai/doc.py +10 -10
sonusai/genft.py +93 -77
sonusai/genmetrics.py +59 -46
sonusai/genmix.py +116 -104
sonusai/genmixdb.py +194 -153
sonusai/lsdb.py +56 -66
sonusai/main.py +23 -20
sonusai/metrics/__init__.py +2 -0
sonusai/metrics/calc_audio_stats.py +29 -24
sonusai/metrics/calc_class_weights.py +7 -7
sonusai/metrics/calc_optimal_thresholds.py +5 -7
sonusai/metrics/calc_pcm.py +3 -3
sonusai/metrics/calc_pesq.py +10 -7
sonusai/metrics/calc_phase_distance.py +3 -3
sonusai/metrics/calc_sa_sdr.py +10 -8
sonusai/metrics/calc_segsnr_f.py +15 -17
sonusai/metrics/calc_speech.py +105 -47
sonusai/metrics/calc_wer.py +35 -32
sonusai/metrics/calc_wsdr.py +10 -7
sonusai/metrics/class_summary.py +30 -27
sonusai/metrics/confusion_matrix_summary.py +25 -22
sonusai/metrics/one_hot.py +91 -57
sonusai/metrics/snr_summary.py +53 -46
sonusai/mixture/__init__.py +19 -14
sonusai/mixture/audio.py +4 -6
sonusai/mixture/augmentation.py +37 -43
sonusai/mixture/class_count.py +5 -14
sonusai/mixture/config.py +292 -225
sonusai/mixture/constants.py +41 -30
sonusai/mixture/data_io.py +155 -0
sonusai/mixture/datatypes.py +111 -108
sonusai/mixture/db_datatypes.py +54 -70
sonusai/mixture/eq_rule_is_valid.py +6 -9
sonusai/mixture/feature.py +40 -38
sonusai/mixture/generation.py +522 -389
sonusai/mixture/helpers.py +217 -272
sonusai/mixture/log_duration_and_sizes.py +16 -13
sonusai/mixture/mixdb.py +669 -477
sonusai/mixture/soundfile_audio.py +12 -17
sonusai/mixture/sox_audio.py +91 -112
sonusai/mixture/sox_augmentation.py +8 -9
sonusai/mixture/spectral_mask.py +4 -6
sonusai/mixture/target_class_balancing.py +41 -36
sonusai/mixture/targets.py +69 -67
sonusai/mixture/tokenized_shell_vars.py +23 -23
sonusai/mixture/torchaudio_audio.py +14 -15
sonusai/mixture/torchaudio_augmentation.py +23 -27
sonusai/mixture/truth.py +48 -26
sonusai/mixture/truth_functions/__init__.py +26 -0
sonusai/mixture/truth_functions/crm.py +56 -38
sonusai/mixture/truth_functions/datatypes.py +37 -0
sonusai/mixture/truth_functions/energy.py +85 -59
sonusai/mixture/truth_functions/file.py +30 -30
sonusai/mixture/truth_functions/phoneme.py +14 -7
sonusai/mixture/truth_functions/sed.py +71 -45
sonusai/mixture/truth_functions/target.py +69 -106
sonusai/mkwav.py +52 -85
sonusai/onnx_predict.py +46 -43
sonusai/queries/__init__.py +3 -1
sonusai/queries/queries.py +100 -59
sonusai/speech/__init__.py +2 -0
sonusai/speech/l2arctic.py +24 -23
sonusai/speech/librispeech.py +16 -17
sonusai/speech/mcgill.py +22 -21
sonusai/speech/textgrid.py +32 -25
sonusai/speech/timit.py +45 -42
sonusai/speech/vctk.py +14 -13
sonusai/speech/voxceleb.py +26 -20
sonusai/summarize_metric_spenh.py +11 -10
sonusai/utils/__init__.py +4 -3
sonusai/utils/asl_p56.py +1 -1
sonusai/utils/asr.py +37 -17
sonusai/utils/asr_functions/__init__.py +2 -0
sonusai/utils/asr_functions/aaware_whisper.py +18 -12
sonusai/utils/audio_devices.py +12 -12
sonusai/utils/braced_glob.py +6 -8
sonusai/utils/calculate_input_shape.py +1 -4
sonusai/utils/compress.py +2 -2
sonusai/utils/convert_string_to_number.py +1 -3
sonusai/utils/create_timestamp.py +1 -1
sonusai/utils/create_ts_name.py +2 -2
sonusai/utils/dataclass_from_dict.py +1 -1
sonusai/utils/docstring.py +6 -6
sonusai/utils/energy_f.py +9 -7
sonusai/utils/engineering_number.py +56 -54
sonusai/utils/get_label_names.py +8 -10
sonusai/utils/human_readable_size.py +2 -2
sonusai/utils/model_utils.py +3 -5
sonusai/utils/numeric_conversion.py +2 -4
sonusai/utils/onnx_utils.py +43 -32
sonusai/utils/parallel.py +40 -27
sonusai/utils/print_mixture_details.py +25 -22
sonusai/utils/ranges.py +12 -12
sonusai/utils/read_predict_data.py +11 -9
sonusai/utils/reshape.py +19 -26
sonusai/utils/seconds_to_hms.py +1 -1
sonusai/utils/stacked_complex.py +8 -16
sonusai/utils/stratified_shuffle_split.py +29 -27
sonusai/utils/write_audio.py +2 -2
sonusai/utils/yes_or_no.py +3 -3
sonusai/vars.py +14 -14
{sonusai-0.18.9.dist-info → sonusai-0.19.5.dist-info}/METADATA +20 -21
sonusai-0.19.5.dist-info/RECORD +125 -0
{sonusai-0.18.9.dist-info → sonusai-0.19.5.dist-info}/WHEEL +1 -1
sonusai/mixture/truth_functions/data.py +0 -58
sonusai/utils/read_mixture_data.py +0 -14
sonusai-0.18.9.dist-info/RECORD +0 -125
{sonusai-0.18.9.dist-info → sonusai-0.19.5.dist-info}/entry_points.txt +0 -0

sonusai/mixture/target_class_balancing.py CHANGED Viewed

@@ -5,14 +5,15 @@ from sonusai.mixture.datatypes import TargetFile
 from sonusai.mixture.datatypes import TargetFiles
-def balance_targets(augmented_targets: AugmentedTargets,
-                    targets: TargetFiles,
-                    target_augmentations: AugmentationRules,
-                    class_balancing_augmentation: AugmentationRule,
-                    num_classes: int,
-                    truth_mutex: bool,
-                    num_ir: int,
-                    mixups: list[int] = None) -> tuple[AugmentedTargets, AugmentationRules]:
+def balance_targets(
+    augmented_targets: AugmentedTargets,
+    targets: TargetFiles,
+    target_augmentations: AugmentationRules,
+    class_balancing_augmentation: AugmentationRule,
+    num_classes: int,
+    num_ir: int,
+    mixups: list[int] | None = None,
+) -> tuple[AugmentedTargets, AugmentationRules]:
     import math
     from .augmentation import get_mixups
@@ -34,14 +35,13 @@ def balance_targets(augmented_targets: AugmentedTargets,
             target_augmentations=target_augmentations,
             mixup=mixup,
             num_classes=num_classes,
-            truth_mutex=truth_mutex)
+        )
         largest = max([len(item) for item in augmented_target_indices_by_class])
         largest = math.ceil(largest / mixup) * mixup
         for at_indices in augmented_target_indices_by_class:
             additional_augmentations_needed = largest - len(at_indices)
-            target_ids = sorted(
-                list(set([augmented_targets[at_index].target_id for at_index in at_indices])))
+            target_ids = sorted({augmented_targets[at_index].target_id for at_index in at_indices})
             tfi_idx = 0
             for _ in range(additional_augmentations_needed):
@@ -55,50 +55,55 @@ def balance_targets(augmented_targets: AugmentedTargets,
                     target_id=target_id,
                     mixup=mixup,
                     num_ir=num_ir,
-                    first_cba_id=first_cba_id)
-                augmented_target = AugmentedTarget(target_id=target_id,
-                                                   target_augmentation_id=augmentation_index)
+                    first_cba_id=first_cba_id,
+                )
+                augmented_target = AugmentedTarget(target_id=target_id, target_augmentation_id=augmentation_index)
                 augmented_targets.append(augmented_target)
     return augmented_targets, target_augmentations
-def _get_unused_balancing_augmentation(augmented_targets: AugmentedTargets,
-                                       targets: TargetFiles,
-                                       target_augmentations: AugmentationRules,
-                                       class_balancing_augmentation: AugmentationRule,
-                                       target_id: int,
-                                       mixup: int,
-                                       num_ir: int,
-                                       first_cba_id: int) -> tuple[int, AugmentationRules]:
-    """Get an unused balancing augmentation for a given target file index
-    """
+def _get_unused_balancing_augmentation(
+    augmented_targets: AugmentedTargets,
+    targets: TargetFiles,
+    target_augmentations: AugmentationRules,
+    class_balancing_augmentation: AugmentationRule,
+    target_id: int,
+    mixup: int,
+    num_ir: int,
+    first_cba_id: int,
+) -> tuple[int, AugmentationRules]:
+    """Get an unused balancing augmentation for a given target file index"""
     from dataclasses import asdict
     from .augmentation import get_augmentation_rules
     balancing_augmentations = [item for item in range(len(target_augmentations)) if item >= first_cba_id]
-    used_balancing_augmentations = [at.target_augmentation_id for at in augmented_targets if
-                                    at.target_id == target_id and
-                                    at.target_augmentation_id in balancing_augmentations]
-    augmentation_indices = [item for item in balancing_augmentations if
-                            item not in used_balancing_augmentations and
-                            target_augmentations[item].mixup == mixup]
+    used_balancing_augmentations = [
+        at.target_augmentation_id
+        for at in augmented_targets
+        if at.target_id == target_id and at.target_augmentation_id in balancing_augmentations
+    ]
+    augmentation_indices = [
+        item
+        for item in balancing_augmentations
+        if item not in used_balancing_augmentations and target_augmentations[item].mixup == mixup
+    ]
     if len(augmentation_indices) > 0:
         return augmentation_indices[0], target_augmentations
-    class_balancing_augmentation = get_class_balancing_augmentation(target=targets[target_id],
-                                                                    default_cba=class_balancing_augmentation)
+    class_balancing_augmentation = get_class_balancing_augmentation(
+        target=targets[target_id], default_cba=class_balancing_augmentation
+    )
     new_augmentation = get_augmentation_rules(rules=asdict(class_balancing_augmentation), num_ir=num_ir)[0]
     new_augmentation.mixup = mixup
     target_augmentations.append(new_augmentation)
     return len(target_augmentations) - 1, target_augmentations
-def get_class_balancing_augmentation(target: TargetFile, default_cba: AugmentationRule) -> AugmentationRule | None:
-    """ Get the class balancing augmentation rule for the given target
-    """
+def get_class_balancing_augmentation(target: TargetFile, default_cba: AugmentationRule) -> AugmentationRule:
+    """Get the class balancing augmentation rule for the given target"""
     if target.class_balancing_augmentation is not None:
         return target.class_balancing_augmentation
     return default_cba

sonusai/mixture/targets.py CHANGED Viewed

@@ -1,13 +1,14 @@
 from sonusai.mixture.datatypes import AugmentationRules
 from sonusai.mixture.datatypes import AugmentedTarget
 from sonusai.mixture.datatypes import AugmentedTargets
-from sonusai.mixture.datatypes import TargetFile
 from sonusai.mixture.datatypes import TargetFiles
-def get_augmented_targets(target_files: TargetFiles,
-                          target_augmentations: AugmentationRules,
-                          mixups: list[int] = None) -> AugmentedTargets:
+def get_augmented_targets(
+    target_files: TargetFiles,
+    target_augmentations: AugmentationRules,
+    mixups: list[int] | None = None,
+) -> AugmentedTargets:
     from .augmentation import get_augmentation_indices_for_mixup
     from .augmentation import get_mixups
@@ -19,85 +20,82 @@ def get_augmented_targets(target_files: TargetFiles,
         augmentation_indices = get_augmentation_indices_for_mixup(target_augmentations, mixup)
         for target_index in range(len(target_files)):
             for augmentation_index in augmentation_indices:
-                augmented_targets.append(AugmentedTarget(target_id=target_index,
-                                                         target_augmentation_id=augmentation_index))
+                augmented_targets.append(
+                    AugmentedTarget(
+                        target_id=target_index,
+                        target_augmentation_id=augmentation_index,
+                    )
+                )
     return augmented_targets
-def get_truth_indices_for_target(target: TargetFile) -> list[int]:
-    """Get a list of truth indices for a given target."""
-    index = [truth_setting.index for truth_setting in target.truth_settings]
-    # flatten, uniquify, and sort
-    return sorted(list(set([item for sublist in index for item in sublist])))
-def get_truth_indices_for_augmented_target(augmented_target: AugmentedTarget, targets: TargetFiles) -> list[int]:
-    return get_truth_indices_for_target(targets[augmented_target.target_id])
+def get_class_index_for_augmented_target(augmented_target: AugmentedTarget, targets: TargetFiles) -> list[int]:
+    return targets[augmented_target.target_id].class_indices
 def get_mixup_for_augmented_target(augmented_target: AugmentedTarget, augmentations: AugmentationRules) -> int:
     return augmentations[augmented_target.target_augmentation_id].mixup
-def get_target_ids_for_truth_index(targets: TargetFiles,
-                                   truth_index: int,
-                                   allow_multiple: bool = False) -> list[int]:
-    """Get a list of target indices containing the given truth index.
+def get_target_ids_for_class_index(targets: TargetFiles, class_index: int, allow_multiple: bool = False) -> list[int]:
+    """Get a list of target indices containing the given class index.
-    If allow_multiple is True, then include targets that contain multiple truth indices.
+    If allow_multiple is True, then include targets that contain multiple class indices.
     """
     target_indices = set()
     for target_index, target in enumerate(targets):
-        indices = get_truth_indices_for_target(target)
+        indices = target.class_indices
         if len(indices) == 1 or allow_multiple:
             for index in indices:
-                if index == truth_index + 1:
+                if index == class_index + 1:
                     target_indices.add(target_index)
-    return sorted(list(target_indices))
+    return sorted(target_indices)
-def get_augmented_target_ids_for_truth_index(augmented_targets: AugmentedTargets,
-                                             targets: TargetFiles,
-                                             augmentations: AugmentationRules,
-                                             truth_index: int,
-                                             mixup: int,
-                                             allow_multiple: bool = False) -> list[int]:
-    """Get a list of augmented target indices containing the given truth index.
+def get_augmented_target_ids_for_class_index(
+    augmented_targets: AugmentedTargets,
+    targets: TargetFiles,
+    augmentations: AugmentationRules,
+    class_index: int,
+    mixup: int,
+    allow_multiple: bool = False,
+) -> list[int]:
+    """Get a list of augmented target indices containing the given class index.
-    If allow_multiple is True, then include targets that contain multiple truth indices.
+    If allow_multiple is True, then include targets that contain multiple class indices.
     """
     augmented_target_ids = set()
     for augmented_target_id, augmented_target in enumerate(augmented_targets):
         if get_mixup_for_augmented_target(augmented_target=augmented_target, augmentations=augmentations) == mixup:
-            indices = get_truth_indices_for_augmented_target(augmented_target=augmented_target, targets=targets)
+            indices = get_class_index_for_augmented_target(augmented_target=augmented_target, targets=targets)
             if len(indices) == 1 or allow_multiple:
                 for index in indices:
-                    if index == truth_index + 1:
+                    if index == class_index + 1:
                         augmented_target_ids.add(augmented_target_id)
-    return sorted(list(augmented_target_ids))
+    return sorted(augmented_target_ids)
-def get_augmented_target_ids_by_class(augmented_targets: AugmentedTargets,
-                                      targets: TargetFiles,
-                                      target_augmentations: AugmentationRules,
-                                      mixup: int,
-                                      num_classes: int,
-                                      truth_mutex: bool) -> list[list[int]]:
-    if truth_mutex:
-        num_classes -= 1
+def get_augmented_target_ids_by_class(
+    augmented_targets: AugmentedTargets,
+    targets: TargetFiles,
+    target_augmentations: AugmentationRules,
+    mixup: int,
+    num_classes: int,
+) -> list[list[int]]:
     indices = []
     for idx in range(num_classes):
         indices.append(
-            get_augmented_target_ids_for_truth_index(augmented_targets=augmented_targets,
-                                                     targets=targets,
-                                                     augmentations=target_augmentations,
-                                                     truth_index=idx,
-                                                     mixup=mixup))
+            get_augmented_target_ids_for_class_index(
+                augmented_targets=augmented_targets,
+                targets=targets,
+                augmentations=target_augmentations,
+                class_index=idx,
+                mixup=mixup,
+            )
+        )
     return indices
@@ -111,36 +109,40 @@ def get_target_augmentations_for_mixup(target_augmentations: AugmentationRules,
     return [target_augmentation for target_augmentation in target_augmentations if target_augmentation.mixup == mixup]
-def get_augmented_target_ids_for_mixup(augmented_targets: AugmentedTargets,
-                                       targets: TargetFiles,
-                                       target_augmentations: AugmentationRules,
-                                       mixup: int,
-                                       num_classes: int,
-                                       truth_mutex: bool) -> list[list[int]]:
+def get_augmented_target_ids_for_mixup(
+    augmented_targets: AugmentedTargets,
+    targets: TargetFiles,
+    target_augmentations: AugmentationRules,
+    mixup: int,
+    num_classes: int,
+) -> list[list[int]]:
     from collections import deque
     from random import shuffle
-    from sonusai import SonusAIError
     mixup_indices = []
     if mixup == 1:
         for index, augmented_target in enumerate(augmented_targets):
-            if get_mixup_for_augmented_target(augmented_target=augmented_target,
-                                              augmentations=target_augmentations) == 1:
+            if (
+                get_mixup_for_augmented_target(
+                    augmented_target=augmented_target,
+                    augmentations=target_augmentations,
+                )
+                == 1
+            ):
                 mixup_indices.append([index])
         return mixup_indices
-    augmented_target_ids_by_class = get_augmented_target_ids_by_class(augmented_targets=augmented_targets,
-                                                                      targets=targets,
-                                                                      target_augmentations=target_augmentations,
-                                                                      mixup=mixup,
-                                                                      num_classes=num_classes,
-                                                                      truth_mutex=truth_mutex)
+    augmented_target_ids_by_class = get_augmented_target_ids_by_class(
+        augmented_targets=augmented_targets,
+        targets=targets,
+        target_augmentations=target_augmentations,
+        mixup=mixup,
+        num_classes=num_classes,
+    )
     if mixup > num_classes:
-        raise SonusAIError(
-            f'Specified mixup, {mixup}, is greater than the number of classes, {num_classes}')
+        raise ValueError(f"Specified mixup, {mixup}, is greater than the number of classes, {num_classes}")
     de: deque[int] = deque()

sonusai/mixture/tokenized_shell_vars.py CHANGED Viewed

@@ -23,10 +23,10 @@ def tokenized_expand(name: str | bytes | Path) -> tuple[str, dict[str, str]]:
     from .constants import DEFAULT_NOISE
-    os.environ['default_noise'] = str(DEFAULT_NOISE)
+    os.environ["default_noise"] = str(DEFAULT_NOISE)  # noqa: SIM112
     if isinstance(name, bytes):
-        name = name.decode('utf-8')
+        name = name.decode("utf-8")
     if isinstance(name, Path):
         name = name.as_posix()
@@ -34,37 +34,37 @@ def tokenized_expand(name: str | bytes | Path) -> tuple[str, dict[str, str]]:
     name = os.fspath(name)
     token_map: dict = {}
-    if '$' not in name and '%' not in name:
+    if "$" not in name and "%" not in name:
         return name, token_map
-    var_chars = string.ascii_letters + string.digits + '_-'
-    quote = '\''
-    percent = '%'
-    brace = '{'
-    rbrace = '}'
-    dollar = '$'
+    var_chars = string.ascii_letters + string.digits + "_-"
+    quote = "'"
+    percent = "%"
+    brace = "{"
+    rbrace = "}"
+    dollar = "$"
     environ = os.environ
     result = name[:0]
     index = 0
     path_len = len(name)
     while index < path_len:
-        c = name[index:index + 1]
+        c = name[index : index + 1]
         if c == quote:  # no expansion within single quotes
-            name = name[index + 1:]
+            name = name[index + 1 :]
             path_len = len(name)
             try:
                 index = name.index(c)
-                result += c + name[:index + 1]
+                result += c + name[: index + 1]
             except ValueError:
                 result += c + name
                 index = path_len - 1
         elif c == percent:  # variable or '%'
-            if name[index + 1:index + 2] == percent:
+            if name[index + 1 : index + 2] == percent:
                 result += c
                 index += 1
             else:
-                name = name[index + 1:]
+                name = name[index + 1 :]
                 path_len = len(name)
                 try:
                     index = name.index(percent)
@@ -75,7 +75,7 @@ def tokenized_expand(name: str | bytes | Path) -> tuple[str, dict[str, str]]:
                     var = name[:index]
                     try:
                         if environ is None:
-                            value = os.fsencode(os.environ[os.fsdecode(var)]).decode('utf-8')
+                            value = os.fsencode(os.environ[os.fsdecode(var)]).decode("utf-8")  # type: ignore[unreachable]
                         else:
                             value = environ[var]
                         token_map[var] = value
@@ -83,11 +83,11 @@ def tokenized_expand(name: str | bytes | Path) -> tuple[str, dict[str, str]]:
                         value = percent + var + percent
                     result += value
         elif c == dollar:  # variable or '$$'
-            if name[index + 1:index + 2] == dollar:
+            if name[index + 1 : index + 2] == dollar:
                 result += c
                 index += 1
-            elif name[index + 1:index + 2] == brace:
-                name = name[index + 2:]
+            elif name[index + 1 : index + 2] == brace:
+                name = name[index + 2 :]
                 path_len = len(name)
                 try:
                     index = name.index(rbrace)
@@ -98,7 +98,7 @@ def tokenized_expand(name: str | bytes | Path) -> tuple[str, dict[str, str]]:
                     var = name[:index]
                     try:
                         if environ is None:
-                            value = os.fsencode(os.environ[os.fsdecode(var)]).decode('utf-8')
+                            value = os.fsencode(os.environ[os.fsdecode(var)]).decode("utf-8")  # type: ignore[unreachable]
                         else:
                             value = environ[var]
                         token_map[var] = value
@@ -108,14 +108,14 @@ def tokenized_expand(name: str | bytes | Path) -> tuple[str, dict[str, str]]:
             else:
                 var = name[:0]
                 index += 1
-                c = name[index:index + 1]
+                c = name[index : index + 1]
                 while c and c in var_chars:
                     var += c
                     index += 1
-                    c = name[index:index + 1]
+                    c = name[index : index + 1]
                 try:
                     if environ is None:
-                        value = os.fsencode(os.environ[os.fsdecode(var)]).decode('utf-8')
+                        value = os.fsencode(os.environ[os.fsdecode(var)]).decode("utf-8")  # type: ignore[unreachable]
                     else:
                         value = environ[var]
                     token_map[var] = value
@@ -139,5 +139,5 @@ def tokenized_replace(name: str, tokens: dict[str, str]) -> str:
     :return: replaced string
     """
     for key, value in tokens.items():
-        name = name.replace(value, f'${key}')
+        name = name.replace(value, f"${key}")
     return name

sonusai/mixture/torchaudio_audio.py CHANGED Viewed

@@ -14,19 +14,18 @@ def read_impulse_response(name: str | Path) -> ImpulseResponseData:
     import torch
     import torchaudio
-    from sonusai import SonusAIError
     from .tokenized_shell_vars import tokenized_expand
     expanded_name, _ = tokenized_expand(name)
     # Read impulse response data from audio file
     try:
-        raw, sample_rate = torchaudio.load(expanded_name, backend='soundfile')
+        raw, sample_rate = torchaudio.load(expanded_name, backend="soundfile")
     except Exception as e:
         if name != expanded_name:
-            raise SonusAIError(f'Error reading {name} (expanded: {expanded_name}): {e}')
+            raise OSError(f"Error reading {name} (expanded: {expanded_name}): {e}") from e
         else:
-            raise SonusAIError(f'Error reading {name}: {e}')
+            raise OSError(f"Error reading {name}: {e}") from e
     raw = torch.squeeze(raw[0, :])
     offset = torch.argmax(raw)
@@ -49,7 +48,6 @@ def get_sample_rate(name: str | Path) -> int:
     """
     import torchaudio
-    from sonusai import SonusAIError
     from .tokenized_shell_vars import tokenized_expand
     expanded_name, _ = tokenized_expand(name)
@@ -58,9 +56,9 @@ def get_sample_rate(name: str | Path) -> int:
         return torchaudio.info(expanded_name).sample_rate
     except Exception as e:
         if name != expanded_name:
-            raise SonusAIError(f'Error reading {name} (expanded: {expanded_name}):\n{e}')
+            raise OSError(f"Error reading {name} (expanded: {expanded_name}):\n{e}") from e
         else:
-            raise SonusAIError(f'Error reading {name}:\n{e}')
+            raise OSError(f"Error reading {name}:\n{e}") from e
 def read_audio(name: str | Path) -> AudioT:
@@ -73,24 +71,25 @@ def read_audio(name: str | Path) -> AudioT:
     import torch
     import torchaudio
-    from sonusai import SonusAIError
     from .constants import SAMPLE_RATE
     from .tokenized_shell_vars import tokenized_expand
     expanded_name, _ = tokenized_expand(name)
     try:
-        out, samplerate = torchaudio.load(expanded_name, backend='soundfile')
+        out, samplerate = torchaudio.load(expanded_name, backend="soundfile")
         out = torch.reshape(out[0, :], (1, out.size()[1]))
-        out = torchaudio.functional.resample(out,
-                                             orig_freq=samplerate,
-                                             new_freq=SAMPLE_RATE,
-                                             resampling_method='sinc_interp_hann')
+        out = torchaudio.functional.resample(
+            out,
+            orig_freq=samplerate,
+            new_freq=SAMPLE_RATE,
+            resampling_method="sinc_interp_hann",
+        )
     except Exception as e:
         if name != expanded_name:
-            raise SonusAIError(f'Error reading {name} (expanded: {expanded_name}):\n{e}')
+            raise OSError(f"Error reading {name} (expanded: {expanded_name}):\n{e}") from e
         else:
-            raise SonusAIError(f'Error reading {name}:\n{e}')
+            raise OSError(f"Error reading {name}:\n{e}") from e
     result = np.squeeze(np.array(out))
     return result

sonusai/mixture/torchaudio_augmentation.py CHANGED Viewed

@@ -3,9 +3,7 @@ from sonusai.mixture.datatypes import Augmentation
 from sonusai.mixture.datatypes import ImpulseResponseData
-def apply_augmentation(audio: AudioT,
-                       augmentation: Augmentation,
-                       frame_length: int = 1) -> AudioT:
+def apply_augmentation(audio: AudioT, augmentation: Augmentation, frame_length: int = 1) -> AudioT:
     """Apply augmentations to audio data using torchaudio.sox_effects
     :param audio: Audio
@@ -17,7 +15,6 @@ def apply_augmentation(audio: AudioT,
     import torch
     import torchaudio
-    from sonusai import SonusAIError
     from .augmentation import pad_audio_to_frame
     from .constants import SAMPLE_RATE
@@ -28,29 +25,29 @@ def apply_augmentation(audio: AudioT,
     #  Normalize to globally set level (should this be a global config parameter,
     #  or hard-coded into the script?)
     if augmentation.normalize is not None:
-        effects.append(['norm', str(augmentation.normalize)])
+        effects.append(["norm", str(augmentation.normalize)])
     if augmentation.gain is not None:
-        effects.append(['gain', str(augmentation.gain)])
+        effects.append(["gain", str(augmentation.gain)])
     if augmentation.pitch is not None:
-        effects.append(['pitch', str(augmentation.pitch)])
-        effects.append(['rate', str(SAMPLE_RATE)])
+        effects.append(["pitch", str(augmentation.pitch)])
+        effects.append(["rate", str(SAMPLE_RATE)])
     if augmentation.tempo is not None:
-        effects.append(['tempo', '-s', str(augmentation.tempo)])
+        effects.append(["tempo", "-s", str(augmentation.tempo)])
     if augmentation.eq1 is not None:
-        effects.append(['equalizer', *[str(item) for item in augmentation.eq1]])
+        effects.append(["equalizer", *[str(item) for item in augmentation.eq1]])
     if augmentation.eq2 is not None:
-        effects.append(['equalizer', *[str(item) for item in augmentation.eq2]])
+        effects.append(["equalizer", *[str(item) for item in augmentation.eq2]])
     if augmentation.eq3 is not None:
-        effects.append(['equalizer', *[str(item) for item in augmentation.eq3]])
+        effects.append(["equalizer", *[str(item) for item in augmentation.eq3]])
     if augmentation.lpf is not None:
-        effects.append(['lowpass', '-2', str(augmentation.lpf), '0.707'])
+        effects.append(["lowpass", "-2", str(augmentation.lpf), "0.707"])
     if effects:
         if audio.ndim == 1:
@@ -58,11 +55,9 @@ def apply_augmentation(audio: AudioT,
         out = torch.tensor(audio)
         try:
-            out, _ = torchaudio.sox_effects.apply_effects_tensor(out,
-                                                                 sample_rate=SAMPLE_RATE,
-                                                                 effects=effects)
+            out, _ = torchaudio.sox_effects.apply_effects_tensor(out, sample_rate=SAMPLE_RATE, effects=effects)
         except Exception as e:
-            raise SonusAIError(f'Error applying {augmentation}: {e}')
+            raise RuntimeError(f"Error applying {augmentation}: {e}") from e
         audio_out = np.squeeze(np.array(out))
     else:
@@ -84,6 +79,7 @@ def apply_impulse_response(audio: AudioT, ir: ImpulseResponseData) -> AudioT:
     import torchaudio
     from sonusai.utils import linear_to_db
     from .constants import SAMPLE_RATE
     # Early exit if no ir or if all audio is zero
@@ -95,20 +91,20 @@ def apply_impulse_response(audio: AudioT, ir: ImpulseResponseData) -> AudioT:
     # Convert audio to IR sample rate
     audio_in = torch.reshape(torch.tensor(audio), (1, len(audio)))
-    audio_out, sr = torchaudio.sox_effects.apply_effects_tensor(audio_in,
-                                                                sample_rate=SAMPLE_RATE,
-                                                                effects=[['rate', str(ir.sample_rate)]])
+    audio_out, sr = torchaudio.sox_effects.apply_effects_tensor(
+        audio_in, sample_rate=SAMPLE_RATE, effects=[["rate", str(ir.sample_rate)]]
+    )
     # Apply IR and convert back to global sample rate
     rir = torch.reshape(torch.tensor(ir.data), (1, len(ir.data)))
     audio_out = torchaudio.functional.fftconvolve(audio_out, rir)
-    audio_out, sr = torchaudio.sox_effects.apply_effects_tensor(audio_out,
-                                                                sample_rate=ir.sample_rate,
-                                                                effects=[['rate', str(SAMPLE_RATE)]])
+    audio_out, sr = torchaudio.sox_effects.apply_effects_tensor(
+        audio_out, sample_rate=ir.sample_rate, effects=[["rate", str(SAMPLE_RATE)]]
+    )
     # Reset level to previous max value
-    audio_out, sr = torchaudio.sox_effects.apply_effects_tensor(audio_out,
-                                                                sample_rate=SAMPLE_RATE,
-                                                                effects=[['norm', str(max_db)]])
+    audio_out, sr = torchaudio.sox_effects.apply_effects_tensor(
+        audio_out, sample_rate=SAMPLE_RATE, effects=[["norm", str(max_db)]]
+    )
-    return np.squeeze(np.array(audio_out[:, :len(audio)]))
+    return np.squeeze(np.array(audio_out[:, : len(audio)]))

sonusai 0.18.9__py3-none-any.whl → 0.19.5__py3-none-any.whl

sonusai 0.18.9py3-none-any.whl → 0.19.5py3-none-any.whl