PyPI - sonusai - Versions diffs - 0.18.9__py3-none-any.whl → 0.19.5__py3-none-any.whl - Mend

sonusai 0.18.9py3-none-any.whl → 0.19.5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (118) hide show

sonusai/__init__.py +20 -29
sonusai/aawscd_probwrite.py +18 -18
sonusai/audiofe.py +93 -80
sonusai/calc_metric_spenh.py +395 -321
sonusai/data/genmixdb.yml +5 -11
sonusai/{gentcst.py → deprecated/gentcst.py} +146 -149
sonusai/{plot.py → deprecated/plot.py} +177 -131
sonusai/{tplot.py → deprecated/tplot.py} +124 -102
sonusai/doc/__init__.py +1 -1
sonusai/doc/doc.py +112 -177
sonusai/doc.py +10 -10
sonusai/genft.py +93 -77
sonusai/genmetrics.py +59 -46
sonusai/genmix.py +116 -104
sonusai/genmixdb.py +194 -153
sonusai/lsdb.py +56 -66
sonusai/main.py +23 -20
sonusai/metrics/__init__.py +2 -0
sonusai/metrics/calc_audio_stats.py +29 -24
sonusai/metrics/calc_class_weights.py +7 -7
sonusai/metrics/calc_optimal_thresholds.py +5 -7
sonusai/metrics/calc_pcm.py +3 -3
sonusai/metrics/calc_pesq.py +10 -7
sonusai/metrics/calc_phase_distance.py +3 -3
sonusai/metrics/calc_sa_sdr.py +10 -8
sonusai/metrics/calc_segsnr_f.py +15 -17
sonusai/metrics/calc_speech.py +105 -47
sonusai/metrics/calc_wer.py +35 -32
sonusai/metrics/calc_wsdr.py +10 -7
sonusai/metrics/class_summary.py +30 -27
sonusai/metrics/confusion_matrix_summary.py +25 -22
sonusai/metrics/one_hot.py +91 -57
sonusai/metrics/snr_summary.py +53 -46
sonusai/mixture/__init__.py +19 -14
sonusai/mixture/audio.py +4 -6
sonusai/mixture/augmentation.py +37 -43
sonusai/mixture/class_count.py +5 -14
sonusai/mixture/config.py +292 -225
sonusai/mixture/constants.py +41 -30
sonusai/mixture/data_io.py +155 -0
sonusai/mixture/datatypes.py +111 -108
sonusai/mixture/db_datatypes.py +54 -70
sonusai/mixture/eq_rule_is_valid.py +6 -9
sonusai/mixture/feature.py +40 -38
sonusai/mixture/generation.py +522 -389
sonusai/mixture/helpers.py +217 -272
sonusai/mixture/log_duration_and_sizes.py +16 -13
sonusai/mixture/mixdb.py +669 -477
sonusai/mixture/soundfile_audio.py +12 -17
sonusai/mixture/sox_audio.py +91 -112
sonusai/mixture/sox_augmentation.py +8 -9
sonusai/mixture/spectral_mask.py +4 -6
sonusai/mixture/target_class_balancing.py +41 -36
sonusai/mixture/targets.py +69 -67
sonusai/mixture/tokenized_shell_vars.py +23 -23
sonusai/mixture/torchaudio_audio.py +14 -15
sonusai/mixture/torchaudio_augmentation.py +23 -27
sonusai/mixture/truth.py +48 -26
sonusai/mixture/truth_functions/__init__.py +26 -0
sonusai/mixture/truth_functions/crm.py +56 -38
sonusai/mixture/truth_functions/datatypes.py +37 -0
sonusai/mixture/truth_functions/energy.py +85 -59
sonusai/mixture/truth_functions/file.py +30 -30
sonusai/mixture/truth_functions/phoneme.py +14 -7
sonusai/mixture/truth_functions/sed.py +71 -45
sonusai/mixture/truth_functions/target.py +69 -106
sonusai/mkwav.py +52 -85
sonusai/onnx_predict.py +46 -43
sonusai/queries/__init__.py +3 -1
sonusai/queries/queries.py +100 -59
sonusai/speech/__init__.py +2 -0
sonusai/speech/l2arctic.py +24 -23
sonusai/speech/librispeech.py +16 -17
sonusai/speech/mcgill.py +22 -21
sonusai/speech/textgrid.py +32 -25
sonusai/speech/timit.py +45 -42
sonusai/speech/vctk.py +14 -13
sonusai/speech/voxceleb.py +26 -20
sonusai/summarize_metric_spenh.py +11 -10
sonusai/utils/__init__.py +4 -3
sonusai/utils/asl_p56.py +1 -1
sonusai/utils/asr.py +37 -17
sonusai/utils/asr_functions/__init__.py +2 -0
sonusai/utils/asr_functions/aaware_whisper.py +18 -12
sonusai/utils/audio_devices.py +12 -12
sonusai/utils/braced_glob.py +6 -8
sonusai/utils/calculate_input_shape.py +1 -4
sonusai/utils/compress.py +2 -2
sonusai/utils/convert_string_to_number.py +1 -3
sonusai/utils/create_timestamp.py +1 -1
sonusai/utils/create_ts_name.py +2 -2
sonusai/utils/dataclass_from_dict.py +1 -1
sonusai/utils/docstring.py +6 -6
sonusai/utils/energy_f.py +9 -7
sonusai/utils/engineering_number.py +56 -54
sonusai/utils/get_label_names.py +8 -10
sonusai/utils/human_readable_size.py +2 -2
sonusai/utils/model_utils.py +3 -5
sonusai/utils/numeric_conversion.py +2 -4
sonusai/utils/onnx_utils.py +43 -32
sonusai/utils/parallel.py +40 -27
sonusai/utils/print_mixture_details.py +25 -22
sonusai/utils/ranges.py +12 -12
sonusai/utils/read_predict_data.py +11 -9
sonusai/utils/reshape.py +19 -26
sonusai/utils/seconds_to_hms.py +1 -1
sonusai/utils/stacked_complex.py +8 -16
sonusai/utils/stratified_shuffle_split.py +29 -27
sonusai/utils/write_audio.py +2 -2
sonusai/utils/yes_or_no.py +3 -3
sonusai/vars.py +14 -14
{sonusai-0.18.9.dist-info → sonusai-0.19.5.dist-info}/METADATA +20 -21
sonusai-0.19.5.dist-info/RECORD +125 -0
{sonusai-0.18.9.dist-info → sonusai-0.19.5.dist-info}/WHEEL +1 -1
sonusai/mixture/truth_functions/data.py +0 -58
sonusai/utils/read_mixture_data.py +0 -14
sonusai-0.18.9.dist-info/RECORD +0 -125
{sonusai-0.18.9.dist-info → sonusai-0.19.5.dist-info}/entry_points.txt +0 -0

sonusai/mixture/augmentation.py CHANGED Viewed

@@ -1,10 +1,9 @@
-from typing import Optional
 from sonusai.mixture.datatypes import AudioT
 from sonusai.mixture.datatypes import Augmentation
 from sonusai.mixture.datatypes import AugmentationRule
 from sonusai.mixture.datatypes import AugmentationRules
 from sonusai.mixture.datatypes import ImpulseResponseData
+from sonusai.mixture.datatypes import OptionalNumberStr
 def get_augmentation_rules(rules: list[dict] | dict, num_ir: int = 0) -> AugmentationRules:
@@ -15,6 +14,7 @@ def get_augmentation_rules(rules: list[dict] | dict, num_ir: int = 0) -> Augment
     :return: List of augmentation rules
     """
     from sonusai.utils import dataclass_from_dict
     from .datatypes import AugmentationRule
     processed_rules: list[dict] = []
@@ -37,8 +37,8 @@ def _expand_rules(expanded_rules: list[dict], rule: dict) -> list[dict]:
     """
     from copy import deepcopy
-    from sonusai import SonusAIError
     from sonusai.utils import convert_string_to_number
     from .constants import VALID_AUGMENTATIONS
     from .eq_rule_is_valid import eq_rule_is_valid
@@ -47,46 +47,44 @@ def _expand_rules(expanded_rules: list[dict], rule: dict) -> list[dict]:
             del rule[key]
     # replace old 'eq' rule with new 'eq1' rule to allow both for backward compatibility
-    rule = {'eq1' if key == 'eq' else key: value for key, value in rule.items()}
+    rule = {"eq1" if key == "eq" else key: value for key, value in rule.items()}
     for key in rule:
         if key not in VALID_AUGMENTATIONS:
-            nice_list = '\n'.join([f'  {item}' for item in VALID_AUGMENTATIONS])
-            raise SonusAIError(f'Invalid augmentation: {key}.\nValid augmentations are:\n{nice_list}')
+            nice_list = "\n".join([f"  {item}" for item in VALID_AUGMENTATIONS])
+            raise ValueError(f"Invalid augmentation: {key}.\nValid augmentations are:\n{nice_list}")
-        if key in ['eq1', 'eq2', 'eq3']:
+        if key in ["eq1", "eq2", "eq3"]:
             if not eq_rule_is_valid(rule[key]):
-                raise SonusAIError(f'Invalid augmentation value for {key}: {rule[key]}')
+                raise ValueError(f"Invalid augmentation value for {key}: {rule[key]}")
-            if all(isinstance(el, list) or (isinstance(el, str) and el == 'none') for el in rule[key]):
+            if all(isinstance(el, list) or (isinstance(el, str) and el == "none") for el in rule[key]):
                 # Expand multiple rules
                 for value in rule[key]:
                     expanded_rule = deepcopy(rule)
-                    if isinstance(value, str) and value == 'none':
+                    if isinstance(value, str) and value == "none":
                         expanded_rule[key] = None
                     else:
                         expanded_rule[key] = deepcopy(value)
                     _expand_rules(expanded_rules, expanded_rule)
                 return expanded_rules
-        elif key in ['mixup']:
+        elif key in ["mixup"]:
             pass
         else:
             if isinstance(rule[key], list):
                 for value in rule[key]:
                     if isinstance(value, list):
-                        raise SonusAIError(f'Invalid augmentation value for {key}: {rule[key]}')
+                        raise TypeError(f"Invalid augmentation value for {key}: {rule[key]}")
                     expanded_rule = deepcopy(rule)
                     expanded_rule[key] = deepcopy(value)
                     _expand_rules(expanded_rules, expanded_rule)
                 return expanded_rules
             else:
                 rule[key] = convert_string_to_number(rule[key])
-                if not (isinstance(rule[key], float | int) or
-                        rule[key].startswith('rand') or
-                        rule[key] == 'none'):
-                    raise SonusAIError(f'Invalid augmentation value for {key}: {rule[key]}')
+                if not (isinstance(rule[key], float | int) or rule[key].startswith("rand") or rule[key] == "none"):
+                    raise ValueError(f"Invalid augmentation value for {key}: {rule[key]}")
     expanded_rules.append(rule)
     return expanded_rules
@@ -102,7 +100,7 @@ def _generate_none_rule(rule: dict) -> dict:
     out_rule = deepcopy(rule)
     for key in out_rule:
-        if out_rule[key] == 'none':
+        if out_rule[key] == "none":
             out_rule[key] = None
     return out_rule
@@ -120,20 +118,20 @@ def _generate_random_rule(rule: dict, num_ir: int = 0) -> dict:
     out_rule = deepcopy(rule)
     for key in out_rule:
-        if key == 'ir' and out_rule[key] == 'rand':
+        if key == "ir" and out_rule[key] == "rand":
             # IR is special case
             if num_ir == 0:
                 out_rule[key] = None
             else:
-                out_rule[key] = randint(0, num_ir - 1)
+                out_rule[key] = randint(0, num_ir - 1)  # noqa: S311
         else:
             out_rule[key] = evaluate_random_rule(str(out_rule[key]))
         # convert EQ values from strings to numbers
-        if key in ['eq1', 'eq2', 'eq3']:
+        if key in ["eq1", "eq2", "eq3"]:
             for n in range(3):
                 if isinstance(out_rule[key][n], str):
-                    out_rule[key][n] = eval(out_rule[key][n])
+                    out_rule[key][n] = eval(out_rule[key][n])  # noqa: S307
     return out_rule
@@ -144,14 +142,10 @@ def _rule_has_rand(rule: dict) -> bool:
     :param rule: Rule
     :return: True if rule contains 'rand'
     """
-    for key in rule:
-        if 'rand' in str(rule[key]):
-            return True
-    return False
+    return any("rand" in str(rule[key]) for key in rule)
-def estimate_augmented_length_from_length(length: int, tempo: Optional[float] = None, frame_length: int = 1) -> int:
+def estimate_augmented_length_from_length(length: int, tempo: OptionalNumberStr = None, frame_length: int = 1) -> int:
     """Estimate the length of audio after augmentation
     :param length: Number of samples in audio
@@ -162,7 +156,7 @@ def estimate_augmented_length_from_length(length: int, tempo: Optional[float] =
     import numpy as np
     if tempo is not None:
-        length = int(np.round(length / tempo))
+        length = int(np.round(length / float(tempo)))
     length = _get_padded_length(length, frame_length)
@@ -175,7 +169,7 @@ def get_mixups(augmentations: AugmentationRules) -> list[int]:
     :param augmentations: List of augmentations
     :return: List of mixup values used
     """
-    return sorted(list(set([augmentation.mixup for augmentation in augmentations])))
+    return sorted({augmentation.mixup for augmentation in augmentations})
 def get_augmentation_indices_for_mixup(augmentations: AugmentationRules, mixup: int) -> list[int]:
@@ -249,53 +243,52 @@ def evaluate_random_rule(rule: str) -> str | float:
     from .constants import RAND_PATTERN
     def rand_repl(m):
-        return f'{uniform(float(m.group(1)), float(m.group(4))):.2f}'
+        return f"{uniform(float(m.group(1)), float(m.group(4))):.2f}"  # noqa: S311
-    return eval(re.sub(RAND_PATTERN, rand_repl, rule))
+    return eval(re.sub(RAND_PATTERN, rand_repl, rule))  # noqa: S307
 def _parse_ir(rule: dict, num_ir: int) -> dict:
-    from sonusai import SonusAIError
     from .helpers import generic_ids_to_list
     def _resolve_str(rule_in: str) -> str | list[int]:
-        if rule_in in ['rand', 'none']:
+        if rule_in in ["rand", "none"]:
             return rule_in
         rule_out = generic_ids_to_list(num_ir, rule_in)
         if not all(ro in range(num_ir) for ro in rule_out):
-            raise SonusAIError(f'Invalid ir entry of {rule_in}')
+            raise ValueError(f"Invalid ir entry of {rule_in}")
         return rule_out
-    if 'ir' not in rule:
+    if "ir" not in rule:
         return rule
-    ir = rule['ir']
+    ir = rule["ir"]
     if ir is None:
         return rule
     if isinstance(ir, str):
-        rule['ir'] = _resolve_str(ir)
+        rule["ir"] = _resolve_str(ir)
         return rule
     if isinstance(ir, list):
-        rule['ir'] = []
+        rule["ir"] = []
         for item in ir:
             result = _resolve_str(item)
             if isinstance(result, str):
-                rule['ir'].append(_resolve_str(item))
+                rule["ir"].append(_resolve_str(item))
             else:
-                rule['ir'] += _resolve_str(item)
+                rule["ir"] += _resolve_str(item)
         return rule
     if isinstance(ir, int):
         if ir not in range(num_ir):
-            raise SonusAIError(f'Invalid ir of {ir}')
+            raise ValueError(f"Invalid ir of {ir}")
         return rule
-    raise SonusAIError(f'Invalid ir of {ir}')
+    raise ValueError(f"Invalid ir of {ir}")
 def apply_augmentation(audio: AudioT, augmentation: Augmentation, frame_length: int = 1) -> AudioT:
@@ -325,10 +318,11 @@ def apply_impulse_response(audio: AudioT, ir: ImpulseResponseData) -> AudioT:
 def augmentation_from_rule(rule: AugmentationRule, num_ir: int) -> Augmentation:
     from sonusai.utils import dataclass_from_dict
     from .datatypes import Augmentation
     processed_rule = rule.to_dict()
-    del processed_rule['mixup']
+    del processed_rule["mixup"]
     processed_rule = _generate_none_rule(processed_rule)
     if _rule_has_rand(processed_rule):
         processed_rule = _generate_random_rule(processed_rule, num_ir)

sonusai/mixture/class_count.py CHANGED Viewed

@@ -3,22 +3,13 @@ from sonusai.mixture.datatypes import GeneralizedIDs
 from sonusai.mixture.mixdb import MixtureDatabase
-def get_class_count_from_mixids(mixdb: MixtureDatabase, mixids: GeneralizedIDs = None) -> ClassCount:
-    """ Sums the class counts for given mixids
-    """
-    from sonusai import SonusAIError
+def get_class_count_from_mixids(mixdb: MixtureDatabase, mixids: GeneralizedIDs | None = None) -> ClassCount:
+    """Sums the class counts for given mixids"""
     total_class_count = [0] * mixdb.num_classes
-    mixids = mixdb.mixids_to_list(mixids)
-    for mixid in mixids:
-        class_count = mixdb.mixture_class_count(mixid)
+    m_ids = mixdb.mixids_to_list(mixids)
+    for m_id in m_ids:
+        class_count = mixdb.mixture_class_count(m_id)
         for cl in range(mixdb.num_classes):
             total_class_count[cl] += class_count[cl]
-    if mixdb.truth_mutex:
-        # Compute the class count for the 'other' class
-        if total_class_count[-1] != 0:
-            raise SonusAIError('Error: truth_mutex was set, but the class count for the last count was non-zero.')
-        total_class_count[-1] = sum([mixdb.mixture(mixid).samples for mixid in mixids]) - sum(total_class_count)
     return total_class_count

sonusai 0.18.9__py3-none-any.whl → 0.19.5__py3-none-any.whl

sonusai 0.18.9py3-none-any.whl → 0.19.5py3-none-any.whl