PyPI - sonusai - Versions diffs - 0.19.6__py3-none-any.whl → 0.19.8__py3-none-any.whl - Mend

sonusai 0.19.6py3-none-any.whl → 0.19.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (59) hide show

sonusai/__init__.py +1 -1
sonusai/aawscd_probwrite.py +1 -1
sonusai/calc_metric_spenh.py +1 -1
sonusai/genft.py +29 -14
sonusai/genmetrics.py +60 -42
sonusai/genmix.py +41 -29
sonusai/genmixdb.py +54 -62
sonusai/metrics/calc_class_weights.py +1 -3
sonusai/metrics/calc_optimal_thresholds.py +2 -2
sonusai/metrics/calc_phase_distance.py +1 -1
sonusai/metrics/calc_speech.py +6 -6
sonusai/metrics/class_summary.py +6 -15
sonusai/metrics/confusion_matrix_summary.py +11 -27
sonusai/metrics/one_hot.py +3 -3
sonusai/metrics/snr_summary.py +7 -7
sonusai/mixture/__init__.py +2 -17
sonusai/mixture/augmentation.py +5 -6
sonusai/mixture/class_count.py +1 -1
sonusai/mixture/config.py +36 -46
sonusai/mixture/data_io.py +30 -1
sonusai/mixture/datatypes.py +29 -40
sonusai/mixture/db_datatypes.py +1 -1
sonusai/mixture/feature.py +3 -23
sonusai/mixture/generation.py +202 -235
sonusai/mixture/helpers.py +29 -187
sonusai/mixture/mixdb.py +386 -159
sonusai/mixture/soundfile_audio.py +1 -1
sonusai/mixture/sox_audio.py +4 -4
sonusai/mixture/sox_augmentation.py +1 -1
sonusai/mixture/target_class_balancing.py +9 -11
sonusai/mixture/targets.py +23 -20
sonusai/mixture/truth.py +21 -34
sonusai/mixture/truth_functions/__init__.py +6 -0
sonusai/mixture/truth_functions/crm.py +51 -37
sonusai/mixture/truth_functions/energy.py +95 -50
sonusai/mixture/truth_functions/file.py +12 -8
sonusai/mixture/truth_functions/metadata.py +24 -0
sonusai/mixture/truth_functions/metrics.py +28 -0
sonusai/mixture/truth_functions/phoneme.py +4 -5
sonusai/mixture/truth_functions/sed.py +32 -23
sonusai/mixture/truth_functions/target.py +62 -29
sonusai/mkwav.py +20 -19
sonusai/queries/queries.py +9 -15
sonusai/speech/l2arctic.py +6 -2
sonusai/summarize_metric_spenh.py +1 -1
sonusai/utils/__init__.py +1 -0
sonusai/utils/asr_functions/aaware_whisper.py +1 -1
sonusai/utils/audio_devices.py +27 -18
sonusai/utils/docstring.py +6 -3
sonusai/utils/energy_f.py +5 -3
sonusai/utils/human_readable_size.py +6 -6
sonusai/utils/load_object.py +15 -0
sonusai/utils/onnx_utils.py +2 -2
sonusai/utils/print_mixture_details.py +3 -3
{sonusai-0.19.6.dist-info → sonusai-0.19.8.dist-info}/METADATA +2 -2
{sonusai-0.19.6.dist-info → sonusai-0.19.8.dist-info}/RECORD +58 -56
sonusai/mixture/truth_functions/datatypes.py +0 -37
{sonusai-0.19.6.dist-info → sonusai-0.19.8.dist-info}/WHEEL +0 -0
{sonusai-0.19.6.dist-info → sonusai-0.19.8.dist-info}/entry_points.txt +0 -0

sonusai/mixture/soundfile_audio.py CHANGED Viewed

@@ -32,7 +32,7 @@ def _raw_read(name: str | Path) -> tuple[AudioT, int]:
         else:
             raise OSError(f"Error reading {name}: {e}") from e
-    return np.squeeze(raw[:, 0]), sample_rate
+    return np.squeeze(raw[:, 0].astype(np.float32)), sample_rate
 def get_sample_rate(name: str | Path) -> int:

sonusai/mixture/sox_audio.py CHANGED Viewed

@@ -207,7 +207,7 @@ class Transformer(SoxTransformer):
         return self
-    def build(
+    def build(  # pyright: ignore [reportIncompatibleMethodOverride]
         self,
         input_filepath: str | Path | None = None,
         output_filepath: str | Path | None = None,
@@ -320,11 +320,11 @@ class Transformer(SoxTransformer):
         logger.info("Created %s with effects: %s", output_filepath, " ".join(self.effects_log))
         if return_output:
-            return status, out, err
+            return status, out, err  # pyright: ignore [reportReturnType]
         return True, None, None
-    def build_array(
+    def build_array(  # pyright: ignore [reportIncompatibleMethodOverride]
         self,
         input_filepath: str | Path | None = None,
         input_array: np.ndarray | None = None,
@@ -465,7 +465,7 @@ class Transformer(SoxTransformer):
         if status != 0:
             raise SoxError(f"Stdout: {out}\nStderr: {err}")
-        out = np.frombuffer(out, dtype=encoding_out)
+        out = np.frombuffer(out, dtype=encoding_out)  # pyright: ignore [reportArgumentType, reportCallIssue]
         if output_format["channels"] > 1:
             out = out.reshape(
                 (output_format["channels"], int(len(out) / output_format["channels"])),

sonusai/mixture/sox_augmentation.py CHANGED Viewed

@@ -118,7 +118,7 @@ def apply_impulse_response(audio: AudioT, ir: ImpulseResponseData) -> AudioT:
     # Apply IR and convert back to global sample rate
     tfm = Transformer()
     tfm.set_output_format(rate=SAMPLE_RATE)
-    tfm.fir(coefficients=temp.name)
+    tfm.fir(coefficients=temp.name)  # pyright: ignore [reportArgumentType]
     try:
         audio_out = tfm.build_array(input_array=audio_out, sample_rate_in=ir.sample_rate)
     except Exception as e:

sonusai/mixture/target_class_balancing.py CHANGED Viewed

@@ -1,19 +1,17 @@
 from sonusai.mixture.datatypes import AugmentationRule
-from sonusai.mixture.datatypes import AugmentationRules
-from sonusai.mixture.datatypes import AugmentedTargets
+from sonusai.mixture.datatypes import AugmentedTarget
 from sonusai.mixture.datatypes import TargetFile
-from sonusai.mixture.datatypes import TargetFiles
 def balance_targets(
-    augmented_targets: AugmentedTargets,
-    targets: TargetFiles,
-    target_augmentations: AugmentationRules,
+    augmented_targets: list[AugmentedTarget],
+    targets: list[TargetFile],
+    target_augmentations: list[AugmentationRule],
     class_balancing_augmentation: AugmentationRule,
     num_classes: int,
     num_ir: int,
     mixups: list[int] | None = None,
-) -> tuple[AugmentedTargets, AugmentationRules]:
+) -> tuple[list[AugmentedTarget], list[AugmentationRule]]:
     import math
     from .augmentation import get_mixups
@@ -64,15 +62,15 @@ def balance_targets(
 def _get_unused_balancing_augmentation(
-    augmented_targets: AugmentedTargets,
-    targets: TargetFiles,
-    target_augmentations: AugmentationRules,
+    augmented_targets: list[AugmentedTarget],
+    targets: list[TargetFile],
+    target_augmentations: list[AugmentationRule],
     class_balancing_augmentation: AugmentationRule,
     target_id: int,
     mixup: int,
     num_ir: int,
     first_cba_id: int,
-) -> tuple[int, AugmentationRules]:
+) -> tuple[int, list[AugmentationRule]]:
     """Get an unused balancing augmentation for a given target file index"""
     from dataclasses import asdict

sonusai/mixture/targets.py CHANGED Viewed

@@ -1,21 +1,20 @@
-from sonusai.mixture.datatypes import AugmentationRules
+from sonusai.mixture.datatypes import AugmentationRule
 from sonusai.mixture.datatypes import AugmentedTarget
-from sonusai.mixture.datatypes import AugmentedTargets
-from sonusai.mixture.datatypes import TargetFiles
+from sonusai.mixture.datatypes import TargetFile
 def get_augmented_targets(
-    target_files: TargetFiles,
-    target_augmentations: AugmentationRules,
+    target_files: list[TargetFile],
+    target_augmentations: list[AugmentationRule],
     mixups: list[int] | None = None,
-) -> AugmentedTargets:
+) -> list[AugmentedTarget]:
     from .augmentation import get_augmentation_indices_for_mixup
     from .augmentation import get_mixups
     if mixups is None:
         mixups = get_mixups(target_augmentations)
-    augmented_targets: AugmentedTargets = []
+    augmented_targets: list[AugmentedTarget] = []
     for mixup in mixups:
         augmentation_indices = get_augmentation_indices_for_mixup(target_augmentations, mixup)
         for target_index in range(len(target_files)):
@@ -30,15 +29,17 @@ def get_augmented_targets(
     return augmented_targets
-def get_class_index_for_augmented_target(augmented_target: AugmentedTarget, targets: TargetFiles) -> list[int]:
+def get_class_index_for_augmented_target(augmented_target: AugmentedTarget, targets: list[TargetFile]) -> list[int]:
     return targets[augmented_target.target_id].class_indices
-def get_mixup_for_augmented_target(augmented_target: AugmentedTarget, augmentations: AugmentationRules) -> int:
+def get_mixup_for_augmented_target(augmented_target: AugmentedTarget, augmentations: list[AugmentationRule]) -> int:
     return augmentations[augmented_target.target_augmentation_id].mixup
-def get_target_ids_for_class_index(targets: TargetFiles, class_index: int, allow_multiple: bool = False) -> list[int]:
+def get_target_ids_for_class_index(
+    targets: list[TargetFile], class_index: int, allow_multiple: bool = False
+) -> list[int]:
     """Get a list of target indices containing the given class index.
     If allow_multiple is True, then include targets that contain multiple class indices.
@@ -55,9 +56,9 @@ def get_target_ids_for_class_index(targets: TargetFiles, class_index: int, allow
 def get_augmented_target_ids_for_class_index(
-    augmented_targets: AugmentedTargets,
-    targets: TargetFiles,
-    augmentations: AugmentationRules,
+    augmented_targets: list[AugmentedTarget],
+    targets: list[TargetFile],
+    augmentations: list[AugmentationRule],
     class_index: int,
     mixup: int,
     allow_multiple: bool = False,
@@ -79,9 +80,9 @@ def get_augmented_target_ids_for_class_index(
 def get_augmented_target_ids_by_class(
-    augmented_targets: AugmentedTargets,
-    targets: TargetFiles,
-    target_augmentations: AugmentationRules,
+    augmented_targets: list[AugmentedTarget],
+    targets: list[TargetFile],
+    target_augmentations: list[AugmentationRule],
     mixup: int,
     num_classes: int,
 ) -> list[list[int]]:
@@ -99,7 +100,9 @@ def get_augmented_target_ids_by_class(
     return indices
-def get_target_augmentations_for_mixup(target_augmentations: AugmentationRules, mixup: int) -> AugmentationRules:
+def get_target_augmentations_for_mixup(
+    target_augmentations: list[AugmentationRule], mixup: int
+) -> list[AugmentationRule]:
     """Get target augmentations for a given mixup value
     :param target_augmentations: List of target augmentation rules
@@ -110,9 +113,9 @@ def get_target_augmentations_for_mixup(target_augmentations: AugmentationRules,
 def get_augmented_target_ids_for_mixup(
-    augmented_targets: AugmentedTargets,
-    targets: TargetFiles,
-    target_augmentations: AugmentationRules,
+    augmented_targets: list[AugmentedTarget],
+    targets: list[TargetFile],
+    target_augmentations: list[AugmentationRule],
     mixup: int,
     num_classes: int,
 ) -> list[list[int]]:

sonusai/mixture/truth.py CHANGED Viewed

@@ -1,39 +1,26 @@
-from sonusai.mixture.datatypes import AudioT
-from sonusai.mixture.datatypes import Truth
-from sonusai.mixture.datatypes import TruthConfig
-from sonusai.mixture.mixdb import MixtureDatabase
-def truth_function(
-    target_audio: AudioT,
-    noise_audio: AudioT,
-    mixture_audio: AudioT,
-    config: TruthConfig,
-    feature: str,
-    num_classes: int,
-    class_indices: list[int],
-    target_gain: float,
-) -> Truth:
+from sonusai.mixture import MixtureDatabase
+from sonusai.mixture import Truth
+def truth_function(mixdb: MixtureDatabase, m_id: int) -> list[Truth]:
+    from sonusai.mixture import TruthDict
     from sonusai.mixture import truth_functions
-    from .truth_functions.datatypes import TruthFunctionConfig
-    from .truth_functions.datatypes import TruthFunctionData
-    t_config = TruthFunctionConfig(
-        feature=feature,
-        num_classes=num_classes,
-        class_indices=class_indices,
-        target_gain=target_gain,
-        config=config.config,
-    )
-    t_data = TruthFunctionData(target_audio, noise_audio, mixture_audio)
-    try:
-        return getattr(truth_functions, config.function)(t_data, t_config)
-    except AttributeError as e:
-        raise AttributeError(f"Unsupported truth function: {config.function}") from e
-    except Exception as e:
-        raise RuntimeError(f"Error in truth function '{config.function}': {e}") from e
+    result: list[Truth] = []
+    for target_index in range(len(mixdb.mixture(m_id).targets)):
+        truth: TruthDict = {}
+        target_file = mixdb.target_file(mixdb.mixture(m_id).targets[target_index].file_id)
+        for name, config in target_file.truth_configs.items():
+            try:
+                truth[name] = getattr(truth_functions, config.function)(mixdb, m_id, target_index, config.config)
+            except AttributeError as e:
+                raise AttributeError(f"Unsupported truth function: {config.function}") from e
+            except Exception as e:
+                raise RuntimeError(f"Error in truth function '{config.function}': {e}") from e
+        result.append(truth)
+    return result
 def get_truth_indices_for_mixid(mixdb: MixtureDatabase, mixid: int) -> list[int]:

sonusai/mixture/truth_functions/__init__.py CHANGED Viewed

@@ -22,6 +22,12 @@ from .energy import snr_f_validate
 from .file import file
 from .file import file_parameters
 from .file import file_validate
+from .metadata import metadata
+from .metadata import metadata_parameters
+from .metadata import metadata_validate
+from .metrics import metrics
+from .metrics import metrics_parameters
+from .metrics import metrics_validate
 from .phoneme import phoneme
 from .phoneme import phoneme_parameters
 from .phoneme import phoneme_validate

sonusai/mixture/truth_functions/crm.py CHANGED Viewed

@@ -1,22 +1,32 @@
-from sonusai.mixture.datatypes import Truth
-from sonusai.mixture.truth_functions.datatypes import TruthFunctionConfig
-from sonusai.mixture.truth_functions.datatypes import TruthFunctionData
+from sonusai.mixture import MixtureDatabase
+from sonusai.mixture import Truth
-def _core(data: TruthFunctionData, config: TruthFunctionConfig, polar: bool) -> Truth:
+def _core(mixdb: MixtureDatabase, m_id: int, target_index: int, parameters: int, polar: bool) -> Truth:
     import numpy as np
+    import torch
+    from pyaaware import ForwardTransform
+    from pyaaware import feature_forward_transform_config
+    from pyaaware import feature_inverse_transform_config
-    if config.target_fft.bins != config.noise_fft.bins:
-        raise ValueError("Transform size mismatch for crm truth")
+    target_audio = torch.from_numpy(mixdb.mixture_targets(m_id)[target_index])
+    t_ft = ForwardTransform(**feature_forward_transform_config(mixdb.feature))
+    n_ft = ForwardTransform(**feature_forward_transform_config(mixdb.feature))
-    frames = len(data.target_audio) // config.frame_size
-    truth = np.empty((frames, config.target_fft.bins * 2), dtype=np.float32)
+    frames = t_ft.frames(target_audio)
+    if mixdb.mixture(m_id).target_gain(target_index) == 0:
+        return np.zeros((frames, parameters), dtype=np.float32)
+    noise_audio = torch.from_numpy(mixdb.mixture_noise(m_id))
+    frame_size = feature_inverse_transform_config(mixdb.feature)["overlap"]
+    frames = len(target_audio) // frame_size
+    truth = np.empty((frames, t_ft.bins * 2), dtype=np.float32)
     for frame in range(frames):
-        offset = frame * config.frame_size
-        target_f = config.target_fft.execute(data.target_audio[offset : offset + config.frame_size]).astype(
-            np.complex64
-        )
-        noise_f = config.noise_fft.execute(data.noise_audio[offset : offset + config.frame_size]).astype(np.complex64)
+        offset = frame * frame_size
+        target_f = t_ft.execute(target_audio[offset : offset + frame_size])[0].numpy().astype(np.complex64)
+        noise_f = n_ft.execute(noise_audio[offset : offset + frame_size])[0].numpy().astype(np.complex64)
         mixture_f = target_f + noise_f
         crm_data = np.empty(target_f.shape, dtype=np.complex64)
@@ -31,8 +41,8 @@ def _core(data: TruthFunctionData, config: TruthFunctionConfig, polar: bool) ->
                 else:
                     crm_data[it.multi_index] = num / den
-        truth[frame, : config.target_fft.bins] = np.absolute(crm_data) if polar else np.real(crm_data)
-        truth[frame, config.target_fft.bins :] = np.angle(crm_data) if polar else np.imag(crm_data)
+        truth[frame, : t_ft.bins] = np.absolute(crm_data) if polar else np.real(crm_data)
+        truth[frame, t_ft.bins :] = np.angle(crm_data) if polar else np.imag(crm_data)
     return truth
@@ -41,11 +51,14 @@ def crm_validate(_config: dict) -> None:
     pass
-def crm_parameters(config: TruthFunctionConfig) -> int:
-    return config.target_fft.bins * 2
+def crm_parameters(feature: str, _num_classes: int, _config: dict) -> int:
+    from pyaaware import ForwardTransform
+    from pyaaware import feature_forward_transform_config
+    return ForwardTransform(**feature_forward_transform_config(feature)).bins * 2
-def crm(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
+def crm(mixdb: MixtureDatabase, m_id: int, target_index: int, _config: dict) -> Truth:
     """Complex ratio mask truth generation function
     Calculates the true complex ratio mask (CRM) truth which is a complex number
@@ -55,25 +68,27 @@ def crm(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
     Output shape: [:, 2 * bins]
     """
-    import numpy as np
-    frames = config.target_fft.frames(data.target_audio)
-    parameters = crm_parameters(config)
-    if config.target_gain == 0:
-        return np.zeros((frames, parameters), dtype=np.float32)
-    return _core(data=data, config=config, polar=False)
+    return _core(
+        mixdb=mixdb,
+        m_id=m_id,
+        target_index=target_index,
+        parameters=crm_parameters(mixdb.feature, mixdb.num_classes, _config),
+        polar=False,
+    )
 def crmp_validate(_config: dict) -> None:
     pass
-def crmp_parameters(config: TruthFunctionConfig) -> int:
-    return config.target_fft.bins * 2
+def crmp_parameters(feature: str, _num_classes: int, _config: dict) -> int:
+    from pyaaware import ForwardTransform
+    from pyaaware import feature_forward_transform_config
+    return ForwardTransform(**feature_forward_transform_config(feature)).bins * 2
-def crmp(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
+def crmp(mixdb: MixtureDatabase, m_id: int, target_index: int, _config: dict) -> Truth:
     """Complex ratio mask polar truth generation function
     Same as the crm function except the results are magnitude and phase
@@ -81,11 +96,10 @@ def crmp(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
     Output shape: [:, bins]
     """
-    import numpy as np
-    frames = config.target_fft.frames(data.target_audio)
-    parameters = crmp_parameters(config)
-    if config.target_gain == 0:
-        return np.zeros((frames, parameters), dtype=np.float32)
-    return _core(data=data, config=config, polar=True)
+    return _core(
+        mixdb=mixdb,
+        m_id=m_id,
+        target_index=target_index,
+        parameters=crmp_parameters(mixdb.feature, mixdb.num_classes, _config),
+        polar=True,
+    )

sonusai/mixture/truth_functions/energy.py CHANGED Viewed

@@ -1,20 +1,44 @@
 import numpy as np
-from sonusai.mixture.datatypes import Truth
-from sonusai.mixture.truth_functions.datatypes import TruthFunctionConfig
-from sonusai.mixture.truth_functions.datatypes import TruthFunctionData
+from sonusai.mixture import MixtureDatabase
+from sonusai.mixture import Truth
+from sonusai.utils import load_object
+def _core(
+    mixdb: MixtureDatabase,
+    m_id: int,
+    target_index: int,
+    config: dict,
+    parameters: int,
+    mapped: bool,
+    snr: bool,
+) -> Truth:
+    from os.path import join
+    import torch
+    from pyaaware import ForwardTransform
+    from pyaaware import feature_forward_transform_config
-def _core(data: TruthFunctionData, config: TruthFunctionConfig, mapped: bool, snr: bool) -> Truth:
     from sonusai.utils import compute_energy_f
-    target_energy = compute_energy_f(time_domain=data.target_audio, transform=config.target_fft)
+    target_audio = mixdb.mixture_targets(m_id)[target_index]
+    ft = ForwardTransform(**feature_forward_transform_config(mixdb.feature))
+    frames = ft.frames(torch.from_numpy(target_audio))
+    if mixdb.mixture(m_id).target_gain(target_index) == 0:
+        return np.zeros((frames, parameters), dtype=np.float32)
+    noise_audio = mixdb.mixture_noise(m_id)
+    target_energy = compute_energy_f(time_domain=target_audio, transform=ft)
     noise_energy = None
     if snr:
-        noise_energy = compute_energy_f(time_domain=data.noise_audio, transform=config.noise_fft)
+        noise_energy = compute_energy_f(time_domain=noise_audio, transform=ft)
     frames = len(target_energy)
-    truth = np.empty((frames, config.target_fft.bins), dtype=np.float32)
+    truth = np.empty((frames, ft.bins), dtype=np.float32)
     for frame in range(frames):
         tmp = target_energy[frame]
@@ -26,7 +50,9 @@ def _core(data: TruthFunctionData, config: TruthFunctionConfig, mapped: bool, sn
         tmp = np.nan_to_num(tmp, nan=-np.inf, posinf=np.inf, neginf=-np.inf)
         if mapped:
-            tmp = _calculate_mapped_snr_f(tmp, config.config["snr_db_mean"], config.config["snr_db_std"])
+            snr_db_mean = load_object(join(mixdb.location, config["snr_db_mean"]))
+            snr_db_std = load_object(join(mixdb.location, config["snr_db_std"]))
+            tmp = _calculate_mapped_snr_f(tmp, snr_db_mean, snr_db_std)
         truth[frame] = tmp
@@ -52,11 +78,14 @@ def energy_f_validate(_config: dict) -> None:
     pass
-def energy_f_parameters(config: TruthFunctionConfig) -> int:
-    return config.target_fft.bins
+def energy_f_parameters(feature: str, _num_classes: int, _config: dict) -> int:
+    from pyaaware import ForwardTransform
+    from pyaaware import feature_forward_transform_config
+    return ForwardTransform(**feature_forward_transform_config(feature)).bins
-def energy_f(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
+def energy_f(mixdb: MixtureDatabase, m_id: int, target_index: int, config: dict) -> Truth:
     """Frequency domain energy truth generation function
     Calculates the true energy per bin:
@@ -67,23 +96,29 @@ def energy_f(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
     Output shape: [:, bins]
     """
-    frames = config.target_fft.frames(data.target_audio)
-    parameters = energy_f_parameters(config)
-    if config.target_gain == 0:
-        return np.zeros((frames, parameters), dtype=np.float32)
-    return _core(data=data, config=config, mapped=False, snr=False)
+    return _core(
+        mixdb=mixdb,
+        m_id=m_id,
+        target_index=target_index,
+        config=config,
+        parameters=energy_f_parameters(mixdb.feature, mixdb.num_classes, config),
+        mapped=False,
+        snr=False,
+    )
 def snr_f_validate(_config: dict) -> None:
     pass
-def snr_f_parameters(config: TruthFunctionConfig) -> int:
-    return config.target_fft.bins
+def snr_f_parameters(feature: str, _num_classes: int, _config: dict) -> int:
+    from pyaaware import ForwardTransform
+    from pyaaware import feature_forward_transform_config
+    return ForwardTransform(**feature_forward_transform_config(feature)).bins
-def snr_f(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
+def snr_f(mixdb: MixtureDatabase, m_id: int, target_index: int, config: dict) -> Truth:
     """Frequency domain SNR truth function documentation
     Calculates the true SNR per bin:
@@ -94,54 +129,58 @@ def snr_f(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
     Output shape: [:, bins]
     """
-    frames = config.target_fft.frames(data.target_audio)
-    parameters = snr_f_parameters(config)
-    if config.target_gain == 0:
-        return np.zeros((frames, parameters), dtype=np.float32)
-    return _core(data=data, config=config, mapped=False, snr=True)
-def mapped_snr_f_validate(config: TruthFunctionConfig) -> None:
-    if len(config.config) == 0:
+    return _core(
+        mixdb=mixdb,
+        m_id=m_id,
+        target_index=target_index,
+        config=config,
+        parameters=snr_f_parameters(mixdb.feature, mixdb.num_classes, config),
+        mapped=False,
+        snr=True,
+    )
+def mapped_snr_f_validate(config: dict) -> None:
+    if len(config) == 0:
         raise AttributeError("mapped_snr_f truth function is missing config")
     for parameter in ("snr_db_mean", "snr_db_std"):
-        if parameter not in config.config:
+        if parameter not in config:
             raise AttributeError(f"mapped_snr_f truth function is missing required '{parameter}'")
-        if len(config.config[parameter]) != config.target_fft.bins:
-            raise ValueError(
-                f"mapped_snr_f truth function '{parameter}' does not have {config.target_fft.bins} elements"
-            )
+def mapped_snr_f_parameters(feature: str, _num_classes: int, _config: dict) -> int:
+    from pyaaware import ForwardTransform
+    from pyaaware import feature_forward_transform_config
-def mapped_snr_f_parameters(config: TruthFunctionConfig) -> int:
-    return config.target_fft.bins
+    return ForwardTransform(**feature_forward_transform_config(feature)).bins
-def mapped_snr_f(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
+def mapped_snr_f(mixdb: MixtureDatabase, m_id: int, target_index: int, config: dict) -> Truth:
     """Frequency domain mapped SNR truth function documentation
     Output shape: [:, bins]
     """
-    frames = config.target_fft.frames(data.target_audio)
-    parameters = mapped_snr_f_parameters(config)
-    if config.target_gain == 0:
-        return np.zeros((frames, parameters), dtype=np.float32)
-    return _core(data=data, config=config, mapped=True, snr=True)
+    return _core(
+        mixdb=mixdb,
+        m_id=m_id,
+        target_index=target_index,
+        config=config,
+        parameters=mapped_snr_f_parameters(mixdb.feature, mixdb.num_classes, config),
+        mapped=True,
+        snr=True,
+    )
 def energy_t_validate(_config: dict) -> None:
     pass
-def energy_t_parameters(_config: TruthFunctionConfig) -> int:
+def energy_t_parameters(_feature: str, _num_classes: int, _config: dict) -> int:
     return 1
-def energy_t(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
+def energy_t(mixdb: MixtureDatabase, m_id: int, target_index: int, _config: dict) -> Truth:
     """Time domain energy truth function documentation
     Calculates the true time domain energy of each frame:
@@ -164,10 +203,16 @@ def energy_t(data: TruthFunctionData, config: TruthFunctionConfig) -> Truth:
     transform config.
     """
     import torch
+    from pyaaware import ForwardTransform
+    from pyaaware import feature_forward_transform_config
+    target_audio = torch.from_numpy(mixdb.mixture_targets(m_id)[target_index])
+    ft = ForwardTransform(**feature_forward_transform_config(mixdb.feature))
-    frames = config.target_fft.frames(data.target_audio)
-    parameters = energy_t_parameters(config)
-    if config.target_gain == 0:
+    frames = ft.frames(target_audio)
+    parameters = energy_f_parameters(mixdb.feature, mixdb.num_classes, _config)
+    if mixdb.mixture(m_id).target_gain(target_index) == 0:
         return np.zeros((frames, parameters), dtype=np.float32)
-    return config.target_fft.execute_all(torch.from_numpy(data.target_audio))[1].numpy()
+    return ft.execute_all(target_audio)[1].numpy()

sonusai 0.19.6__py3-none-any.whl → 0.19.8__py3-none-any.whl

sonusai 0.19.6py3-none-any.whl → 0.19.8py3-none-any.whl