PyPI - sonusai - Versions diffs - 1.0.16__cp311-abi3-macosx_10_12_x86_64.whl - Mend

sonusai 1.0.16__cp311-abi3-macosx_10_12_x86_64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (150) hide show

sonusai/__init__.py +170 -0
sonusai/aawscd_probwrite.py +148 -0
sonusai/audiofe.py +481 -0
sonusai/calc_metric_spenh.py +1136 -0
sonusai/config/__init__.py +0 -0
sonusai/config/asr.py +21 -0
sonusai/config/config.py +65 -0
sonusai/config/config.yml +49 -0
sonusai/config/constants.py +53 -0
sonusai/config/ir.py +124 -0
sonusai/config/ir_delay.py +62 -0
sonusai/config/source.py +275 -0
sonusai/config/spectral_masks.py +15 -0
sonusai/config/truth.py +64 -0
sonusai/constants.py +14 -0
sonusai/data/__init__.py +0 -0
sonusai/data/silero_vad_v5.1.jit +0 -0
sonusai/data/silero_vad_v5.1.onnx +0 -0
sonusai/data/speech_ma01_01.wav +0 -0
sonusai/data/whitenoise.wav +0 -0
sonusai/datatypes.py +383 -0
sonusai/deprecated/gentcst.py +632 -0
sonusai/deprecated/plot.py +519 -0
sonusai/deprecated/tplot.py +365 -0
sonusai/doc.py +52 -0
sonusai/doc_strings/__init__.py +1 -0
sonusai/doc_strings/doc_strings.py +531 -0
sonusai/genft.py +196 -0
sonusai/genmetrics.py +183 -0
sonusai/genmix.py +199 -0
sonusai/genmixdb.py +235 -0
sonusai/ir_metric.py +551 -0
sonusai/lsdb.py +141 -0
sonusai/main.py +134 -0
sonusai/metrics/__init__.py +43 -0
sonusai/metrics/calc_audio_stats.py +42 -0
sonusai/metrics/calc_class_weights.py +90 -0
sonusai/metrics/calc_optimal_thresholds.py +73 -0
sonusai/metrics/calc_pcm.py +45 -0
sonusai/metrics/calc_pesq.py +36 -0
sonusai/metrics/calc_phase_distance.py +43 -0
sonusai/metrics/calc_sa_sdr.py +64 -0
sonusai/metrics/calc_sample_weights.py +25 -0
sonusai/metrics/calc_segsnr_f.py +82 -0
sonusai/metrics/calc_speech.py +382 -0
sonusai/metrics/calc_wer.py +71 -0
sonusai/metrics/calc_wsdr.py +57 -0
sonusai/metrics/calculate_metrics.py +395 -0
sonusai/metrics/class_summary.py +74 -0
sonusai/metrics/confusion_matrix_summary.py +75 -0
sonusai/metrics/one_hot.py +283 -0
sonusai/metrics/snr_summary.py +128 -0
sonusai/metrics_summary.py +314 -0
sonusai/mixture/__init__.py +15 -0
sonusai/mixture/audio.py +187 -0
sonusai/mixture/class_balancing.py +103 -0
sonusai/mixture/constants.py +3 -0
sonusai/mixture/data_io.py +173 -0
sonusai/mixture/db.py +169 -0
sonusai/mixture/db_datatypes.py +92 -0
sonusai/mixture/effects.py +344 -0
sonusai/mixture/feature.py +78 -0
sonusai/mixture/generation.py +1116 -0
sonusai/mixture/helpers.py +351 -0
sonusai/mixture/ir_effects.py +77 -0
sonusai/mixture/log_duration_and_sizes.py +23 -0
sonusai/mixture/mixdb.py +1857 -0
sonusai/mixture/pad_audio.py +35 -0
sonusai/mixture/resample.py +7 -0
sonusai/mixture/sox_effects.py +195 -0
sonusai/mixture/sox_help.py +650 -0
sonusai/mixture/spectral_mask.py +51 -0
sonusai/mixture/truth.py +61 -0
sonusai/mixture/truth_functions/__init__.py +45 -0
sonusai/mixture/truth_functions/crm.py +105 -0
sonusai/mixture/truth_functions/energy.py +222 -0
sonusai/mixture/truth_functions/file.py +48 -0
sonusai/mixture/truth_functions/metadata.py +24 -0
sonusai/mixture/truth_functions/metrics.py +28 -0
sonusai/mixture/truth_functions/phoneme.py +18 -0
sonusai/mixture/truth_functions/sed.py +98 -0
sonusai/mixture/truth_functions/target.py +142 -0
sonusai/mkwav.py +135 -0
sonusai/onnx_predict.py +363 -0
sonusai/parse/__init__.py +0 -0
sonusai/parse/expand.py +156 -0
sonusai/parse/parse_source_directive.py +129 -0
sonusai/parse/rand.py +214 -0
sonusai/py.typed +0 -0
sonusai/queries/__init__.py +0 -0
sonusai/queries/queries.py +239 -0
sonusai/rs.abi3.so +0 -0
sonusai/rs.pyi +1 -0
sonusai/rust/__init__.py +0 -0
sonusai/speech/__init__.py +0 -0
sonusai/speech/l2arctic.py +121 -0
sonusai/speech/librispeech.py +102 -0
sonusai/speech/mcgill.py +71 -0
sonusai/speech/textgrid.py +89 -0
sonusai/speech/timit.py +138 -0
sonusai/speech/types.py +12 -0
sonusai/speech/vctk.py +53 -0
sonusai/speech/voxceleb.py +108 -0
sonusai/utils/__init__.py +3 -0
sonusai/utils/asl_p56.py +130 -0
sonusai/utils/asr.py +91 -0
sonusai/utils/asr_functions/__init__.py +3 -0
sonusai/utils/asr_functions/aaware_whisper.py +69 -0
sonusai/utils/audio_devices.py +50 -0
sonusai/utils/braced_glob.py +50 -0
sonusai/utils/calculate_input_shape.py +26 -0
sonusai/utils/choice.py +51 -0
sonusai/utils/compress.py +25 -0
sonusai/utils/convert_string_to_number.py +6 -0
sonusai/utils/create_timestamp.py +5 -0
sonusai/utils/create_ts_name.py +14 -0
sonusai/utils/dataclass_from_dict.py +27 -0
sonusai/utils/db.py +16 -0
sonusai/utils/docstring.py +53 -0
sonusai/utils/energy_f.py +44 -0
sonusai/utils/engineering_number.py +166 -0
sonusai/utils/evaluate_random_rule.py +15 -0
sonusai/utils/get_frames_per_batch.py +2 -0
sonusai/utils/get_label_names.py +20 -0
sonusai/utils/grouper.py +6 -0
sonusai/utils/human_readable_size.py +7 -0
sonusai/utils/keyboard_interrupt.py +12 -0
sonusai/utils/load_object.py +21 -0
sonusai/utils/max_text_width.py +9 -0
sonusai/utils/model_utils.py +28 -0
sonusai/utils/numeric_conversion.py +11 -0
sonusai/utils/onnx_utils.py +155 -0
sonusai/utils/parallel.py +162 -0
sonusai/utils/path_info.py +7 -0
sonusai/utils/print_mixture_details.py +60 -0
sonusai/utils/rand.py +13 -0
sonusai/utils/ranges.py +43 -0
sonusai/utils/read_predict_data.py +32 -0
sonusai/utils/reshape.py +154 -0
sonusai/utils/seconds_to_hms.py +7 -0
sonusai/utils/stacked_complex.py +82 -0
sonusai/utils/stratified_shuffle_split.py +170 -0
sonusai/utils/tokenized_shell_vars.py +143 -0
sonusai/utils/write_audio.py +26 -0
sonusai/utils/yes_or_no.py +8 -0
sonusai/vars.py +47 -0
sonusai-1.0.16.dist-info/METADATA +56 -0
sonusai-1.0.16.dist-info/RECORD +150 -0
sonusai-1.0.16.dist-info/WHEEL +4 -0
sonusai-1.0.16.dist-info/entry_points.txt +3 -0

sonusai/config/truth.py ADDED Viewed

@@ -0,0 +1,64 @@
+from sonusai.datatypes import TruthParameter
+def validate_truth_configs(given: dict) -> None:
+    """Validate fields in given 'truth_configs'
+    :param given: The dictionary of the given config
+    """
+    from copy import deepcopy
+    from ..mixture import truth_functions
+    from .constants import REQUIRED_TRUTH_CONFIGS
+    sources = given["sources"]
+    for category, source in sources.items():
+        if "truth_configs" not in source:
+            continue
+        truth_configs = source["truth_configs"]
+        if len(truth_configs) == 0:
+            raise ValueError(f"'truth_configs' in config source '{category}' is empty")
+        for truth_name, truth_config in truth_configs.items():
+            for k in REQUIRED_TRUTH_CONFIGS:
+                if k not in truth_config:
+                    raise AttributeError(
+                        f"'{truth_name}' in source '{category}' truth_configs is missing required '{k}'"
+                    )
+            optional_config = deepcopy(truth_config)
+            for k in REQUIRED_TRUTH_CONFIGS:
+                del optional_config[k]
+            getattr(truth_functions, truth_config["function"] + "_validate")(optional_config)
+def get_truth_parameters(config: dict) -> list[TruthParameter]:
+    """Get the list of truth parameters from a config
+    :param config: Config dictionary
+    :return: List of truth parameters
+    """
+    from copy import deepcopy
+    from ..mixture import truth_functions
+    from .constants import REQUIRED_TRUTH_CONFIGS
+    truth_parameters: list[TruthParameter] = []
+    for category, source_config in config["sources"].items():
+        if "truth_configs" in source_config:
+            for truth_name, truth_config in source_config["truth_configs"].items():
+                optional_config = deepcopy(truth_config)
+                for key in REQUIRED_TRUTH_CONFIGS:
+                    del optional_config[key]
+                parameters = getattr(truth_functions, truth_config["function"] + "_parameters")(
+                    config["feature"],
+                    config["num_classes"],
+                    optional_config,
+                )
+                truth_parameters.append(TruthParameter(category, truth_name, parameters))
+    return truth_parameters

sonusai/constants.py ADDED Viewed

@@ -0,0 +1,14 @@
+from importlib.resources import as_file
+from importlib.resources import files
+SAMPLE_RATE = 16000
+CHANNEL_COUNT = 1
+BIT_DEPTH = 32
+SAMPLE_BYTES = BIT_DEPTH // 8
+FLOAT_BYTES = 4
+with as_file(files("sonusai.data").joinpath("whitenoise.wav")) as path:
+    DEFAULT_NOISE = str(path)
+with as_file(files("sonusai.data").joinpath("speech_ma01_01.wav")) as path:
+    DEFAULT_SPEECH = str(path)

sonusai/data/__init__.py ADDED Viewed

File without changes

sonusai/data/silero_vad_v5.1.jit ADDED Viewed

Binary file

sonusai/data/silero_vad_v5.1.onnx ADDED Viewed

Binary file

sonusai/data/speech_ma01_01.wav ADDED Viewed

Binary file

sonusai/data/whitenoise.wav ADDED Viewed

Binary file

sonusai/datatypes.py ADDED Viewed

@@ -0,0 +1,383 @@
+from collections.abc import Iterable
+from dataclasses import dataclass
+from dataclasses import field
+from typing import Any
+from typing import NamedTuple
+from typing import SupportsIndex
+from typing import TypeAlias
+import numpy as np
+import numpy.typing as npt
+from dataclasses_json import DataClassJsonMixin
+from praatio.utilities.constants import Interval
+AudioT: TypeAlias = npt.NDArray[np.float32]
+Truth: TypeAlias = Any
+TruthDict: TypeAlias = dict[str, Truth]
+TruthsDict: TypeAlias = dict[str, TruthDict]
+Segsnr: TypeAlias = npt.NDArray[np.float32]
+AudioF: TypeAlias = npt.NDArray[np.complex64]
+EnergyT: TypeAlias = npt.NDArray[np.float32]
+EnergyF: TypeAlias = npt.NDArray[np.float32]
+Feature: TypeAlias = npt.NDArray[np.float32]
+Predict: TypeAlias = npt.NDArray[np.float32]
+# Json type defined to maintain compatibility with DataClassJsonMixin
+Json: TypeAlias = dict | list | str | int | float | bool | None
+class DataClassSonusAIMixin(DataClassJsonMixin):
+    def __str__(self):
+        return f"{self.to_dict()}"
+    # Override DataClassJsonMixin to remove dictionary keys with values of None
+    def to_dict(self, encode_json=False) -> dict[str, Json]:
+        def del_none(d):
+            if isinstance(d, dict):
+                for key, value in list(d.items()):
+                    if value is None:
+                        del d[key]
+                    elif isinstance(value, dict):
+                        del_none(value)
+                    elif isinstance(value, list):
+                        for item in value:
+                            del_none(item)
+            elif isinstance(d, list):
+                for item in d:
+                    del_none(item)
+            return d
+        return del_none(super().to_dict(encode_json))
+@dataclass(frozen=True)
+class TruthConfig(DataClassSonusAIMixin):
+    function: str
+    stride_reduction: str
+    config: dict = field(default_factory=dict)
+    def __hash__(self):
+        return hash(self.to_json())
+    def __eq__(self, other):
+        return isinstance(other, TruthConfig) and hash(self) == hash(other)
+TruthConfigs: TypeAlias = dict[str, TruthConfig]
+TruthsConfigs: TypeAlias = dict[str, TruthConfigs]
+NumberStr: TypeAlias = float | int | str
+OptionalNumberStr: TypeAlias = NumberStr | None
+OptionalListNumberStr: TypeAlias = list[NumberStr] | None
+EffectList: TypeAlias = list[str]
+@dataclass
+class Effects(DataClassSonusAIMixin):
+    pre: EffectList
+    post: EffectList = field(default_factory=EffectList)
+class UniversalSNRGenerator:
+    def __init__(self, raw_value: float | str) -> None:
+        self._raw_value = str(raw_value)
+        self.is_random = isinstance(raw_value, str) and raw_value.startswith("rand")
+    @property
+    def value(self) -> float:
+        from sonusai.parse.rand import rand
+        if self.is_random:
+            return float(rand(self._raw_value))
+        return float(self._raw_value)
+class UniversalSNR(float):
+    def __new__(cls, value: float, is_random: bool = False):
+        return float.__new__(cls, value)
+    def __init__(self, value: float, is_random: bool = False) -> None:
+        float.__init__(value)
+        self._is_random = bool(is_random)
+    @property
+    def is_random(self) -> bool:
+        return self._is_random
+Speaker: TypeAlias = dict[str, str]
+@dataclass
+class SourceFile(DataClassSonusAIMixin):
+    category: str
+    class_indices: list[int]
+    name: str
+    samples: int
+    truth_configs: TruthConfigs
+    class_balancing_effect: EffectList | None = None
+    id: int = -1
+    level_type: str | None = None
+    speaker_id: int | None = None
+    @property
+    def duration(self) -> float:
+        from .constants import SAMPLE_RATE
+        return self.samples / SAMPLE_RATE
+@dataclass
+class EffectedFile(DataClassSonusAIMixin):
+    file_id: int
+    effect_id: int
+ClassCount: TypeAlias = list[int]
+GeneralizedIDs: TypeAlias = str | int | list[int] | range
+@dataclass(frozen=True)
+class SpectralMask(DataClassSonusAIMixin):
+    f_max_width: int
+    f_num: int
+    t_max_width: int
+    t_num: int
+    t_max_percent: int
+@dataclass(frozen=True)
+class TruthParameter(DataClassSonusAIMixin):
+    category: str
+    name: str
+    parameters: int | None
+@dataclass
+class Source(DataClassSonusAIMixin):
+    effects: Effects
+    file_id: int
+    pre_tempo: float = 1
+    loop: bool = False
+    snr: UniversalSNR = field(default_factory=lambda: UniversalSNR(0))
+    snr_gain: float = 0
+    start: int = 0
+Sources: TypeAlias = dict[str, Source]
+SourcesAudioT: TypeAlias = dict[str, AudioT]
+SourcesAudioF: TypeAlias = dict[str, AudioF]
+@dataclass
+class Mixture(DataClassSonusAIMixin):
+    name: str
+    samples: int
+    all_sources: Sources
+    spectral_mask_id: int
+    spectral_mask_seed: int
+    @property
+    def all_source_ids(self) -> dict[str, int]:
+        return {category: source.file_id for category, source in self.all_sources.items()}
+    @property
+    def sources(self) -> Sources:
+        return {category: source for category, source in self.all_sources.items() if category != "noise"}
+    @property
+    def source_ids(self) -> dict[str, int]:
+        return {category: source.file_id for category, source in self.sources.items()}
+    @property
+    def noise(self) -> Source:
+        return self.all_sources["noise"]
+    @property
+    def noise_id(self) -> int:
+        return self.noise.file_id
+    @property
+    def source_effects(self) -> dict[str, Effects]:
+        return {category: source.effects for category, source in self.sources.items()}
+    @property
+    def noise_effects(self) -> Effects:
+        return self.noise.effects
+    @property
+    def is_noise_only(self) -> bool:
+        return self.noise.snr < -96
+    @property
+    def is_source_only(self) -> bool:
+        return self.noise.snr > 96
+@dataclass(frozen=True)
+class TransformConfig:
+    length: int
+    overlap: int
+    bin_start: int
+    bin_end: int
+    ttype: str
+@dataclass(frozen=True)
+class FeatureGeneratorConfig:
+    feature_mode: str
+    truth_parameters: dict[str, dict[str, int | None]]
+@dataclass(frozen=True)
+class FeatureGeneratorInfo:
+    decimation: int
+    stride: int
+    step: int
+    feature_parameters: int
+    ft_config: TransformConfig
+    eft_config: TransformConfig
+    it_config: TransformConfig
+ASRConfigs: TypeAlias = dict[str, dict[str, Any]]
+@dataclass
+class GenMixData:
+    mixture: AudioT | None = None
+    truth_t: TruthsDict | None = None
+    segsnr_t: Segsnr | None = None
+    sources: SourcesAudioT | None = None
+    source: AudioT | None = None
+    noise: AudioT | None = None
+@dataclass
+class GenFTData:
+    feature: Feature | None = None
+    truth_f: TruthsDict | None = None
+    segsnr: Segsnr | None = None
+@dataclass
+class ImpulseResponseData:
+    data: AudioT
+    sample_rate: int
+    delay: int
+@dataclass
+class ImpulseResponseFile(DataClassSonusAIMixin):
+    name: str
+    tags: list[str]
+    delay: str | int = "auto"
+@dataclass
+class MixtureDatabaseConfig(DataClassSonusAIMixin):
+    asr_configs: ASRConfigs
+    class_balancing: bool
+    class_labels: list[str]
+    class_weights_threshold: list[float]
+    feature: str
+    ir_files: list[ImpulseResponseFile]
+    mixtures: list[Mixture]
+    num_classes: int
+    source_files: dict[str, list[SourceFile]]
+    spectral_masks: list[SpectralMask]
+SpeechMetadata: TypeAlias = str | list[Interval] | None
+class SnrFMetrics(NamedTuple):
+    avg: float | None = None
+    std: float | None = None
+    db_avg: float | None = None
+    db_std: float | None = None
+class SnrFBinMetrics(NamedTuple):
+    avg: np.ndarray | None = None
+    std: np.ndarray | None = None
+    db_avg: np.ndarray | None = None
+    db_std: np.ndarray | None = None
+class SpeechMetrics(NamedTuple):
+    csig: float | None = None
+    cbak: float | None = None
+    covl: float | None = None
+class AudioStatsMetrics(NamedTuple):
+    dco: float | None = None
+    min: float | None = None
+    max: float | None = None
+    pkdb: float | None = None
+    lrms: float | None = None
+    pkr: float | None = None
+    tr: float | None = None
+    cr: float | None = None
+    fl: float | None = None
+    pkc: float | None = None
+@dataclass
+class MetricDoc:
+    category: str
+    name: str
+    description: str
+class MetricDocs(list[MetricDoc]):
+    def __init__(self, __iterable: Iterable[MetricDoc]) -> None:
+        super().__init__(item for item in __iterable)
+    def __setitem__(self, __key: SupportsIndex, __value: MetricDoc) -> None:  # type: ignore[override]
+        super().__setitem__(__key, __value)
+    def insert(self, __index: SupportsIndex, __object: MetricDoc) -> None:
+        super().insert(__index, __object)
+    def append(self, __object: MetricDoc) -> None:
+        super().append(__object)
+    def extend(self, __iterable: Iterable[MetricDoc]) -> None:
+        if isinstance(__iterable, type(self)):
+            super().extend(__iterable)
+        else:
+            super().extend(item for item in __iterable)
+    @property
+    def pretty(self) -> str:
+        max_category_len = ((max([len(item.category) for item in self]) + 9) // 10) * 10
+        max_name_len = 2 + ((max([len(item.name) for item in self]) + 1) // 2) * 2
+        categories: list[str] = []
+        for item in self:
+            if item.category not in categories:
+                categories.append(item.category)
+        result = ""
+        for category in categories:
+            result += f"{category}\n"
+            result += "-" * max_category_len + "\n"
+            for item in [sub for sub in self if sub.category == category]:
+                result += f"  {item.name:<{max_name_len}}{item.description}\n"
+            result += "\n"
+        return result
+    @property
+    def names(self) -> set[str]:
+        return {item.name for item in self}