PyPI - sonusai - Versions diffs - 0.16.0__py3-none-any.whl → 0.17.0__py3-none-any.whl - Mend

sonusai 0.16.0py3-none-any.whl → 0.17.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (26) hide show

sonusai/__init__.py +1 -0
sonusai/audiofe.py +157 -61
sonusai/calc_metric_spenh-save.py +1334 -0
sonusai/calc_metric_spenh.py +15 -8
sonusai/genft.py +15 -6
sonusai/genmix.py +14 -6
sonusai/genmixdb.py +14 -6
sonusai/gentcst.py +13 -6
sonusai/lsdb.py +15 -5
sonusai/mkmanifest.py +14 -6
sonusai/mkwav.py +15 -6
sonusai/onnx_predict-old.py +240 -0
sonusai/onnx_predict-save.py +487 -0
sonusai/onnx_predict.py +446 -182
sonusai/ovino_predict.py +508 -0
sonusai/ovino_query_devices.py +47 -0
sonusai/plot.py +16 -6
sonusai/post_spenh_targetf.py +13 -6
sonusai/summarize_metric_spenh.py +71 -0
sonusai/torchl_onnx-old.py +216 -0
sonusai/tplot.py +14 -6
sonusai/utils/onnx_utils.py +128 -39
{sonusai-0.16.0.dist-info → sonusai-0.17.0.dist-info}/METADATA +1 -1
{sonusai-0.16.0.dist-info → sonusai-0.17.0.dist-info}/RECORD +26 -19
{sonusai-0.16.0.dist-info → sonusai-0.17.0.dist-info}/WHEEL +1 -1
{sonusai-0.16.0.dist-info → sonusai-0.17.0.dist-info}/entry_points.txt +0 -0

sonusai/calc_metric_spenh.py CHANGED Viewed

@@ -60,6 +60,7 @@ Metric and extraction data are written into prediction location PLOC as separate
 Inputs:
 """
+import signal
 from dataclasses import dataclass
 from typing import Optional
@@ -67,14 +68,24 @@ import matplotlib
 import matplotlib.pyplot as plt
 import numpy as np
 import pandas as pd
-from sonusai import logger
 from sonusai.mixture import AudioF
 from sonusai.mixture import AudioT
 from sonusai.mixture import Feature
 from sonusai.mixture import MixtureDatabase
 from sonusai.mixture import Predict
+def signal_handler(_sig, _frame):
+    import sys
+    from sonusai import logger
+    logger.info('Canceled due to keyboard interrupt')
+    sys.exit(1)
+signal.signal(signal.SIGINT, signal_handler)
 matplotlib.use('SVG')
@@ -1145,7 +1156,7 @@ def main():
         fnb = 'metric_spenh_whspaaw_' + whisper_model + '_'
         logger.info(f'WER enabled with method {wer_method} and whisper model {whisper_model}')
         enable_asr_warmup = True
-    elif wer_method == 'fastwhisper':
+    elif wer_method == 'faster_whisper':
         fnb = 'metric_spenh_fwhsp_' + whisper_model + '_'
         logger.info(f'WER enabled with method {wer_method} and whisper model {whisper_model}')
         enable_asr_warmup = True
@@ -1326,8 +1337,4 @@ def main():
 if __name__ == '__main__':
-    try:
-        main()
-    except KeyboardInterrupt:
-        logger.info('Canceled due to keyboard interrupt')
-        exit()
+    main()

sonusai/genft.py CHANGED Viewed

@@ -23,14 +23,26 @@ Outputs the following to the mixture database directory:
     genft.log
 """
+import signal
 from dataclasses import dataclass
-from sonusai import logger
 from sonusai.mixture import GenFTData
 from sonusai.mixture import GeneralizedIDs
 from sonusai.mixture import MixtureDatabase
+def signal_handler(_sig, _frame):
+    import sys
+    from sonusai import logger
+    logger.info('Canceled due to keyboard interrupt')
+    sys.exit(1)
+signal.signal(signal.SIGINT, signal_handler)
 @dataclass
 class MPGlobal:
     mixdb: MixtureDatabase = None
@@ -123,6 +135,7 @@ def main() -> None:
     from sonusai import create_file_handler
     from sonusai import initial_log_messages
+    from sonusai import logger
     from sonusai import update_console_handler
     from sonusai.mixture import check_audio_files_exist
     from sonusai.utils import human_readable_size
@@ -177,8 +190,4 @@ def main() -> None:
 if __name__ == '__main__':
-    try:
-        main()
-    except KeyboardInterrupt:
-        logger.info('Canceled due to keyboard interrupt')
-        raise SystemExit(0)
+    main()

sonusai/genmix.py CHANGED Viewed

@@ -27,14 +27,26 @@ Outputs the following to the mixture database directory:
     <id>.txt
     genmix.log
 """
+import signal
 from dataclasses import dataclass
-from sonusai import logger
 from sonusai.mixture import GenMixData
 from sonusai.mixture import GeneralizedIDs
 from sonusai.mixture import MixtureDatabase
+def signal_handler(_sig, _frame):
+    import sys
+    from sonusai import logger
+    logger.info('Canceled due to keyboard interrupt')
+    sys.exit(1)
+signal.signal(signal.SIGINT, signal_handler)
 @dataclass
 class MPGlobal:
     mixdb: MixtureDatabase = None
@@ -210,8 +222,4 @@ def main() -> None:
 if __name__ == '__main__':
-    try:
-        main()
-    except KeyboardInterrupt:
-        logger.info('Canceled due to keyboard interrupt')
-        raise SystemExit(0)
+    main()

sonusai/genmixdb.py CHANGED Viewed

@@ -112,13 +112,25 @@ targets:
 will find all .wav files in the specified directories and process them as targets.
 """
+import signal
 from dataclasses import dataclass
-from sonusai import logger
 from sonusai.mixture import Mixture
 from sonusai.mixture import MixtureDatabase
+def signal_handler(_sig, _frame):
+    import sys
+    from sonusai import logger
+    logger.info('Canceled due to keyboard interrupt')
+    sys.exit(1)
+signal.signal(signal.SIGINT, signal_handler)
 @dataclass
 class MPGlobal:
     mixdb: MixtureDatabase = None
@@ -509,8 +521,4 @@ def main() -> None:
 if __name__ == '__main__':
-    try:
-        main()
-    except KeyboardInterrupt:
-        logger.info('Canceled due to keyboard interrupt')
-        raise SystemExit(0)
+    main()

sonusai/gentcst.py CHANGED Viewed

@@ -44,10 +44,21 @@ Outputs:
     gentcst.log
 """
+import signal
 from dataclasses import dataclass
 from typing import Optional
-from sonusai import logger
+def signal_handler(_sig, _frame):
+    import sys
+    from sonusai import logger
+    logger.info('Canceled due to keyboard interrupt')
+    sys.exit(1)
+signal.signal(signal.SIGINT, signal_handler)
 CONFIG_FILE = 'config.yml'
@@ -621,8 +632,4 @@ def main() -> None:
 if __name__ == '__main__':
-    try:
-        main()
-    except KeyboardInterrupt:
-        logger.info('Canceled due to keyboard interrupt')
-        raise SystemExit(0)
+    main()

sonusai/lsdb.py CHANGED Viewed

@@ -15,11 +15,25 @@ Inputs:
     LOC     A SonusAI mixture database directory.
 """
+import signal
 from sonusai import logger
 from sonusai.mixture import GeneralizedIDs
 from sonusai.mixture import MixtureDatabase
+def signal_handler(_sig, _frame):
+    import sys
+    from sonusai import logger
+    logger.info('Canceled due to keyboard interrupt')
+    sys.exit(1)
+signal.signal(signal.SIGINT, signal_handler)
 def lsdb(mixdb: MixtureDatabase,
          mixids: GeneralizedIDs = None,
          truth_index: int = None,
@@ -142,8 +156,4 @@ def main() -> None:
 if __name__ == '__main__':
-    try:
-        main()
-    except KeyboardInterrupt:
-        logger.info('Canceled due to keyboard interrupt')
-        raise SystemExit(0)
+    main()

sonusai/mkmanifest.py CHANGED Viewed

@@ -46,7 +46,19 @@ Example usage for LibriSpeech:
   sonusai mkmanifest -mlibrispeech -eADAT -oasr_manifest.json --include='*.flac' train-clean-100
   sonusai mkmanifest -m mcgill-speech -e ADAT -o asr_manifest_16k.json 16k-LP7/
 """
-from sonusai import logger
+import signal
+def signal_handler(_sig, _frame):
+    import sys
+    from sonusai import logger
+    logger.info('Canceled due to keyboard interrupt')
+    sys.exit(1)
+signal.signal(signal.SIGINT, signal_handler)
 VALID_METHOD = ['librispeech', 'vctk_noisy_speech', 'mcgill-speech']
@@ -194,8 +206,4 @@ def main() -> None:
 if __name__ == '__main__':
-    try:
-        main()
-    except KeyboardInterrupt:
-        logger.info('Canceled due to keyboard interrupt')
-        raise SystemExit(0)
+    main()

sonusai/mkwav.py CHANGED Viewed

@@ -23,13 +23,25 @@ Outputs the following to the mixture database directory:
     mkwav.log
 """
+import signal
 from dataclasses import dataclass
-from sonusai import logger
 from sonusai.mixture import AudioT
 from sonusai.mixture import MixtureDatabase
+def signal_handler(_sig, _frame):
+    import sys
+    from sonusai import logger
+    logger.info('Canceled due to keyboard interrupt')
+    sys.exit(1)
+signal.signal(signal.SIGINT, signal_handler)
 @dataclass
 class MPGlobal:
     mixdb: MixtureDatabase = None
@@ -120,6 +132,7 @@ def main() -> None:
     import sonusai
     from sonusai import create_file_handler
     from sonusai import initial_log_messages
+    from sonusai import logger
     from sonusai import update_console_handler
     from sonusai.mixture import check_audio_files_exist
     from sonusai.utils import pp_tqdm_imap
@@ -164,8 +177,4 @@ def main() -> None:
 if __name__ == '__main__':
-    try:
-        main()
-    except KeyboardInterrupt:
-        logger.info('Canceled due to keyboard interrupt')
-        raise SystemExit(0)
+    main()

sonusai/onnx_predict-old.py ADDED Viewed

@@ -0,0 +1,240 @@
+"""sonusai predict
+usage: predict [-hvr] [-i MIXID] (-m MODEL) INPUT
+options:
+    -h, --help
+    -v, --verbose               Be verbose.
+    -i MIXID, --mixid MIXID     Mixture ID(s) to generate if input is a mixture database. [default: *].
+    -m MODEL, --model MODEL     Trained ONNX model file.
+    -r, --reset                 Reset model between each file.
+Run prediction on a trained ONNX model using SonusAI genft or WAV data.
+Inputs:
+    MODEL       A SonusAI trained ONNX model file.
+    INPUT       The input data must be one of the following:
+                * WAV
+                  Using the given model, generate feature data and run prediction. A model file must be
+                  provided. The MIXID is ignored.
+                * directory
+                  Using the given SonusAI mixture database directory, generate feature and truth data if not found.
+                  Run prediction. The MIXID is required.
+Outputs the following to opredict-<TIMESTAMP> directory:
+    <id>.h5
+        dataset:    predict
+    onnx_predict.log
+"""
+from sonusai import logger
+from sonusai.mixture import Feature
+from sonusai.mixture import Predict
+from sonusai.utils import SonusAIMetaData
+def main() -> None:
+    from docopt import docopt
+    import sonusai
+    from sonusai.utils import trim_docstring
+    args = docopt(trim_docstring(__doc__), version=sonusai.__version__, options_first=True)
+    verbose = args['--verbose']
+    mixids = args['--mixid']
+    model_name = args['--model']
+    reset = args['--reset']
+    input_name = args['INPUT']
+    from os import makedirs
+    from os.path import isdir
+    from os.path import join
+    from os.path import splitext
+    import h5py
+    import onnxruntime as rt
+    import numpy as np
+    from sonusai import create_file_handler
+    from sonusai import initial_log_messages
+    from sonusai import update_console_handler
+    from sonusai.mixture import MixtureDatabase
+    from sonusai.mixture import get_feature_from_audio
+    from sonusai.mixture import read_audio
+    from sonusai.utils import create_ts_name
+    from sonusai.utils import get_frames_per_batch
+    from sonusai.utils import get_sonusai_metadata
+    output_dir = create_ts_name('opredict')
+    makedirs(output_dir, exist_ok=True)
+    # Setup logging file
+    create_file_handler(join(output_dir, 'onnx_predict.log'))
+    update_console_handler(verbose)
+    initial_log_messages('onnx_predict')
+    model = rt.InferenceSession(model_name, providers=['CPUExecutionProvider'])
+    model_metadata = get_sonusai_metadata(model)
+    batch_size = model_metadata.input_shape[0]
+    if model_metadata.timestep:
+        timesteps = model_metadata.input_shape[1]
+    else:
+        timesteps = 0
+    num_classes = model_metadata.output_shape[-1]
+    frames_per_batch = get_frames_per_batch(batch_size, timesteps)
+    logger.info('')
+    logger.info(f'feature       {model_metadata.feature}')
+    logger.info(f'num_classes   {num_classes}')
+    logger.info(f'batch_size    {batch_size}')
+    logger.info(f'timesteps     {timesteps}')
+    logger.info(f'flatten       {model_metadata.flattened}')
+    logger.info(f'add1ch        {model_metadata.channel}')
+    logger.info(f'truth_mutex   {model_metadata.mutex}')
+    logger.info(f'input_shape   {model_metadata.input_shape}')
+    logger.info(f'output_shape  {model_metadata.output_shape}')
+    logger.info('')
+    if splitext(input_name)[1] == '.wav':
+        # Convert WAV to feature data
+        logger.info('')
+        logger.info(f'Run prediction on {input_name}')
+        audio = read_audio(input_name)
+        feature = get_feature_from_audio(audio=audio, feature_mode=model_metadata.feature)
+        predict = pad_and_predict(feature=feature,
+                                  model_name=model_name,
+                                  model_metadata=model_metadata,
+                                  frames_per_batch=frames_per_batch,
+                                  batch_size=batch_size,
+                                  timesteps=timesteps,
+                                  reset=reset)
+        output_name = splitext(input_name)[0] + '.h5'
+        with h5py.File(output_name, 'a') as f:
+            if 'feature' in f:
+                del f['feature']
+            f.create_dataset(name='feature', data=feature)
+            if 'predict' in f:
+                del f['predict']
+            f.create_dataset(name='predict', data=predict)
+        logger.info(f'Saved results to {output_name}')
+        return
+    if not isdir(input_name):
+        logger.exception(f'Do not know how to process input from {input_name}')
+        raise SystemExit(1)
+    mixdb = MixtureDatabase(input_name)
+    if mixdb.feature != model_metadata.feature:
+        logger.exception(f'Feature in mixture database does not match feature in model')
+        raise SystemExit(1)
+    mixids = mixdb.mixids_to_list(mixids)
+    if reset:
+        # reset mode cycles through each file one at a time
+        for mixid in mixids:
+            feature, _ = mixdb.mixture_ft(mixid)
+            predict = pad_and_predict(feature=feature,
+                                      model_name=model_name,
+                                      model_metadata=model_metadata,
+                                      frames_per_batch=frames_per_batch,
+                                      batch_size=batch_size,
+                                      timesteps=timesteps,
+                                      reset=reset)
+            output_name = join(output_dir, mixdb.mixtures[mixid].name)
+            with h5py.File(output_name, 'a') as f:
+                if 'predict' in f:
+                    del f['predict']
+                f.create_dataset(name='predict', data=predict)
+    else:
+        features: list[Feature] = []
+        file_indices: list[slice] = []
+        total_frames = 0
+        for mixid in mixids:
+            current_feature, _ = mixdb.mixture_ft(mixid)
+            current_frames = current_feature.shape[0]
+            features.append(current_feature)
+            file_indices.append(slice(total_frames, total_frames + current_frames))
+            total_frames += current_frames
+        feature = np.vstack([features[i] for i in range(len(features))])
+        predict = pad_and_predict(feature=feature,
+                                  model_name=model_name,
+                                  model_metadata=model_metadata,
+                                  frames_per_batch=frames_per_batch,
+                                  batch_size=batch_size,
+                                  timesteps=timesteps,
+                                  reset=reset)
+        # Write data to separate files
+        for idx, mixid in enumerate(mixids):
+            output_name = join(output_dir, mixdb.mixtures[mixid].name)
+            with h5py.File(output_name, 'a') as f:
+                if 'predict' in f:
+                    del f['predict']
+                f.create_dataset('predict', data=predict[file_indices[idx]])
+    logger.info(f'Saved results to {output_dir}')
+def pad_and_predict(feature: Feature,
+                    model_name: str,
+                    model_metadata: SonusAIMetaData,
+                    frames_per_batch: int,
+                    batch_size: int,
+                    timesteps: int,
+                    reset: bool) -> Predict:
+    import onnxruntime as rt
+    import numpy as np
+    from sonusai.utils import reshape_inputs
+    from sonusai.utils import reshape_outputs
+    frames = feature.shape[0]
+    padding = frames_per_batch - frames % frames_per_batch
+    feature = np.pad(array=feature, pad_width=((0, padding), (0, 0), (0, 0)))
+    feature, _ = reshape_inputs(feature=feature,
+                                batch_size=batch_size,
+                                timesteps=timesteps,
+                                flatten=model_metadata.flattened,
+                                add1ch=model_metadata.channel)
+    sequences = feature.shape[0] // model_metadata.input_shape[0]
+    feature = np.reshape(feature, [sequences, *model_metadata.input_shape])
+    model = rt.InferenceSession(model_name, providers=['CPUExecutionProvider'])
+    output_names = [n.name for n in model.get_outputs()]
+    input_names = [n.name for n in model.get_inputs()]
+    predict = []
+    for sequence in range(sequences):
+        predict.append(model.run(output_names, {input_names[0]: feature[sequence]}))
+        if reset:
+            model = rt.InferenceSession(model_name, providers=['CPUExecutionProvider'])
+    predict_arr = np.vstack(predict)
+    # Combine [sequences, batch_size, ...] into [frames, ...]
+    predict_shape = predict_arr.shape
+    predict_arr = np.reshape(predict_arr, [predict_shape[0] * predict_shape[1], *predict_shape[2:]])
+    predict_arr, _ = reshape_outputs(predict=predict_arr, timesteps=timesteps)
+    predict_arr = predict_arr[:frames, :]
+    return predict_arr
+if __name__ == '__main__':
+    try:
+        main()
+    except KeyboardInterrupt:
+        logger.info('Canceled due to keyboard interrupt')
+        raise SystemExit(0)

sonusai 0.16.0__py3-none-any.whl → 0.17.0__py3-none-any.whl

sonusai 0.16.0py3-none-any.whl → 0.17.0py3-none-any.whl