PyPI - nkululeko - Versions diffs - 0.89.2__py3-none-any.whl → 0.90.1__py3-none-any.whl - Mend

nkululeko 0.89.2py3-none-any.whl → 0.90.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (99) hide show

nkululeko/aug_train.py +6 -4
nkululeko/augment.py +8 -6
nkululeko/augmenting/augmenter.py +4 -4
nkululeko/augmenting/randomsplicer.py +12 -9
nkululeko/augmenting/randomsplicing.py +2 -3
nkululeko/augmenting/resampler.py +9 -6
nkululeko/autopredict/ap_age.py +4 -2
nkululeko/autopredict/ap_arousal.py +4 -2
nkululeko/autopredict/ap_dominance.py +3 -2
nkululeko/autopredict/ap_gender.py +4 -2
nkululeko/autopredict/ap_mos.py +5 -2
nkululeko/autopredict/ap_pesq.py +5 -2
nkululeko/autopredict/ap_sdr.py +5 -2
nkululeko/autopredict/ap_snr.py +5 -2
nkululeko/autopredict/ap_stoi.py +5 -2
nkululeko/autopredict/ap_valence.py +4 -2
nkululeko/autopredict/estimate_snr.py +10 -14
nkululeko/cacheddataset.py +1 -1
nkululeko/constants.py +1 -1
nkululeko/data/dataset.py +19 -16
nkululeko/data/dataset_csv.py +5 -3
nkululeko/demo-ft.py +29 -0
nkululeko/demo_feats.py +5 -4
nkululeko/demo_predictor.py +3 -4
nkululeko/ensemble.py +27 -28
nkululeko/experiment.py +11 -7
nkululeko/experiment_felix.py +728 -0
nkululeko/explore.py +1 -0
nkululeko/export.py +7 -5
nkululeko/feat_extract/feats_agender.py +5 -4
nkululeko/feat_extract/feats_agender_agender.py +7 -6
nkululeko/feat_extract/feats_analyser.py +18 -16
nkululeko/feat_extract/feats_ast.py +9 -8
nkululeko/feat_extract/feats_auddim.py +3 -5
nkululeko/feat_extract/feats_audmodel.py +2 -2
nkululeko/feat_extract/feats_clap.py +9 -12
nkululeko/feat_extract/feats_hubert.py +2 -3
nkululeko/feat_extract/feats_import.py +5 -4
nkululeko/feat_extract/feats_mld.py +3 -5
nkululeko/feat_extract/feats_mos.py +4 -3
nkululeko/feat_extract/feats_opensmile.py +4 -3
nkululeko/feat_extract/feats_oxbow.py +5 -4
nkululeko/feat_extract/feats_praat.py +4 -7
nkululeko/feat_extract/feats_snr.py +3 -5
nkululeko/feat_extract/feats_spectra.py +8 -9
nkululeko/feat_extract/feats_spkrec.py +6 -11
nkululeko/feat_extract/feats_squim.py +2 -4
nkululeko/feat_extract/feats_trill.py +2 -5
nkululeko/feat_extract/feats_wav2vec2.py +8 -4
nkululeko/feat_extract/feats_wavlm.py +2 -3
nkululeko/feat_extract/feats_whisper.py +4 -6
nkululeko/feat_extract/featureset.py +4 -2
nkululeko/feat_extract/feinberg_praat.py +1 -3
nkululeko/feat_extract/transformer_feature_extractor.py +147 -0
nkululeko/file_checker.py +3 -3
nkululeko/filter_data.py +3 -1
nkululeko/fixedsegment.py +83 -0
nkululeko/models/model.py +3 -5
nkululeko/models/model_bayes.py +1 -0
nkululeko/models/model_cnn.py +4 -6
nkululeko/models/model_gmm.py +13 -9
nkululeko/models/model_knn.py +1 -0
nkululeko/models/model_knn_reg.py +1 -0
nkululeko/models/model_lin_reg.py +1 -0
nkululeko/models/model_mlp.py +2 -3
nkululeko/models/model_mlp_regression.py +1 -6
nkululeko/models/model_svm.py +2 -2
nkululeko/models/model_svr.py +1 -0
nkululeko/models/model_tree.py +2 -3
nkululeko/models/model_tree_reg.py +1 -0
nkululeko/models/model_tuned.py +54 -33
nkululeko/models/model_xgb.py +1 -0
nkululeko/models/model_xgr.py +1 -0
nkululeko/multidb.py +1 -0
nkululeko/nkululeko.py +1 -1
nkululeko/plots.py +1 -1
nkululeko/predict.py +4 -5
nkululeko/reporting/defines.py +6 -8
nkululeko/reporting/latex_writer.py +3 -3
nkululeko/reporting/report.py +2 -2
nkululeko/reporting/report_item.py +1 -0
nkululeko/reporting/reporter.py +20 -19
nkululeko/resample.py +8 -12
nkululeko/resample_cli.py +99 -0
nkululeko/runmanager.py +3 -1
nkululeko/scaler.py +1 -1
nkululeko/segment.py +6 -5
nkululeko/segmenting/seg_inaspeechsegmenter.py +3 -3
nkululeko/segmenting/seg_silero.py +4 -4
nkululeko/syllable_nuclei.py +9 -22
nkululeko/test_pretrain.py +6 -7
nkululeko/utils/stats.py +0 -1
nkululeko/utils/util.py +2 -3
{nkululeko-0.89.2.dist-info → nkululeko-0.90.1.dist-info}/METADATA +12 -2
nkululeko-0.90.1.dist-info/RECORD +119 -0
{nkululeko-0.89.2.dist-info → nkululeko-0.90.1.dist-info}/WHEEL +1 -1
nkululeko-0.89.2.dist-info/RECORD +0 -114
{nkululeko-0.89.2.dist-info → nkululeko-0.90.1.dist-info}/LICENSE +0 -0
{nkululeko-0.89.2.dist-info → nkululeko-0.90.1.dist-info}/top_level.txt +0 -0

nkululeko/ensemble.py CHANGED Viewed

@@ -15,28 +15,20 @@ Raises:
     ValueError: If an unknown ensemble method is provided.
     AssertionError: If the number of config files is less than 2 for majority voting.
 """
 #!/usr/bin/env python
 # -*- coding: utf-8 -*-
-from typing import List
 import configparser
 import time
 from argparse import ArgumentParser
 from pathlib import Path
+from typing import List
 import numpy as np
 import pandas as pd
-import matplotlib.pyplot as plt
-from sklearn.metrics import(
-    RocCurveDisplay,
-    balanced_accuracy_score,
-    classification_report,
-    auc,
-    roc_auc_score,
-    roc_curve
-)
+from sklearn.metrics import balanced_accuracy_score, classification_report
 from nkululeko.constants import VERSION
 from nkululeko.experiment import Experiment
@@ -169,17 +161,19 @@ def performance_weighted_ensemble(ensemble_preds_ls, labels, weights):
     # asserts weiths in decimal 0-1
     assert all(0 <= w <= 1 for w in weights), "Weights must be between 0 and 1"
     # assert lenght of weights matches number of models
-    assert len(weights) == len(ensemble_preds_ls), "Number of weights must match number of models"
+    assert len(weights) == len(
+        ensemble_preds_ls
+    ), "Number of weights must match number of models"
     # Normalize weights
     total_weight = sum(weights)
     weights = [weight / total_weight for weight in weights]
     for idx in ensemble_preds_ls[0].index:
         class_probabilities = {label: 0 for label in labels}
         for df, weight in zip(ensemble_preds_ls, weights):
             row = df.loc[idx]
             for label in labels:
@@ -192,10 +186,12 @@ def performance_weighted_ensemble(ensemble_preds_ls, labels, weights):
     return final_predictions, final_confidences
 def ensemble_predictions(
-    config_files: List[str], method: str, threshold: float, weights: List[float], no_labels: bool
+    config_files: List[str],
+    method: str,
+    threshold: float,
+    weights: List[float],
+    no_labels: bool,
 ) -> pd.DataFrame:
     """
     Ensemble predictions from multiple experiments.
@@ -261,17 +257,20 @@ def ensemble_predictions(
             ensemble_preds_ls, labels, threshold
         )
     elif method == "uncertainty_weighted":
-        ensemble_preds["predicted"], ensemble_preds["uncertainty"] = (
-            uncertainty_weighted_ensemble(ensemble_preds_ls, labels)
-        )
+        (
+            ensemble_preds["predicted"],
+            ensemble_preds["uncertainty"],
+        ) = uncertainty_weighted_ensemble(ensemble_preds_ls, labels)
     elif method == "confidence_weighted":
-        ensemble_preds["predicted"], ensemble_preds["confidence"] = (
-            confidence_weighted_ensemble(ensemble_preds_ls, labels)
-        )
+        (
+            ensemble_preds["predicted"],
+            ensemble_preds["confidence"],
+        ) = confidence_weighted_ensemble(ensemble_preds_ls, labels)
     elif method == "performance_weighted":
-        ensemble_preds["predicted"], ensemble_preds["confidence"] = (
-            performance_weighted_ensemble(ensemble_preds_ls, labels, weights)
-        )
+        (
+            ensemble_preds["predicted"],
+            ensemble_preds["confidence"],
+        ) = performance_weighted_ensemble(ensemble_preds_ls, labels, weights)
     else:
         raise ValueError(f"Unknown ensemble method: {method}")

nkululeko/experiment.py CHANGED Viewed

@@ -5,13 +5,13 @@ import pickle
 import random
 import time
+import audeer
+import audformat
 import numpy as np
 import pandas as pd
 from sklearn.preprocessing import LabelEncoder
-import audeer
-import audformat
+import nkululeko.glob_conf as glob_conf
 from nkululeko.data.dataset import Dataset
 from nkululeko.data.dataset_csv import Dataset_CSV
 from nkululeko.demo_predictor import Demo_predictor
@@ -19,7 +19,6 @@ from nkululeko.feat_extract.feats_analyser import FeatureAnalyser
 from nkululeko.feature_extractor import FeatureExtractor
 from nkululeko.file_checker import FileChecker
 from nkululeko.filter_data import DataFilter
-import nkululeko.glob_conf as glob_conf
 from nkululeko.plots import Plots
 from nkululeko.reporting.report import Report
 from nkululeko.runmanager import Runmanager
@@ -101,12 +100,15 @@ class Experiment:
             if data.got_speaker:
                 self.got_speaker = True
             self.datasets.update({d: data})
-        self.target = self.util.config_val("DATA", "target", "emotion")
+        self.target = self.util.config_val("DATA", "target", "none")
         glob_conf.set_target(self.target)
         # print target via debug
         self.util.debug(f"target: {self.target}")
         # print keys/column
         dbs = ",".join(list(self.datasets.keys()))
+        if self.target == "none":
+            self.util.debug(f"loaded databases {dbs}")
+            return
         labels = self.util.config_val("DATA", "labels", False)
         auto_labels = list(next(iter(self.datasets.values())).df[self.target].unique())
         if labels:
@@ -191,7 +193,8 @@ class Experiment:
             self.df_train, self.df_test = pd.DataFrame(), pd.DataFrame()
             for d in self.datasets.values():
                 d.split()
-                d.prepare_labels()
+                if self.target != "none":
+                    d.prepare_labels()
                 if d.df_train.shape[0] == 0:
                     self.util.debug(f"warn: {d.name} train empty")
                 self.df_train = pd.concat([self.df_train, d.df_train])
@@ -207,6 +210,8 @@ class Experiment:
             self.df_test.to_csv(storage_test)
             self.df_train.to_csv(storage_train)
+        if self.target == "none":
+            return
         self.util.copy_flags(self, self.df_test)
         self.util.copy_flags(self, self.df_train)
         # Try data checks
@@ -738,7 +743,6 @@ class Experiment:
         if model.is_ann():
             print("converting to onnx from torch")
         else:
             print("converting to onnx from sklearn")
         # save the rest
         f = open(filename, "wb")

nkululeko 0.89.2__py3-none-any.whl → 0.90.1__py3-none-any.whl

nkululeko 0.89.2py3-none-any.whl → 0.90.1py3-none-any.whl