PyPI - nkululeko - Versions diffs - 0.89.2__py3-none-any.whl → 0.90.0__py3-none-any.whl - Mend

nkululeko 0.89.2py3-none-any.whl → 0.90.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

nkululeko/augment.py +2 -2
nkululeko/augmenting/randomsplicer.py +6 -3
nkululeko/constants.py +1 -1
nkululeko/data/dataset.py +8 -2
nkululeko/experiment.py +8 -2
nkululeko/plots.py +1 -1
{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/METADATA +7 -1
{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/RECORD +11 -11
{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/LICENSE +0 -0
{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/WHEEL +0 -0
{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/top_level.txt +0 -0

nkululeko/augment.py CHANGED Viewed

@@ -37,8 +37,8 @@ def doit(config_file):
     filename = util.config_val("AUGMENT", "result", "augmented.csv")
     filename = f"{expr.data_dir}/{filename}"
-    if os.path.exists(filename):
+    no_reuse = eval(util.config_val("DATA", "no_reuse", "False"))
+    if os.path.exists(filename) and not no_reuse:
         util.debug("files already augmented")
     else:
         # load the data

nkululeko/augmenting/randomsplicer.py CHANGED Viewed

@@ -41,14 +41,17 @@ class Randomsplicer:
             * top_db: top db level for silence to be recognized (default: 12)
         """
-        p_reverse = 0.3
-        top_db = 12
+        p_reverse = float(self.util.config_val("AUGMENT", "p_reverse", "0.3"))
+        top_db = float(self.util.config_val("AUGMENT", "top_db", "12"))
         files = self.df.index.get_level_values(0).values
         store = self.util.get_path("store")
         filepath = f"{store}randomspliced/"
         audeer.mkdir(filepath)
-        self.util.debug(f"random splicing {sample_selection} samples to {filepath}")
+        self.util.debug(
+            f"random splicing {sample_selection} samples to {filepath}, "
+            + f"p_reverse = {p_reverse}, top_db = {top_db}",
+        )
         newpath = ""
         index_map = {}
         for i, f in enumerate(tqdm(files)):

nkululeko/constants.py CHANGED Viewed

@@ -1,2 +1,2 @@
-VERSION="0.89.2"
+VERSION="0.90.0"
 SAMPLING_RATE = 16000

nkululeko/data/dataset.py CHANGED Viewed

@@ -30,8 +30,8 @@ class Dataset:
     def __init__(self, name):
         """Constructor setting up name and configuration"""
         self.name = name
-        self.target = glob_conf.config["DATA"]["target"]
         self.util = Util("dataset")
+        self.target = self.util.config_val("DATA", "target", "none")
         self.plot = Plots()
         self.limit = int(self.util.config_val_data(self.name, "limit", 0))
         self.start_fresh = eval(self.util.config_val("DATA", "no_reuse", "False"))
@@ -127,6 +127,9 @@ class Dataset:
             self.got_gender,
             self.got_age,
         ) = self._get_df_for_lists(self.db, df_files_tables)
+        if df.shape[0] > 0 and self.target == "none":
+            self.df = df
+            return
         if False in {
             self.is_labeled,
             self.got_speaker,
@@ -553,7 +556,10 @@ class Dataset:
             " samples in train/test"
         )
         # because this generates new train/test sample quantaties, the feature extraction has to be done again
-        glob_conf.config["FEATS"]["needs_feature_extraction"] = "True"
+        try:
+            glob_conf.config["FEATS"]["needs_feature_extraction"] = "True"
+        except KeyError:
+            pass
     def random_split(self):
         """One way to split train and eval sets: Specify percentage of random samples"""

nkululeko/experiment.py CHANGED Viewed

@@ -101,12 +101,15 @@ class Experiment:
             if data.got_speaker:
                 self.got_speaker = True
             self.datasets.update({d: data})
-        self.target = self.util.config_val("DATA", "target", "emotion")
+        self.target = self.util.config_val("DATA", "target", "none")
         glob_conf.set_target(self.target)
         # print target via debug
         self.util.debug(f"target: {self.target}")
         # print keys/column
         dbs = ",".join(list(self.datasets.keys()))
+        if self.target == "none":
+            self.util.debug(f"loaded databases {dbs}")
+            return
         labels = self.util.config_val("DATA", "labels", False)
         auto_labels = list(next(iter(self.datasets.values())).df[self.target].unique())
         if labels:
@@ -191,7 +194,8 @@ class Experiment:
             self.df_train, self.df_test = pd.DataFrame(), pd.DataFrame()
             for d in self.datasets.values():
                 d.split()
-                d.prepare_labels()
+                if self.target != "none":
+                    d.prepare_labels()
                 if d.df_train.shape[0] == 0:
                     self.util.debug(f"warn: {d.name} train empty")
                 self.df_train = pd.concat([self.df_train, d.df_train])
@@ -207,6 +211,8 @@ class Experiment:
             self.df_test.to_csv(storage_test)
             self.df_train.to_csv(storage_train)
+        if self.target == "none":
+            return
         self.util.copy_flags(self, self.df_test)
         self.util.copy_flags(self, self.df_train)
         # Try data checks

nkululeko/plots.py CHANGED Viewed

@@ -263,7 +263,7 @@ class Plots:
     def plotcatcont(self, df, cat_col, cont_col, xlab, ylab):
         """Plot relation of categorical distribution with continuous."""
-        dist_type = self.util.config_val("EXPL", "dist_type", "hist")
+        dist_type = self.util.config_val("EXPL", "dist_type", "kde")
         cats, cat_str, es = su.get_effect_size(df, cat_col, cont_col)
         model_type = self.util.get_model_type()
         if dist_type == "hist" and model_type != "tree":

{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: nkululeko
-Version: 0.89.2
+Version: 0.90.0
 Summary: Machine learning audio prediction experiments based on templates
 Home-page: https://github.com/felixbur/nkululeko
 Author: Felix Burkhardt
@@ -356,6 +356,12 @@ F. Burkhardt, Johannes Wagner, Hagen Wierstorf, Florian Eyben and Björn Schulle
 Changelog
 =========
+Version 0.90.0
+--------------
+* augmentation can now be done without target
+* random splicing params configurable
+* made kde default for plot continous/categorical plots
 Version 0.89.2
 --------------
 * fix shap value calculation

{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/RECORD RENAMED Viewed

@@ -1,13 +1,13 @@
 nkululeko/__init__.py,sha256=62f8HiEzJ8rG2QlTFJXUCMpvuH3fKI33DoJSj33mscc,63
 nkululeko/aug_train.py,sha256=YhuZnS_WVWnun9G-M6g5n6rbRxoVREz6Zh7k6qprFNQ,3194
-nkululeko/augment.py,sha256=4MG0apTAG5RgkuJrYEjGgDdbodZWi_HweSPNI1JJ5QA,3051
+nkululeko/augment.py,sha256=xNeOR22sXHD5mxv0SEe6kvgEXX0RtiUL4BK-m-BDfcM,3133
 nkululeko/cacheddataset.py,sha256=lIJ6hUo5LoxSrzXtWV8mzwO7wRtUETWnOQ4ws2XfL1E,969
-nkululeko/constants.py,sha256=WFGVylIst9Be_eHBZ9GiR43Qi4CdRySmNUzyNox6aMM,39
+nkululeko/constants.py,sha256=t11gtE4sZM7oZrRSZhmVhIKwQAI83AN0cEZRPXkw5cs,39
 nkululeko/demo.py,sha256=bLuHkeEl5rOfm7ecGHCcWATiPK7-njNbtrGljxzNzFs,5088
 nkululeko/demo_feats.py,sha256=sAeGFojhEj9WEDFtG3SzPBmyYJWLF2rkbpp65m8Ujo4,2025
 nkululeko/demo_predictor.py,sha256=zs1bjhpnKuNCPLJeiyDm19ME1NEDOQT3QNeyVKJq9Yc,4882
 nkululeko/ensemble.py,sha256=MayHpngGH_FTvSxUsH3NdxJd6WBAosGRFQeQ7cMjIco,12922
-nkululeko/experiment.py,sha256=L4PzoScPLG2xTyniVy9evcBy_8CIe3RTeTEUVTqiuvQ,31186
+nkululeko/experiment.py,sha256=BXUmJrJn17W-umYh4O0Jt6ZZzr2u_VDL7Lq7fPEEVMQ,31390
 nkululeko/explore.py,sha256=AbTVDmuDIaLfALQGvDW1yndcw2ikaEVEZ_fJVuUS070,3940
 nkululeko/export.py,sha256=mHeEAAmtZuxdyebLlbSzPrHSi9OMgJHbk35d3DTxRBc,4632
 nkululeko/feature_extractor.py,sha256=UnspIWz3XrNhKnBBhWZkH2bHvD-sROtrQVqB1JvkUyw,4088
@@ -18,7 +18,7 @@ nkululeko/modelrunner.py,sha256=lJy-xM4QfDDWeL0dLTE_VIb4sYrnd_Z_yJRK3wwohQA,1119
 nkululeko/multidb.py,sha256=CCjmVsZyvydgOztFlaeBvOJH8nsvU-sPQdFAw8-q0U4,6752
 nkululeko/nkuluflag.py,sha256=PGWSmZz-PiiHLgcZJAoGOI_Y-sZDVI1ksB8p5r7riWM,3725
 nkululeko/nkululeko.py,sha256=Kn3s2E3yyH8cJ7z6lkMxrnqtCxTu7-qfe9Zr_ONTD5g,1968
-nkululeko/plots.py,sha256=gfNy9Eu2PhSaykMazBPThcYS5o5KwuQwY2jshAUK5Rk,22965
+nkululeko/plots.py,sha256=p9YyN-xAtdGBKjcA305V0KOagAzG8VG6D_Ceoa9rae4,22964
 nkululeko/predict.py,sha256=sF091sSSLnEWcISx9ZcULLie3tY5XeFsQJd6b3vrxFg,2409
 nkululeko/resample.py,sha256=2d9eao_0sLrGZ_KSl8OVKsPor3BkFrlmMhrpB9WelIs,4267
 nkululeko/runmanager.py,sha256=xvxL5a9d3jtGFqx0Z3nyyxowA368uNyP0ZitO8kxIIE,7581
@@ -30,7 +30,7 @@ nkululeko/test_predictor.py,sha256=DEHE_D3A6m6KJTrpDKceA1n655t_UZV3WQd57K4a3Ho,2
 nkululeko/test_pretrain.py,sha256=ZWl-bR6nmeSmXkGAIE6zyfQEjN8Zg0rIxfaS-O6Zbas,8465
 nkululeko/augmenting/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 nkululeko/augmenting/augmenter.py,sha256=XAt0dpmlnKxqyysqCgV3rcz-pRIvOz7rU7dmGDCVAzs,2905
-nkululeko/augmenting/randomsplicer.py,sha256=Z5rxdKKUpuncLWuTS6xVfVKUeVbeiYU_dLRHQ5fcg4Y,2669
+nkululeko/augmenting/randomsplicer.py,sha256=jmn4uZc2O_-A_O-GXz7lh0rHR6-2sD9eNG0vwgtRd2w,2861
 nkululeko/augmenting/randomsplicing.py,sha256=ldym9vZNsZIU5BAAaJVaOmAgmVHNs4a5i5K3bW-WAQU,1791
 nkululeko/augmenting/resampler.py,sha256=nOBsiQpX6p4jXsP7x6wak78F3B5YYYRmC_iHX8iuOXs,3542
 nkululeko/autopredict/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
@@ -46,7 +46,7 @@ nkululeko/autopredict/ap_stoi.py,sha256=It0Lk-ki-gohA2AzD8nkLAN2WahYvD9rPDGTQuvd
 nkululeko/autopredict/ap_valence.py,sha256=n-hctRKySzhmJtowuMOTUu0T_ld3uK5pnfOzWeWW4VM,1024
 nkululeko/autopredict/estimate_snr.py,sha256=S-bpS0xFkwWc4Ch75UrjbS8y538lQ0U3g_iLRFXureY,5048
 nkululeko/data/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-nkululeko/data/dataset.py,sha256=xaawk5QthuVStWjHWTFBtorcIe71lbPQgC6mHzSXGeI,29286
+nkululeko/data/dataset.py,sha256=QqU1YoBQk41g3MV8bc0iW1YN_gMHDizuG-cjmSq0d_o,29455
 nkululeko/data/dataset_csv.py,sha256=UGEpi__eT2KFS6Fop6N4HkMrzO-u5VP71gt44kwZavo,4588
 nkululeko/feat_extract/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 nkululeko/feat_extract/feats_agender.py,sha256=tMK3_qs8adylNNSR0CS1RjU9RxmpumLqmuyzmc2ZYjA,3184
@@ -107,8 +107,8 @@ nkululeko/utils/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 nkululeko/utils/files.py,sha256=UiGAtZRWYjHSvlmPaTMtzyNNGE6qaLaxQkybctS7iRM,4021
 nkululeko/utils/stats.py,sha256=eC9dMO-by6CDnGLHDBQu-2B4-BudZNJ0nnWGhKYdUMA,2968
 nkululeko/utils/util.py,sha256=363Lgmcg6fPKCGbroX0DDyW_zcYNx-Ayqv67qdpfYcw,16710
-nkululeko-0.89.2.dist-info/LICENSE,sha256=0zGP5B_W35yAcGfHPS18Q2B8UhvLRY3dQq1MhpsJU_U,1076
-nkululeko-0.89.2.dist-info/METADATA,sha256=00CLy_4Wm7IktJy7dAkKrXkCMi0f1HUXCoQYMNcp2kw,40729
-nkululeko-0.89.2.dist-info/WHEEL,sha256=cVxcB9AmuTcXqmwrtPhNK88dr7IR_b6qagTj0UvIEbY,91
-nkululeko-0.89.2.dist-info/top_level.txt,sha256=DPFNNSHPjUeVKj44dVANAjuVGRCC3MusJ08lc2a8xFA,10
-nkululeko-0.89.2.dist-info/RECORD,,
+nkululeko-0.90.0.dist-info/LICENSE,sha256=0zGP5B_W35yAcGfHPS18Q2B8UhvLRY3dQq1MhpsJU_U,1076
+nkululeko-0.90.0.dist-info/METADATA,sha256=BiguFg1WzW9crNTqgr2qbtmaOL_PgeLP3M1Azn4Lehk,40900
+nkululeko-0.90.0.dist-info/WHEEL,sha256=cVxcB9AmuTcXqmwrtPhNK88dr7IR_b6qagTj0UvIEbY,91
+nkululeko-0.90.0.dist-info/top_level.txt,sha256=DPFNNSHPjUeVKj44dVANAjuVGRCC3MusJ08lc2a8xFA,10
+nkululeko-0.90.0.dist-info/RECORD,,

{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/LICENSE RENAMED Viewed

File without changes

{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/WHEEL RENAMED Viewed

File without changes

{nkululeko-0.89.2.dist-info → nkululeko-0.90.0.dist-info}/top_level.txt RENAMED Viewed

File without changes

nkululeko 0.89.2__py3-none-any.whl → 0.90.0__py3-none-any.whl

nkululeko 0.89.2py3-none-any.whl → 0.90.0py3-none-any.whl