PyPI - nkululeko - Versions diffs - 0.83.3__py3-none-any.whl → 0.84.1__py3-none-any.whl - Mend

nkululeko 0.83.3py3-none-any.whl → 0.84.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (32) hide show

nkululeko/augmenting/resampler.py +9 -4
nkululeko/constants.py +1 -1
nkululeko/demo.py +6 -7
nkululeko/demo_predictor.py +4 -3
nkululeko/experiment.py +15 -12
nkululeko/explore.py +29 -23
nkululeko/feat_extract/feats_analyser.py +33 -0
nkululeko/glob_conf.py +5 -0
nkululeko/models/finetune_model.py +181 -0
nkululeko/models/model.py +1 -0
nkululeko/models/model_bayes.py +1 -0
nkululeko/models/model_cnn.py +6 -9
nkululeko/models/model_gmm.py +2 -3
nkululeko/models/model_knn.py +1 -0
nkululeko/models/model_knn_reg.py +1 -0
nkululeko/models/model_lin_reg.py +1 -0
nkululeko/models/model_mlp.py +17 -7
nkululeko/models/model_mlp_regression.py +7 -12
nkululeko/models/model_svm.py +1 -0
nkululeko/models/model_svr.py +1 -0
nkululeko/models/model_tree.py +1 -0
nkululeko/models/model_tree_reg.py +1 -0
nkululeko/models/model_xgb.py +5 -3
nkululeko/models/model_xgr.py +6 -4
nkululeko/resample.py +76 -54
nkululeko/test_pretrain.py +294 -0
nkululeko/utils/util.py +81 -35
{nkululeko-0.83.3.dist-info → nkululeko-0.84.1.dist-info}/METADATA +10 -1
{nkululeko-0.83.3.dist-info → nkululeko-0.84.1.dist-info}/RECORD +32 -30
{nkululeko-0.83.3.dist-info → nkululeko-0.84.1.dist-info}/LICENSE +0 -0
{nkululeko-0.83.3.dist-info → nkululeko-0.84.1.dist-info}/WHEEL +0 -0
{nkululeko-0.83.3.dist-info → nkululeko-0.84.1.dist-info}/top_level.txt +0 -0

nkululeko/models/model_mlp_regression.py CHANGED Viewed

@@ -25,6 +25,7 @@ class MLP_Reg_model(Model):
     def __init__(self, df_train, df_test, feats_train, feats_test):
         """Constructor taking the configuration and all dataframes"""
         super().__init__(df_train, df_test, feats_train, feats_test)
+        self.name = "mlp_reg"
         super().set_model_type("ann")
         self.target = glob_conf.config["DATA"]["target"]
         labels = glob_conf.labels
@@ -52,8 +53,7 @@ class MLP_Reg_model(Model):
         drop = self.util.config_val("MODEL", "drop", False)
         if drop:
             self.util.debug(f"training with dropout: {drop}")
-        self.model = self.MLP(
-            feats_train.shape[1], layers, 1, drop).to(self.device)
+        self.model = self.MLP(feats_train.shape[1], layers, 1, drop).to(self.device)
         self.learning_rate = float(
             self.util.config_val("MODEL", "learning_rate", 0.0001)
         )
@@ -96,10 +96,8 @@ class MLP_Reg_model(Model):
         _, truths, predictions = self.evaluate_model(
             self.model, self.testloader, self.device
         )
-        result, _, _ = self.evaluate_model(
-            self.model, self.trainloader, self.device)
-        report = Reporter(truths.numpy(), predictions.numpy(),
-                          self.run, self.epoch)
+        result, _, _ = self.evaluate_model(self.model, self.trainloader, self.device)
+        report = Reporter(truths.numpy(), predictions.numpy(), self.run, self.epoch)
         try:
             report.result.loss = self.loss
         except AttributeError:  # if the model was loaded from disk the loss is unknown
@@ -133,11 +131,9 @@ class MLP_Reg_model(Model):
         def __getitem__(self, item):
             index = self.df.index[item]
-            features = self.df_features.loc[index, :].values.astype(
-                "float32").squeeze()
+            features = self.df_features.loc[index, :].values.astype("float32").squeeze()
             labels = (
-                np.array([self.df.loc[index, self.label]]
-                         ).astype("float32").squeeze()
+                np.array([self.df.loc[index, self.label]]).astype("float32").squeeze()
             )
             return features, labels
@@ -194,8 +190,7 @@ class MLP_Reg_model(Model):
                 end_index = (index + 1) * loader.batch_size
                 if end_index > len(loader.dataset):
                     end_index = len(loader.dataset)
-                logits[start_index:end_index] = model(
-                    features.to(device)).reshape(-1)
+                logits[start_index:end_index] = model(features.to(device)).reshape(-1)
                 targets[start_index:end_index] = labels
                 loss = self.criterion(
                     logits[start_index:end_index].to(

nkululeko/models/model_svm.py CHANGED Viewed

@@ -11,6 +11,7 @@ class SVM_model(Model):
     def __init__(self, df_train, df_test, feats_train, feats_test):
         super().__init__(df_train, df_test, feats_train, feats_test)
+        self.name = "svm"
         c = float(self.util.config_val("MODEL", "C_val", "0.001"))
         if eval(self.util.config_val("MODEL", "class_weight", "False")):
             class_weight = "balanced"

nkululeko/models/model_svr.py CHANGED Viewed

@@ -11,6 +11,7 @@ class SVR_model(Model):
     def __init__(self, df_train, df_test, feats_train, feats_test):
         super().__init__(df_train, df_test, feats_train, feats_test)
+        self.name = "svr"
         c = float(self.util.config_val("MODEL", "C_val", "0.001"))
         #  kernel{‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’} or callable, default=’rbf’
         kernel = self.util.config_val("MODEL", "kernel", "rbf")

nkululeko/models/model_tree.py CHANGED Viewed

@@ -11,4 +11,5 @@ class Tree_model(Model):
     def __init__(self, df_train, df_test, feats_train, feats_test):
         super().__init__(df_train, df_test, feats_train, feats_test)
+        self.name = "tree"
         self.clf = DecisionTreeClassifier()  # set up the classifier

nkululeko/models/model_tree_reg.py CHANGED Viewed

@@ -11,4 +11,5 @@ class Tree_reg_model(Model):
     def __init__(self, df_train, df_test, feats_train, feats_test):
         super().__init__(df_train, df_test, feats_train, feats_test)
+        self.name = "tree_reg"
         self.clf = DecisionTreeRegressor()  # set up the classifier

nkululeko/models/model_xgb.py CHANGED Viewed

@@ -7,9 +7,11 @@ from nkululeko.models.model import Model
 class XGB_model(Model):
     """An XGBoost model"""
-    is_classifier = True
-    clf = XGBClassifier()  # set up the classifier
+    def __init__(self, df_train, df_test, feats_train, feats_test):
+        super().__init__(df_train, df_test, feats_train, feats_test)
+        self.name = "xgb"
+        self.is_classifier = True
+        self.clf = XGBClassifier()  # set up the classifier
     def get_type(self):
         return "xgb"

nkululeko/models/model_xgr.py CHANGED Viewed

@@ -5,8 +5,10 @@ from nkululeko.models.model import Model
 class XGR_model(Model):
-    """An XGBoost model"""
+    """An XGBoost regression model"""
-    is_classifier = False
-    clf = XGBRegressor()  # set up the regressor
+    def __init__(self, df_train, df_test, feats_train, feats_test):
+        super().__init__(df_train, df_test, feats_train, feats_test)
+        self.name = "xgr"
+        self.is_classifier = False
+        self.clf = XGBRegressor()  # set up the regressor

nkululeko/resample.py CHANGED Viewed

@@ -1,78 +1,100 @@
 # resample.py
-# change the sampling rate for train and test splits
+# change the sampling rate for audio file or INI file (train, test, all)
 import argparse
 import configparser
 import os
 import pandas as pd
+import audformat
 from nkululeko.augmenting.resampler import Resampler
+from nkululeko.utils.util import Util
 from nkululeko.constants import VERSION
 from nkululeko.experiment import Experiment
-from nkululeko.utils.util import Util
 def main(src_dir):
     parser = argparse.ArgumentParser(
-        description="Call the nkululeko RESAMPLE  framework.")
-    parser.add_argument("--config", default="exp.ini",
+        description="Call the nkululeko RESAMPLE framework.")
+    parser.add_argument("--config", default=None,
                         help="The base configuration")
+    parser.add_argument("--file", default=None,
+                        help="The input audio file to resample")
+    parser.add_argument("--replace", action="store_true",
+                        help="Replace the original audio file")
     args = parser.parse_args()
-    if args.config is not None:
-        config_file = args.config
-    else:
-        config_file = f"{src_dir}/exp.ini"
-    # test if the configuration file exists
-    if not os.path.isfile(config_file):
-        print(f"ERROR: no such file: {config_file}")
+    if args.file is None and args.config is None:
+        print("ERROR: Either --file or --config argument must be provided.")
         exit()
-    # load one configuration per experiment
-    config = configparser.ConfigParser()
-    config.read(config_file)
-    # create a new experiment
-    expr = Experiment(config)
-    module = "resample"
-    expr.set_module(module)
-    util = Util(module)
-    util.debug(
-        f"running {expr.name} from config {config_file}, nkululeko version"
-        f" {VERSION}"
-    )
-    if util.config_val("EXP", "no_warnings", False):
-        import warnings
-        warnings.filterwarnings("ignore")
-    # load the data
-    expr.load_datasets()
-    # split into train and test
-    expr.fill_train_and_tests()
-    util.debug(
-        f"train shape : {expr.df_train.shape}, test shape:{expr.df_test.shape}")
-    sample_selection = util.config_val("RESAMPLE", "sample_selection", "all")
-    if sample_selection == "all":
-        df = pd.concat([expr.df_train, expr.df_test])
-    elif sample_selection == "train":
-        df = expr.df_train
-    elif sample_selection == "test":
-        df = expr.df_test
+    if args.file is not None:
+        # Load the audio file into a DataFrame
+        files = pd.Series([args.file])
+        df_sample = pd.DataFrame(index=files)
+        df_sample.index = audformat.utils.to_segmented_index(
+            df_sample.index, allow_nat=False
+        )
+        # Resample the audio file
+        util = Util("resampler", has_config=False)
+        util.debug(f"Resampling audio file: {args.file}")
+        rs = Resampler(df_sample, not_testing=True, replace=args.replace)
+        rs.resample()
     else:
-        util.error(
-            f"unknown selection specifier {sample_selection}, should be [all |"
-            " train | test]"
+        # Existing code for handling INI file
+        config_file = args.config
+        # Test if the configuration file exists
+        if not os.path.isfile(config_file):
+            print(f"ERROR: no such file: {config_file}")
+            exit()
+        # Load one configuration per experiment
+        config = configparser.ConfigParser()
+        config.read(config_file)
+        # Create a new experiment
+        expr = Experiment(config)
+        module = "resample"
+        expr.set_module(module)
+        util = Util(module)
+        util.debug(
+            f"running {expr.name} from config {config_file}, nkululeko version"
+            f" {VERSION}"
         )
-    util.debug(f"resampling {sample_selection}: {df.shape[0]} samples")
-    rs = Resampler(df)
-    rs.resample()
-    print("DONE")
+        if util.config_val("EXP", "no_warnings", False):
+            import warnings
+            warnings.filterwarnings("ignore")
+        # Load the data
+        expr.load_datasets()
+        # Split into train and test
+        expr.fill_train_and_tests()
+        util.debug(
+            f"train shape : {expr.df_train.shape}, test shape:{expr.df_test.shape}")
+        sample_selection = util.config_val(
+            "RESAMPLE", "sample_selection", "all")
+        if sample_selection == "all":
+            df = pd.concat([expr.df_train, expr.df_test])
+        elif sample_selection == "train":
+            df = expr.df_train
+        elif sample_selection == "test":
+            df = expr.df_test
+        else:
+            util.error(
+                f"unknown selection specifier {sample_selection}, should be [all |"
+                " train | test]"
+            )
+        util.debug(f"resampling {sample_selection}: {df.shape[0]} samples")
+        replace = util.config_val("RESAMPLE", "replace", "False")
+        rs = Resampler(df, replace=replace)
+        rs.resample()
 if __name__ == "__main__":
     cwd = os.path.dirname(os.path.abspath(__file__))
-    main(cwd)  # use this if you want to state the config file path on command line
+    main(cwd)

nkululeko/test_pretrain.py ADDED Viewed

@@ -0,0 +1,294 @@
+# test_pretrain.py
+import argparse
+import configparser
+import os.path
+import datasets
+import numpy as np
+import pandas as pd
+import torch
+import transformers
+import audeer
+import audiofile
+import audmetric
+from nkululeko.constants import VERSION
+import nkululeko.experiment as exp
+import nkululeko.models.finetune_model as fm
+import nkululeko.glob_conf as glob_conf
+from nkululeko.utils.util import Util
+import json
+def doit(config_file):
+    # test if the configuration file exists
+    if not os.path.isfile(config_file):
+        print(f"ERROR: no such file: {config_file}")
+        exit()
+    # load one configuration per experiment
+    config = configparser.ConfigParser()
+    config.read(config_file)
+    # create a new experiment
+    expr = exp.Experiment(config)
+    module = "test_pretrain"
+    expr.set_module(module)
+    util = Util(module)
+    util.debug(
+        f"running {expr.name} from config {config_file}, nkululeko version"
+        f" {VERSION}"
+    )
+    if util.config_val("EXP", "no_warnings", False):
+        import warnings
+        warnings.filterwarnings("ignore")
+    # load the data
+    expr.load_datasets()
+    # split into train and test
+    expr.fill_train_and_tests()
+    util.debug(f"train shape : {expr.df_train.shape}, test shape:{expr.df_test.shape}")
+    log_root = audeer.mkdir("log")
+    model_root = audeer.mkdir("model")
+    torch_root = audeer.path(model_root, "torch")
+    metrics_gender = {
+        "UAR": audmetric.unweighted_average_recall,
+        "ACC": audmetric.accuracy,
+    }
+    sampling_rate = 16000
+    max_duration_sec = 8.0
+    model_path = "facebook/wav2vec2-large-robust-ft-swbd-300h"
+    num_layers = None
+    os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
+    os.environ["CUDA_VISIBLE_DEVICES"] = "3"
+    batch_size = 16
+    accumulation_steps = 4
+    # create dataset
+    dataset = {}
+    target_name = glob_conf.target
+    data_sources = {
+        "train": pd.DataFrame(expr.df_train[target_name]),
+        "dev": pd.DataFrame(expr.df_test[target_name]),
+    }
+    for split in ["train", "dev"]:
+        df = data_sources[split]
+        df[target_name] = df[target_name].astype("float")
+        y = pd.Series(
+            data=df.itertuples(index=False, name=None),
+            index=df.index,
+            dtype=object,
+            name="labels",
+        )
+        y.name = "targets"
+        df = y.reset_index()
+        df.start = df.start.dt.total_seconds()
+        df.end = df.end.dt.total_seconds()
+        print(f"{split}: {len(df)}")
+        ds = datasets.Dataset.from_pandas(df)
+        dataset[split] = ds
+    dataset = datasets.DatasetDict(dataset)
+    # load pre-trained model
+    le = glob_conf.label_encoder
+    mapping = dict(zip(le.classes_, range(len(le.classes_))))
+    target_mapping = {k: int(v) for k, v in mapping.items()}
+    target_mapping_reverse = {value: key for key, value in target_mapping.items()}
+    config = transformers.AutoConfig.from_pretrained(
+        model_path,
+        num_labels=len(target_mapping),
+        label2id=target_mapping,
+        id2label=target_mapping_reverse,
+        finetuning_task=target_name,
+    )
+    if num_layers is not None:
+        config.num_hidden_layers = num_layers
+    setattr(config, "sampling_rate", sampling_rate)
+    setattr(config, "data", util.get_data_name())
+    vocab_dict = {}
+    with open("vocab.json", "w") as vocab_file:
+        json.dump(vocab_dict, vocab_file)
+    tokenizer = transformers.Wav2Vec2CTCTokenizer("./vocab.json")
+    tokenizer.save_pretrained(".")
+    feature_extractor = transformers.Wav2Vec2FeatureExtractor(
+        feature_size=1,
+        sampling_rate=16000,
+        padding_value=0.0,
+        do_normalize=True,
+        return_attention_mask=True,
+    )
+    processor = transformers.Wav2Vec2Processor(
+        feature_extractor=feature_extractor,
+        tokenizer=tokenizer,
+    )
+    assert processor.feature_extractor.sampling_rate == sampling_rate
+    model = fm.Model.from_pretrained(
+        model_path,
+        config=config,
+    )
+    model.freeze_feature_extractor()
+    model.train()
+    # training
+    def data_collator(data):
+        files = [d["file"] for d in data]
+        starts = [d["start"] for d in data]
+        ends = [d["end"] for d in data]
+        targets = [d["targets"] for d in data]
+        signals = []
+        for file, start, end in zip(
+            files,
+            starts,
+            ends,
+        ):
+            offset = start
+            duration = end - offset
+            if max_duration_sec is not None:
+                duration = min(duration, max_duration_sec)
+            signal, _ = audiofile.read(
+                file,
+                offset=offset,
+                duration=duration,
+            )
+            signals.append(signal.squeeze())
+        input_values = processor(
+            signals,
+            sampling_rate=sampling_rate,
+            padding=True,
+        )
+        batch = processor.pad(
+            input_values,
+            padding=True,
+            return_tensors="pt",
+        )
+        batch["labels"] = torch.tensor(targets)
+        return batch
+    def compute_metrics(p: transformers.EvalPrediction):
+        truth_gender = p.label_ids[:, 0].astype(int)
+        preds = p.predictions
+        preds_gender = np.argmax(preds, axis=1)
+        scores = {}
+        for name, metric in metrics_gender.items():
+            scores[f"gender-{name}"] = metric(truth_gender, preds_gender)
+        scores["combined"] = scores["gender-UAR"]
+        return scores
+    targets = pd.DataFrame(dataset["train"]["targets"])
+    counts = targets[0].value_counts().sort_index()
+    train_weights = 1 / counts
+    train_weights /= train_weights.sum()
+    print(train_weights)
+    criterion_gender = torch.nn.CrossEntropyLoss(
+        weight=torch.Tensor(train_weights).to("cuda"),
+    )
+    class Trainer(transformers.Trainer):
+        def compute_loss(
+            self,
+            model,
+            inputs,
+            return_outputs=False,
+        ):
+            targets = inputs.pop("labels").squeeze()
+            targets_gender = targets.type(torch.long)
+            outputs = model(**inputs)
+            logits_gender = outputs[0].squeeze()
+            loss_gender = criterion_gender(logits_gender, targets_gender)
+            loss = loss_gender
+            return (loss, outputs) if return_outputs else loss
+    num_steps = len(dataset["train"]) // (batch_size * accumulation_steps) // 5
+    num_steps = max(1, num_steps)
+    print(num_steps)
+    training_args = transformers.TrainingArguments(
+        output_dir=model_root,
+        logging_dir=log_root,
+        per_device_train_batch_size=batch_size,
+        per_device_eval_batch_size=batch_size,
+        gradient_accumulation_steps=accumulation_steps,
+        evaluation_strategy="steps",
+        num_train_epochs=5.0,
+        fp16=True,
+        save_steps=num_steps,
+        eval_steps=num_steps,
+        logging_steps=num_steps,
+        learning_rate=1e-4,
+        save_total_limit=2,
+        metric_for_best_model="combined",
+        greater_is_better=True,
+        load_best_model_at_end=True,
+        remove_unused_columns=False,
+    )
+    trainer = Trainer(
+        model=model,
+        data_collator=data_collator,
+        args=training_args,
+        compute_metrics=compute_metrics,
+        train_dataset=dataset["train"],
+        eval_dataset=dataset["dev"],
+        tokenizer=processor.feature_extractor,
+        callbacks=[transformers.integrations.TensorBoardCallback()],
+    )
+    trainer.train()
+    trainer.save_model(torch_root)
+    print("DONE")
+def main(src_dir):
+    parser = argparse.ArgumentParser(description="Call the nkululeko framework.")
+    parser.add_argument("--config", default="exp.ini", help="The base configuration")
+    args = parser.parse_args()
+    if args.config is not None:
+        config_file = args.config
+    else:
+        config_file = f"{src_dir}/exp.ini"
+    doit(config_file)
+if __name__ == "__main__":
+    cwd = os.path.dirname(os.path.abspath(__file__))
+    main(cwd)  # use this if you want to state the config file path on command line

nkululeko 0.83.3__py3-none-any.whl → 0.84.1__py3-none-any.whl

nkululeko 0.83.3py3-none-any.whl → 0.84.1py3-none-any.whl