PyPI - lt-tensor - Versions diffs - 0.0.1a11__py3-none-any.whl → 0.0.1a12__py3-none-any.whl - Mend

lt-tensor 0.0.1a11py3-none-any.whl → 0.0.1a12py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (28) hide show

lt_tensor/__init__.py +2 -0
lt_tensor/config_templates.py +97 -0
lt_tensor/datasets/audio.py +21 -7
lt_tensor/losses.py +1 -1
lt_tensor/math_ops.py +1 -1
lt_tensor/misc_utils.py +71 -2
lt_tensor/model_base.py +157 -203
lt_tensor/model_zoo/__init__.py +2 -2
lt_tensor/model_zoo/bsc.py +6 -6
lt_tensor/model_zoo/disc.py +1 -1
lt_tensor/model_zoo/fsn.py +2 -2
lt_tensor/model_zoo/gns.py +4 -4
lt_tensor/model_zoo/istft/__init__.py +5 -0
lt_tensor/model_zoo/istft/generator.py +150 -0
lt_tensor/model_zoo/istft/trainer.py +450 -0
lt_tensor/model_zoo/istft.py +508 -25
lt_tensor/model_zoo/pos.py +2 -2
lt_tensor/model_zoo/rsd.py +16 -146
lt_tensor/model_zoo/tfrms.py +4 -4
lt_tensor/noise_tools.py +2 -2
lt_tensor/processors/audio.py +87 -16
lt_tensor/transform.py +30 -37
{lt_tensor-0.0.1a11.dist-info → lt_tensor-0.0.1a12.dist-info}/METADATA +3 -2
lt_tensor-0.0.1a12.dist-info/RECORD +32 -0
lt_tensor-0.0.1a11.dist-info/RECORD +0 -28
{lt_tensor-0.0.1a11.dist-info → lt_tensor-0.0.1a12.dist-info}/WHEEL +0 -0
{lt_tensor-0.0.1a11.dist-info → lt_tensor-0.0.1a12.dist-info}/licenses/LICENSE +0 -0
{lt_tensor-0.0.1a11.dist-info → lt_tensor-0.0.1a12.dist-info}/top_level.txt +0 -0

lt_tensor/__init__.py CHANGED Viewed

@@ -12,6 +12,7 @@ from . import (
     losses,
     processors,
     datasets,
+    torch_commons,
 )
 __all__ = [
@@ -26,4 +27,5 @@ __all__ = [
     "losses",
     "processors",
     "datasets",
+    "torch_commons",
 ]

lt_tensor/config_templates.py ADDED Viewed

@@ -0,0 +1,97 @@
+from lt_utils.common import *
+from lt_utils.file_ops import load_json, save_json, FileScan
+from lt_utils.misc_utils import log_traceback, get_current_time
+from lt_utils.type_utils import is_pathlike, is_file, is_dir, is_dict, is_str
+from lt_tensor.misc_utils import updateDict
+class ModelConfig(ABC, OrderedDict):
+    _default_settings: Dict[str, Any] = {}
+    _forbidden_list: List[str] = [
+        "_settings",
+    ]
+    def __init__(
+        self,
+        settings: Dict[str, Any] = None,
+        path_name: Optional[Union[str, PathLike]] = None,
+    ):
+        assert is_dict(settings)
+        self._default_settings = settings
+        if path_name is not None and is_pathlike(path_name):
+            if not str(path_name).endswith(".json"):
+                self.path_name = str(Path(path_name, "config.json")).replace("\\", "/")
+            else:
+                self.path_name = str(path_name).replace("\\", "/")
+        else:
+            self.path_name = "config.json"
+        self.reset_settings()
+    def _setup_path_name(self, path_name: Union[str, PathLike]):
+        if is_file(path_name):
+            self.from_path(path_name)
+            self.path_name = str(path_name).replace("\\", "/")
+        elif is_str(path_name):
+            self.path_name = str(path_name).replace("\\", "/")
+            if not self.path_name.endswith((".json")):
+                self.path_name += ".json"
+    def reset_settings(self):
+        for s_name, setting in self._default_settings.items():
+            if s_name in self._forbidden_list:
+                continue
+            updateDict(self, {s_name: setting})
+    def save_config(
+        self,
+        path_name: Union[PathLike, str],
+    ):
+        assert is_pathlike(
+            path_name, True
+        ), f"path_name should be a non-empty string or pathlike object! received instead: {path_name}"
+        self._setup_path_name(path_name)
+        base = {k: y for k, y in self.__dict__.items() if k not in self._forbidden_list}
+        save_json(self.path_name, base, indent=2)
+    def to_dict(self):
+        return {k: y for k, y in self.__dict__.items() if k not in self._forbidden_list}
+    def set_value(self, var_name: str, value: str) -> None:
+        updateDict(self, {var_name: value})
+    def get_value(self, var_name: str) -> Any:
+        return self.__dict__.get(var_name)
+    @classmethod
+    def from_dict(
+        cls, dictionary: Dict[str, Any], path: Optional[Union[str, PathLike]] = None
+    ) -> "ModelConfig":
+        assert is_dict(dictionary)
+        return ModelConfig(dictionary, path)
+    @classmethod
+    def from_path(cls, path_name: PathLike) -> "ModelConfig":
+        assert is_file(path_name) or is_dir(path_name)
+        settings = {}
+        if is_file(path_name):
+            settings.update(load_json(path_name, {}, errors="ignore"))
+        else:
+            files = FileScan.files(
+                path_name,
+                [
+                    "*_config.json",
+                    "config_*.json",
+                    "*_config.json",
+                    "cfg_*.json",
+                    "*_cfg.json",
+                    "cfg.json",
+                    "config.json",
+                    "settings.json",
+                    "settings_*.json",
+                    "*_settings.json",
+                ],
+            )
+            assert files, "No config file found in the provided directory!"
+            settings.update(load_json(files[-1], {}, errors="ignore"))
+        return ModelConfig(settings, path_name)

lt_tensor/datasets/audio.py CHANGED Viewed

@@ -6,11 +6,10 @@ from torch.utils.data import Dataset, DataLoader, Sampler
 from lt_tensor.processors import AudioProcessor
 import torch.nn.functional as FT
 from lt_tensor.misc_utils import log_tensor
+from tqdm import tqdm
 class WaveMelDataset(Dataset):
-    """Untested!"""
     data: Union[list[dict[str, Tensor]], Tuple[Tensor, Tensor]] = []
     def __init__(
@@ -19,12 +18,16 @@ class WaveMelDataset(Dataset):
         path: PathLike,
         limit_files: Optional[int] = None,
         max_frame_length: Optional[int] = None,
+        randomize_ranges: bool = False,
     ):
         super().__init__()
         assert max_frame_length is None or max_frame_length >= (
             (audio_processor.n_fft // 2) + 1
         )
         self.post_n_fft = (audio_processor.n_fft // 2) + 1
+        if max_frame_length is not None:
+            self.r_range = max(self.post_n_fft + 1, max_frame_length // 3)
         self.ap = audio_processor
         self.files = self.ap.find_audios(path)
         if limit_files:
@@ -32,21 +35,32 @@ class WaveMelDataset(Dataset):
             self.files = self.files[:limit_files]
         self.data = []
-        for file in self.files:
-            results = self.load_data(file, max_frame_length)
+        for file in tqdm(self.files, "Loading files"):
+            results = self.load_data(file, max_frame_length, randomize_ranges)
             self.data.extend(results)
     def _add_dict(self, audio_raw: Tensor, audio_mel: Tensor, file: PathLike):
         return {"mel": audio_mel, "raw": audio_raw, "file": file}
-    def load_data(self, file: PathLike, audio_frames_limit: Optional[int] = None):
-        initial_audio = self.ap.load_audio(file)
+    def load_data(
+        self,
+        file: PathLike,
+        audio_frames_limit: Optional[int] = None,
+        randomize_ranges: bool = False,
+    ):
+        initial_audio = self.ap.rebuild_spectrogram(self.ap.load_audio(file))
         if not audio_frames_limit or initial_audio.shape[-1] <= audio_frames_limit:
+            if initial_audio.shape[-1] < self.post_n_fft:
+                return []
             audio_mel = self.ap.compute_mel(initial_audio, add_base=True)
             return [self._add_dict(initial_audio, audio_mel, file)]
         results = []
+        if randomize_ranges:
+            frame_limit = random.randint(self.r_range, audio_frames_limit)
+        else:
+            frame_limit = audio_frames_limit
         for fragment in torch.split(
-            initial_audio, split_size_or_sections=audio_frames_limit, dim=-1
+            initial_audio, split_size_or_sections=frame_limit, dim=-1
         ):
             if fragment.shape[-1] < self.post_n_fft:
                 # sometimes the tensor will be too small to be able to pass on mel

lt_tensor/losses.py CHANGED Viewed

@@ -11,7 +11,7 @@ __all__ = [
 ]
 import math
 import random
-from .torch_commons import *
+from lt_tensor.torch_commons import *
 from lt_utils.common import *
 import torch.nn.functional as F

lt_tensor/math_ops.py CHANGED Viewed

@@ -12,7 +12,7 @@ __all__ = [
     "phase",
 ]
-from .torch_commons import *
+from lt_tensor.torch_commons import *
 def sin_tensor(x: Tensor, freq: float = 1.0) -> Tensor:

lt_tensor/misc_utils.py CHANGED Viewed

@@ -21,6 +21,8 @@ __all__ = [
     "Masking",
     "LogTensor",
     "get_losses",
+    "plot_view",
+    "get_weights",
 ]
 import re
@@ -28,14 +30,81 @@ import gc
 import sys
 import random
 import numpy as np
-from lt_utils.type_utils import is_str
-from .torch_commons import *
+import warnings
+from lt_utils.type_utils import is_str, is_dir, is_file, is_pathlike, is_path_valid
+from lt_utils.file_ops import FileScan, find_files, path_to_str, load_json, load_yaml
+from lt_tensor.torch_commons import *
 from lt_utils.misc_utils import cache_wrapper
 from lt_utils.common import *
 from lt_utils.misc_utils import ff_list
 import torch.nn.functional as F
+def plot_view(
+    data: Dict[str, List[Any]],
+    title: str = "Loss",
+    max_amount: int = 0,
+    xaxis_title="Step/Epoch",
+    yaxis_title="Loss",
+    template="plotly_dark",
+):
+    try:
+        import plotly.graph_objs as go
+    except ModuleNotFoundError:
+        warnings.warn(
+            "No installation of plotly was found. To use it use 'pip install plotly' and restart this application!"
+        )
+        return
+    fig = go.Figure()
+    for mode, values in data.items():
+        if values:
+            items = values if not max_amount > 0 else values[-max_amount:]
+            fig.add_trace(go.Scatter(y=items, name=mode.capitalize()))
+    fig.update_layout(
+        title=title,
+        xaxis_title=xaxis_title,
+        yaxis_title=yaxis_title,
+        template=template,
+    )
+    return fig
+def get_weights(directory: Union[str, PathLike]):
+    is_path_valid(directory, validate=True)  # raises validation if its invalid path
+    directory = Path(directory)
+    if is_file(directory):
+        if directory.name.endswith((".pt", ".ckpt", ".pth")):
+            return directory
+        directory = directory.parent
+    res = sorted(find_files(directory, ["*.pt", "*.ckpt", "*.pth"]))
+    return res[-1] if res else None
+def get_config(directory: Union[str, PathLike], default: Optional[Any] = None):
+    # raises validation if its invalid path only when default is None otherwise it returns the defaults.
+    if not is_path_valid(directory, validate=default is None):
+        return default
+    directory = Path(directory)
+    if is_file(directory):
+        if directory.name.endswith((".json", ".yaml", ".yml")):
+            if directory.name.endswith(".json"):
+                return load_json(directory, default)
+            return load_yaml(directory, default)
+        directory = directory.parent
+    res = sorted(find_files(directory, ["*.pt", "*.ckpt", "*.pth"]))
+    if res:
+        res = res[-1]
+        if Path(res).name.endswith(".json"):
+            return load_json(directory, default)
+        return load_yaml(directory, default)
+    return default
+def updateDict(self, dct: dict[str, Any]):
+    for k, v in dct.items():
+        setattr(self, k, v)
 def soft_restore(tensor, epsilon=1e-6):
     return torch.where(tensor == 0, torch.full_like(tensor, epsilon), tensor)

lt-tensor 0.0.1a11__py3-none-any.whl → 0.0.1a12__py3-none-any.whl

lt-tensor 0.0.1a11py3-none-any.whl → 0.0.1a12py3-none-any.whl