PyPI - hcpdiff - Versions diffs - 0.9.0__py3-none-any.whl → 2.1__py3-none-any.whl - Mend

hcpdiff 0.9.0py3-none-any.whl → 2.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (208) hide show

hcpdiff/__init__.py +4 -4
hcpdiff/ckpt_manager/__init__.py +4 -5
hcpdiff/ckpt_manager/ckpt.py +24 -0
hcpdiff/ckpt_manager/format/__init__.py +4 -0
hcpdiff/ckpt_manager/format/diffusers.py +59 -0
hcpdiff/ckpt_manager/format/emb.py +21 -0
hcpdiff/ckpt_manager/format/lora_webui.py +244 -0
hcpdiff/ckpt_manager/format/sd_single.py +41 -0
hcpdiff/ckpt_manager/loader.py +64 -0
hcpdiff/data/__init__.py +4 -28
hcpdiff/data/cache/__init__.py +1 -0
hcpdiff/data/cache/vae.py +102 -0
hcpdiff/data/dataset.py +20 -0
hcpdiff/data/handler/__init__.py +3 -0
hcpdiff/data/handler/controlnet.py +18 -0
hcpdiff/data/handler/diffusion.py +80 -0
hcpdiff/data/handler/text.py +111 -0
hcpdiff/data/source/__init__.py +1 -2
hcpdiff/data/source/folder_class.py +12 -29
hcpdiff/data/source/text2img.py +36 -74
hcpdiff/data/source/text2img_cond.py +9 -15
hcpdiff/diffusion/__init__.py +0 -0
hcpdiff/diffusion/noise/__init__.py +2 -0
hcpdiff/diffusion/noise/pyramid_noise.py +42 -0
hcpdiff/diffusion/noise/zero_terminal.py +39 -0
hcpdiff/diffusion/sampler/__init__.py +5 -0
hcpdiff/diffusion/sampler/base.py +72 -0
hcpdiff/diffusion/sampler/ddpm.py +20 -0
hcpdiff/diffusion/sampler/diffusers.py +66 -0
hcpdiff/diffusion/sampler/edm.py +22 -0
hcpdiff/diffusion/sampler/sigma_scheduler/__init__.py +3 -0
hcpdiff/diffusion/sampler/sigma_scheduler/base.py +14 -0
hcpdiff/diffusion/sampler/sigma_scheduler/ddpm.py +197 -0
hcpdiff/diffusion/sampler/sigma_scheduler/edm.py +48 -0
hcpdiff/easy/__init__.py +2 -0
hcpdiff/easy/cfg/__init__.py +3 -0
hcpdiff/easy/cfg/sd15_train.py +201 -0
hcpdiff/easy/cfg/sdxl_train.py +140 -0
hcpdiff/easy/cfg/t2i.py +177 -0
hcpdiff/easy/model/__init__.py +2 -0
hcpdiff/easy/model/cnet.py +31 -0
hcpdiff/easy/model/loader.py +79 -0
hcpdiff/easy/sampler.py +46 -0
hcpdiff/evaluate/__init__.py +1 -0
hcpdiff/evaluate/previewer.py +60 -0
hcpdiff/loss/__init__.py +4 -1
hcpdiff/loss/base.py +41 -0
hcpdiff/loss/gw.py +35 -0
hcpdiff/loss/ssim.py +37 -0
hcpdiff/loss/vlb.py +79 -0
hcpdiff/loss/weighting.py +66 -0
hcpdiff/models/__init__.py +2 -2
hcpdiff/models/cfg_context.py +17 -14
hcpdiff/models/compose/compose_hook.py +44 -23
hcpdiff/models/compose/compose_tokenizer.py +21 -8
hcpdiff/models/compose/sdxl_composer.py +4 -4
hcpdiff/models/container.py +1 -1
hcpdiff/models/controlnet.py +16 -16
hcpdiff/models/lora_base_patch.py +14 -25
hcpdiff/models/lora_layers.py +3 -9
hcpdiff/models/lora_layers_patch.py +14 -24
hcpdiff/models/text_emb_ex.py +84 -6
hcpdiff/models/textencoder_ex.py +54 -18
hcpdiff/models/wrapper/__init__.py +3 -0
hcpdiff/models/wrapper/pixart.py +19 -0
hcpdiff/models/wrapper/sd.py +218 -0
hcpdiff/models/wrapper/utils.py +20 -0
hcpdiff/parser/__init__.py +1 -0
hcpdiff/parser/embpt.py +32 -0
hcpdiff/tools/convert_caption_txt2json.py +1 -1
hcpdiff/tools/dataset_generator.py +94 -0
hcpdiff/tools/download_hf_model.py +24 -0
hcpdiff/tools/embedding_convert.py +6 -2
hcpdiff/tools/init_proj.py +3 -21
hcpdiff/tools/lora_convert.py +19 -15
hcpdiff/tools/save_model.py +12 -0
hcpdiff/tools/sd2diffusers.py +1 -1
hcpdiff/train_colo.py +1 -1
hcpdiff/train_deepspeed.py +1 -1
hcpdiff/trainer_ac.py +79 -0
hcpdiff/trainer_ac_single.py +31 -0
hcpdiff/utils/__init__.py +0 -2
hcpdiff/utils/inpaint_pipe.py +790 -0
hcpdiff/utils/net_utils.py +29 -6
hcpdiff/utils/pipe_hook.py +46 -33
hcpdiff/utils/utils.py +21 -4
hcpdiff/workflow/__init__.py +15 -10
hcpdiff/workflow/daam/__init__.py +1 -0
hcpdiff/workflow/daam/act.py +66 -0
hcpdiff/workflow/daam/hook.py +109 -0
hcpdiff/workflow/diffusion.py +128 -136
hcpdiff/workflow/fast.py +31 -0
hcpdiff/workflow/flow.py +67 -0
hcpdiff/workflow/io.py +36 -68
hcpdiff/workflow/model.py +46 -43
hcpdiff/workflow/text.py +84 -52
hcpdiff/workflow/utils.py +32 -12
hcpdiff/workflow/vae.py +37 -38
hcpdiff-2.1.dist-info/METADATA +285 -0
hcpdiff-2.1.dist-info/RECORD +114 -0
{hcpdiff-0.9.0.dist-info → hcpdiff-2.1.dist-info}/WHEEL +1 -1
hcpdiff-2.1.dist-info/entry_points.txt +5 -0
hcpdiff/ckpt_manager/base.py +0 -16
hcpdiff/ckpt_manager/ckpt_diffusers.py +0 -45
hcpdiff/ckpt_manager/ckpt_pkl.py +0 -138
hcpdiff/ckpt_manager/ckpt_safetensor.py +0 -60
hcpdiff/ckpt_manager/ckpt_webui.py +0 -54
hcpdiff/data/bucket.py +0 -358
hcpdiff/data/caption_loader.py +0 -80
hcpdiff/data/cond_dataset.py +0 -40
hcpdiff/data/crop_info_dataset.py +0 -40
hcpdiff/data/data_processor.py +0 -33
hcpdiff/data/pair_dataset.py +0 -146
hcpdiff/data/sampler.py +0 -54
hcpdiff/data/source/base.py +0 -30
hcpdiff/data/utils.py +0 -80
hcpdiff/infer_workflow.py +0 -57
hcpdiff/loggers/__init__.py +0 -13
hcpdiff/loggers/base_logger.py +0 -76
hcpdiff/loggers/cli_logger.py +0 -40
hcpdiff/loggers/preview/__init__.py +0 -1
hcpdiff/loggers/preview/image_previewer.py +0 -149
hcpdiff/loggers/tensorboard_logger.py +0 -30
hcpdiff/loggers/wandb_logger.py +0 -31
hcpdiff/loggers/webui_logger.py +0 -9
hcpdiff/loss/min_snr_loss.py +0 -52
hcpdiff/models/layers.py +0 -81
hcpdiff/models/plugin.py +0 -348
hcpdiff/models/wrapper.py +0 -75
hcpdiff/noise/__init__.py +0 -3
hcpdiff/noise/noise_base.py +0 -16
hcpdiff/noise/pyramid_noise.py +0 -50
hcpdiff/noise/zero_terminal.py +0 -44
hcpdiff/train_ac.py +0 -565
hcpdiff/train_ac_single.py +0 -39
hcpdiff/utils/caption_tools.py +0 -105
hcpdiff/utils/cfg_net_tools.py +0 -321
hcpdiff/utils/cfg_resolvers.py +0 -16
hcpdiff/utils/ema.py +0 -52
hcpdiff/utils/img_size_tool.py +0 -248
hcpdiff/vis/__init__.py +0 -3
hcpdiff/vis/base_interface.py +0 -12
hcpdiff/vis/disk_interface.py +0 -48
hcpdiff/vis/webui_interface.py +0 -17
hcpdiff/visualizer.py +0 -258
hcpdiff/visualizer_reloadable.py +0 -237
hcpdiff/workflow/base.py +0 -59
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/anime/text2img_anime.yaml +0 -21
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/anime/text2img_anime_lora.yaml +0 -58
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/change_vae.yaml +0 -6
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/euler_a.yaml +0 -8
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/img2img.yaml +0 -10
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/img2img_controlnet.yaml +0 -19
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/inpaint.yaml +0 -11
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/load_lora.yaml +0 -26
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/load_unet_part.yaml +0 -18
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/offload_2GB.yaml +0 -6
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/save_model.yaml +0 -44
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/text2img.yaml +0 -53
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/text2img_DA++.yaml +0 -34
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/text2img_sdxl.yaml +0 -9
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/plugins/plugin_controlnet.yaml +0 -17
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/te_struct.txt +0 -193
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/dataset/base_dataset.yaml +0 -29
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/dataset/regularization_dataset.yaml +0 -31
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/CustomDiffusion.yaml +0 -74
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/DreamArtist++.yaml +0 -135
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/DreamArtist.yaml +0 -45
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/DreamBooth.yaml +0 -62
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/FT_sdxl.yaml +0 -33
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/Lion_optimizer.yaml +0 -17
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/TextualInversion.yaml +0 -41
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/add_logger_tensorboard_wandb.yaml +0 -15
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/controlnet.yaml +0 -53
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/ema.yaml +0 -10
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/fine-tuning.yaml +0 -53
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/locon.yaml +0 -24
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/lora_anime_character.yaml +0 -77
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/lora_conventional.yaml +0 -56
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/lora_sdxl.yaml +0 -41
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/min_snr.yaml +0 -7
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/preview_in_training.yaml +0 -6
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples_noob/DreamBooth.yaml +0 -70
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples_noob/TextualInversion.yaml +0 -45
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples_noob/fine-tuning.yaml +0 -45
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples_noob/lora.yaml +0 -63
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/train_base.yaml +0 -81
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/tuning_base.yaml +0 -42
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/unet_struct.txt +0 -932
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/workflow/highres_fix_latent.yaml +0 -86
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/workflow/highres_fix_pixel.yaml +0 -99
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/workflow/text2img.yaml +0 -57
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/workflow/text2img_lora.yaml +0 -70
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/zero2.json +0 -32
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/zero3.json +0 -39
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/caption.txt +0 -1
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/name.txt +0 -1
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/name_2pt_caption.txt +0 -1
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/name_caption.txt +0 -1
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/object.txt +0 -27
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/object_caption.txt +0 -27
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/style.txt +0 -19
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/style_caption.txt +0 -19
hcpdiff-0.9.0.dist-info/METADATA +0 -199
hcpdiff-0.9.0.dist-info/RECORD +0 -155
hcpdiff-0.9.0.dist-info/entry_points.txt +0 -2
{hcpdiff-0.9.0.dist-info → hcpdiff-2.1.dist-info/licenses}/LICENSE +0 -0
{hcpdiff-0.9.0.dist-info → hcpdiff-2.1.dist-info}/top_level.txt +0 -0

hcpdiff/diffusion/sampler/edm.py ADDED Viewed

@@ -0,0 +1,22 @@
+import torch
+from .base import BaseSampler
+from .sigma_scheduler import SigmaScheduler
+class EDMSampler(BaseSampler):
+    def __init__(self, sigma_scheduler: SigmaScheduler, generator: torch.Generator = None, sigma_data: float = 1.0, sigma_thr=1000):
+        super().__init__(sigma_scheduler, generator)
+        self.sigma_data = sigma_data
+        self.sigma_thr = sigma_thr
+    def c_in(self, sigma):
+        return 1/(sigma**2+self.sigma_data**2).sqrt()
+    def c_out(self, sigma):
+        return (sigma*self.sigma_data)/(sigma**2+self.sigma_data**2).sqrt()
+    def c_skip(self, sigma):
+        return self.sigma_data**2/(sigma**2+self.sigma_data**2)
+    def denoise(self, x, sigma, eps=None, generator=None):
+        raise NotImplementedError

hcpdiff/diffusion/sampler/sigma_scheduler/__init__.py ADDED Viewed

@@ -0,0 +1,3 @@
+from .base import SigmaScheduler
+from .ddpm import DDPMDiscreteSigmaScheduler, DDPMContinuousSigmaScheduler, TimeSigmaScheduler
+from .edm import EDMSigmaScheduler, EDMRefSigmaScheduler

hcpdiff/diffusion/sampler/sigma_scheduler/base.py ADDED Viewed

@@ -0,0 +1,14 @@
+from typing import Union, Tuple
+import torch
+class SigmaScheduler:
+    def get_sigma(self, t: Union[float, torch.Tensor]) -> torch.Tensor:
+        '''
+        :param t: 0-1, rate of time step
+        '''
+        raise NotImplementedError
+    def sample_sigma(self, min_rate=0.0, max_rate=1.0, shape=(1,)) -> Tuple[torch.Tensor, torch.Tensor]:
+        raise NotImplementedError

hcpdiff/diffusion/sampler/sigma_scheduler/ddpm.py ADDED Viewed

@@ -0,0 +1,197 @@
+import torch
+import math
+from typing import Union, Tuple
+from hcpdiff.utils import linear_interp
+from .base import SigmaScheduler
+class DDPMDiscreteSigmaScheduler(SigmaScheduler):
+    def __init__(self, beta_schedule: str = "scaled_linear", linear_start=0.00085, linear_end=0.0120, num_timesteps=1000):
+        super().__init__()
+        self.num_timesteps = num_timesteps
+        self.betas = self.make_betas(beta_schedule, linear_start, linear_end, num_timesteps)
+        alphas = 1.0-self.betas
+        self.alphas_cumprod = torch.cumprod(alphas, dim=0)
+        self.sigmas = ((1-self.alphas_cumprod)/self.alphas_cumprod).sqrt()
+        # for VLB calculation
+        self.alphas_cumprod_prev = torch.cat([alphas.new_tensor([1.0]), self.alphas_cumprod[:-1]])
+        self.posterior_mean_coef1 = self.betas*torch.sqrt(self.alphas_cumprod_prev)/(1.0-self.alphas_cumprod)
+        self.posterior_mean_coef2 = (1.0-self.alphas_cumprod_prev)*torch.sqrt(alphas)/(1.0-self.alphas_cumprod)
+        self.posterior_variance = self.betas*(1.0-self.alphas_cumprod_prev)/(1.0-self.alphas_cumprod)
+        # below: log calculation clipped because the posterior variance is 0 at the beginning of the diffusion chain
+        self.posterior_log_variance_clipped = torch.log(torch.cat([self.posterior_variance[1:2], self.posterior_variance[1:]]))
+    @property
+    def sigma_min(self):
+        return self.sigmas[0]
+    @property
+    def sigma_max(self):
+        return self.sigmas[-1]
+    def get_sigma(self, t: Union[float, torch.Tensor]):
+        if isinstance(t, float):
+            t = torch.tensor(t)
+        return self.sigmas[(t*len(self.sigmas)).long()]
+    def sample_sigma(self, min_rate=0.0, max_rate=1.0, shape=(1,)):
+        if isinstance(min_rate, float):
+            min_rate = torch.full(shape, min_rate)
+        if isinstance(max_rate, float):
+            max_rate = torch.full(shape, max_rate)
+        t = torch.lerp(min_rate, max_rate, torch.rand_like(min_rate))
+        t_scale = (t*(self.num_timesteps-1e-5)).long()  # [0, num_timesteps-1)
+        return self.sigmas[t_scale], t
+    def sigma_to_t(self, sigma: Union[float, torch.Tensor]):
+        t = (self.sigmas-sigma).abs().argmin()
+        return t/self.num_timesteps
+    def get_post_mean(self, t, x_0, x_t):
+        t = (t*len(self.sigmas)).long()
+        return self.posterior_mean_coef1[t].view(-1, 1, 1, 1).to(t.device)*x_0 + self.posterior_mean_coef2[t].view(-1, 1, 1, 1).to(t.device)*x_t
+    def get_post_log_var(self, t, x_t_var=None):
+        t = (t*len(self.sigmas)).long()
+        min_log = self.posterior_log_variance_clipped[t].view(-1, 1, 1, 1).to(t.device)
+        if x_t_var is None:
+            return min_log
+        else:
+            max_log = self.betas.log()[t].view(-1, 1, 1, 1).to(t.device)
+            # The model_var_values is [-1, 1] for [min_var, max_var].
+            frac = (x_t_var+1)/2
+            model_log_variance = frac*max_log+(1-frac)*min_log
+            return model_log_variance
+    @staticmethod
+    def betas_for_alpha_bar(
+        num_diffusion_timesteps,
+        max_beta=0.999,
+        alpha_transform_type="cosine",
+    ):
+        """
+        Create a beta schedule that discretizes the given alpha_t_bar function, which defines the cumulative product of
+        (1-beta) over time from t = [0,1].
+        Contains a function alpha_bar that takes an argument t and transforms it to the cumulative product of (1-beta) up
+        to that part of the diffusion process.
+        Args:
+            num_diffusion_timesteps (`int`): the number of betas to produce.
+            max_beta (`float`): the maximum beta to use; use values lower than 1 to
+                         prevent singularities.
+            alpha_transform_type (`str`, *optional*, default to `cosine`): the type of noise schedule for alpha_bar.
+                         Choose from `cosine` or `exp`
+        Returns:
+            betas (`np.ndarray`): the betas used by the scheduler to step the model outputs
+        """
+        if alpha_transform_type == "cosine":
+            def alpha_bar_fn(t):
+                return math.cos((t+0.008)/1.008*math.pi/2)**2
+        elif alpha_transform_type == "exp":
+            def alpha_bar_fn(t):
+                return math.exp(t*-12.0)
+        else:
+            raise ValueError(f"Unsupported alpha_tranform_type: {alpha_transform_type}")
+        betas = []
+        for i in range(num_diffusion_timesteps):
+            t1 = i/num_diffusion_timesteps
+            t2 = (i+1)/num_diffusion_timesteps
+            betas.append(min(1-alpha_bar_fn(t2)/alpha_bar_fn(t1), max_beta))
+        return torch.tensor(betas, dtype=torch.float32)
+    @staticmethod
+    def make_betas(beta_schedule, beta_start, beta_end, num_train_timesteps, betas=None):
+        if betas is not None:
+            return torch.tensor(betas, dtype=torch.float32)
+        elif beta_schedule == "linear":
+            return torch.linspace(beta_start, beta_end, num_train_timesteps, dtype=torch.float32)
+        elif beta_schedule == "scaled_linear":
+            # this schedule is very specific to the latent diffusion model.
+            return torch.linspace(beta_start**0.5, beta_end**0.5, num_train_timesteps, dtype=torch.float32)**2
+        elif beta_schedule == "squaredcos_cap_v2":
+            # Glide cosine schedule
+            return DDPMDiscreteSigmaScheduler.betas_for_alpha_bar(num_train_timesteps)
+        elif beta_schedule == "sigmoid":
+            # GeoDiff sigmoid schedule
+            betas = torch.linspace(-6, 6, num_train_timesteps)
+            return torch.sigmoid(betas)*(beta_end-beta_start)+beta_start
+        else:
+            raise NotImplementedError(f"{beta_schedule} does is not implemented.")
+class DDPMContinuousSigmaScheduler(DDPMDiscreteSigmaScheduler):
+    def get_sigma(self, t: Union[float, torch.Tensor]):
+        if isinstance(t, float):
+            t = torch.tensor(t)
+        return linear_interp(self.sigmas, t)
+    def sample_sigma(self, min_rate=0.0, max_rate=1.0, shape=(1,)):
+        if isinstance(min_rate, float):
+            min_rate = torch.full(shape, min_rate)
+        if isinstance(max_rate, float):
+            max_rate = torch.full(shape, max_rate)
+        t = torch.lerp(min_rate, max_rate, torch.rand_like(min_rate))
+        t_scale = (t*(self.num_timesteps-1-1e-5))  # [0, num_timesteps-1)
+        return linear_interp(self.sigmas, t_scale), t
+    def sigma_to_t(self, sigma: Union[float, torch.Tensor]):
+        diff = self.sigmas-sigma
+        diff[diff<0] = float('inf')
+        t0 = diff.argmin().clamp(0, self.num_timesteps-2)
+        return t0 + diff.min()/(self.sigmas[t0+1]-self.sigmas[t0])
+class TimeSigmaScheduler(SigmaScheduler):
+    def __init__(self, num_timesteps=1000):
+        super().__init__()
+        self.num_timesteps = num_timesteps
+    def get_sigma(self, t: Union[float, torch.Tensor]) -> torch.Tensor:
+        '''
+        :param t: 0-1, rate of time step
+        '''
+        return t
+    def sample_sigma(self, min_rate=0.0, max_rate=1.0, shape=(1,)) -> Tuple[torch.Tensor, torch.Tensor]:
+        if isinstance(min_rate, float):
+            min_rate = torch.full(shape, min_rate)
+        if isinstance(max_rate, float):
+            max_rate = torch.full(shape, max_rate)
+        t = torch.lerp(min_rate, max_rate, torch.rand_like(min_rate))
+        t_scale = (t*(self.num_timesteps-1e-5)).long()  # [0, num_timesteps-1)
+        return t_scale, t
+if __name__ == '__main__':
+    from matplotlib import pyplot as plt
+    import numpy as np
+    sigma_scheduler = DDPMDiscreteSigmaScheduler()
+    print(sigma_scheduler.sigma_min, sigma_scheduler.sigma_max)
+    t = torch.linspace(0, 1, 1000)
+    rho = 1.
+    s2 = (sigma_scheduler.sigma_min**(1/rho)+t*(sigma_scheduler.sigma_max**(1/rho)-sigma_scheduler.sigma_min**(1/rho)))**rho
+    t2 = np.interp(s2.log().numpy(), sigma_scheduler.sigmas.log().numpy(), t.numpy())
+    plt.figure()
+    plt.plot(sigma_scheduler.sigmas)
+    plt.plot(t2*1000, s2)
+    plt.show()
+    plt.figure()
+    plt.plot(sigma_scheduler.sigmas.log())
+    plt.plot(t2*1000, s2.log())
+    plt.show()

hcpdiff/diffusion/sampler/sigma_scheduler/edm.py ADDED Viewed

@@ -0,0 +1,48 @@
+from typing import Union
+import torch
+import numpy as np
+from .base import SigmaScheduler
+class EDMSigmaScheduler(SigmaScheduler):
+    def __init__(self, sigma_min=0.002, sigma_max=80.0, rho=7.0, num_timesteps=1000):
+        self.sigma_min = torch.tensor(sigma_min)
+        self.sigma_max = torch.tensor(sigma_max)
+        self.rho = rho
+        self.num_timesteps=num_timesteps
+    def get_sigma(self, t: Union[float, torch.Tensor]):
+        if isinstance(t, float):
+            t = torch.tensor(t)
+        min_inv_rho = self.sigma_min**(1/self.rho)
+        max_inv_rho = self.sigma_max**(1/self.rho)
+        return torch.lerp(min_inv_rho, max_inv_rho, t)**self.rho
+    def sample_sigma(self, min_rate=0.0, max_rate=1.0, shape=(1,)):
+        if isinstance(min_rate, float):
+            min_rate = torch.full(shape, min_rate)
+        if isinstance(max_rate, float):
+            max_rate = torch.full(shape, max_rate)
+        t = torch.lerp(min_rate, max_rate, torch.rand_like(min_rate))
+        return self.get_sigma(t), t
+class EDMRefSigmaScheduler(EDMSigmaScheduler):
+    def __init__(self, ref_scheduler, sigma_min=0.002, sigma_max=80.0, rho=7.0, num_timesteps=1000):
+        super().__init__(sigma_min, sigma_max, rho, num_timesteps=num_timesteps)
+        self.ref_sigmas = ref_scheduler.sigmas.cpu().clip(min=1e-8).log().numpy()
+        self.ref_t = np.linspace(0, 1, len(self.ref_sigmas))
+    def sample_sigma(self, min_rate=0.0, max_rate=1.0, shape=(1,)):
+        if isinstance(min_rate, float):
+            min_rate = torch.full(shape, min_rate)
+        if isinstance(max_rate, float):
+            max_rate = torch.full(shape, max_rate)
+        t = torch.lerp(min_rate, max_rate, torch.rand_like(min_rate))
+        sigma = self.get_sigma(t)
+        t_rect = torch.tensor(np.interp(sigma.cpu().clip(min=1e-8).log().numpy(), self.ref_sigmas, self.ref_t))
+        return sigma, t_rect

hcpdiff/easy/__init__.py ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ from .model import SD15_auto_loader, SDXL_auto_loader, PixArt_auto_loader, ControlNet_SD15, make_controlnet_handler
2	+ from .sampler import Diffusers_SD

hcpdiff/easy/cfg/__init__.py ADDED Viewed

@@ -0,0 +1,3 @@
+from .sd15_train import SD15_lora_train, cfg_data_SD_ARB, cfg_data_SD_resize_crop, SD15_finetuning
+from .sdxl_train import SDXL_lora_train, SDXL_finetuning
+from .t2i import SD15_t2i, SDXL_t2i, SDXL_t2i_lora, SD15_t2i_lora

hcpdiff/easy/cfg/sd15_train.py ADDED Viewed

@@ -0,0 +1,201 @@
+import torch
+from rainbowneko.ckpt_manager import ckpt_saver, LAYERS_TRAINABLE, plugin_saver
+from rainbowneko.data import RatioBucket, FixedBucket
+from rainbowneko.parser import CfgWDPluginParser, neko_cfg, CfgWDModelParser, disable_neko_cfg
+from rainbowneko.utils import ConstantLR, Path_Like
+from hcpdiff.data import TextImagePairDataset, Text2ImageSource, StableDiffusionHandler
+from hcpdiff.data import VaeCache
+from hcpdiff.easy import SD15_auto_loader
+from hcpdiff.models import SD15Wrapper, TEHookCFG
+from hcpdiff.models.lora_layers_patch import LoraLayer
+@neko_cfg
+def SD15_finetuning(base_model: str, train_steps: int, dataset, save_step: int = 500, lr: float = 1e-5, clip_skip: int = 0,
+                    dtype: str = 'fp16', low_vram: bool = False, warmup_steps: int = 0, name: str = 'SD15'):
+    if low_vram:
+        from bitsandbytes.optim import AdamW8bit
+        optimizer = AdamW8bit(_partial_=True)
+    else:
+        optimizer = torch.optim.AdamW(_partial_=True)
+    from cfgs.train.py import train_base, tuning_base
+    return dict(
+        _base_=[train_base, tuning_base],
+        mixed_precision=dtype,
+        model_part=CfgWDModelParser([
+            dict(
+                lr=lr,
+                layers=['denoiser'],  # train UNet
+            )
+        ], weight_decay=1e-2),
+        ckpt_saver=dict(
+            SD15=ckpt_saver(
+                ckpt_type='safetensors',
+                target_module='denoiser',
+                layers=LAYERS_TRAINABLE,
+            )
+        ),
+        train=dict(
+            train_steps=train_steps,
+            save_step=save_step,
+            optimizer=optimizer,
+            scheduler=ConstantLR(
+                _partial_=True,
+                warmup_steps=warmup_steps,
+            ),
+        ),
+        model=dict(
+            name=name,
+            ## Easy config
+            wrapper=SD15Wrapper.from_pretrained(
+                _partial_=True,
+                models=SD15_auto_loader(ckpt_path=base_model, _partial_=True),
+                TE_hook_cfg=TEHookCFG(clip_skip=clip_skip),
+            ),
+        ),
+        data_train=dataset,
+    )
+@neko_cfg
+def SD15_lora_train(base_model: str, train_steps: int, dataset, save_step: int = 200, lr: float = 1e-4, rank: int = 4, alpha: float = None,
+                    clip_skip: int = 0, with_conv: bool = False, dtype: str = 'fp16', low_vram: bool = False, warmup_steps: int = 0,
+                    name: str = 'SD15'):
+    with disable_neko_cfg:
+        if alpha is None:
+            alpha = rank
+        if with_conv:
+            lora_layers = [
+                r're:denoiser.*\.attn.?$',
+                r're:denoiser.*\.ff$',
+                r're:denoiser.*\.resnets$',
+                r're:denoiser.*\.proj_in$',
+                r're:denoiser.*\.proj_out$',
+                r're:denoiser.*\.conv$',
+            ]
+        else:
+            lora_layers = [
+                r're:denoiser.*\.attn.?$',
+                r're:denoiser.*\.ff$',
+            ]
+    if low_vram:
+        from bitsandbytes.optim import AdamW8bit
+        optimizer = AdamW8bit(_partial_=True, betas=(0.9, 0.99))
+    else:
+        optimizer = torch.optim.AdamW(_partial_=True, betas=(0.9, 0.99))
+    from cfgs.train.py.examples import SD_FT
+    return dict(
+        _base_=[SD_FT],
+        mixed_precision=dtype,
+        model_part=None,
+        model_plugin=CfgWDPluginParser(cfg_plugin=dict(
+            lora1=LoraLayer.wrap_model(
+                _partial_=True,
+                lr=lr,
+                rank=rank,
+                alpha=alpha,
+                layers=lora_layers
+            )
+        ), weight_decay=0.1),
+        ckpt_saver=dict(
+            _replace_ = True,
+            lora_unet=plugin_saver(
+                ckpt_type='safetensors',
+                target_plugin='lora1',
+            )
+        ),
+        train=dict(
+            train_steps=train_steps,
+            save_step=save_step,
+            optimizer=optimizer,
+            scheduler=ConstantLR(
+                _partial_=True,
+                warmup_steps=warmup_steps,
+            ),
+        ),
+        model=dict(
+            name=name,
+            wrapper=SD15Wrapper.from_pretrained(
+                _partial_=True,
+                models=SD15_auto_loader(ckpt_path=base_model, _partial_=True),
+                TE_hook_cfg=TEHookCFG(clip_skip=clip_skip),
+            ),
+        ),
+        data_train=dataset,
+    )
+@neko_cfg
+def cfg_data_SD_ARB(img_root: Path_Like, batch_size: int = 4, trigger_word: str = '', resolution: int = 512*512, num_bucket=4, word_names=None,
+                    prompt_dropout: float = 0, prompt_template: Path_Like = 'prompt_template/caption.txt', loss_weight=1.0):
+    if word_names is None:
+        word_names = dict(pt1=trigger_word)
+    else:
+        word_names = word_names
+    return TextImagePairDataset(
+        _partial_=True, batch_size=batch_size, loss_weight=loss_weight,
+        source=dict(
+            data_source1=Text2ImageSource(
+                img_root=img_root,
+                label_file='${.img_root}',  # path to image captions (file_words)
+                prompt_template=prompt_template,
+            ),
+        ),
+        handler=StableDiffusionHandler(
+            bucket=RatioBucket,
+            word_names=word_names,
+            erase=prompt_dropout,
+        ),
+        bucket=RatioBucket.from_files(
+            target_area=resolution,
+            num_bucket=num_bucket,
+        ),
+        cache=VaeCache(bs=batch_size)
+    )
+@neko_cfg
+def cfg_data_SD_resize_crop(img_root: Path_Like, batch_size: int = 4, trigger_word: str = '', target_size = (512, 512), word_names=None,
+                            prompt_dropout: float = 0, prompt_template: Path_Like = 'prompt_template/caption.txt', loss_weight=1.0):
+    if word_names is None:
+        word_names = dict(pt1=trigger_word)
+    else:
+        word_names = word_names
+    return TextImagePairDataset(
+        _partial_=True, batch_size=batch_size, loss_weight=loss_weight,
+        source=dict(
+            data_source1=Text2ImageSource(
+                img_root=img_root,
+                label_file='${.img_root}',  # path to image captions (file_words)
+                prompt_template=prompt_template,
+            ),
+        ),
+        handler=StableDiffusionHandler(
+            bucket=FixedBucket,
+            word_names=word_names,
+            erase=prompt_dropout,
+        ),
+        bucket=FixedBucket(target_size=target_size),
+        cache=VaeCache(bs=batch_size)
+    )

hcpdiff/easy/cfg/sdxl_train.py ADDED Viewed

@@ -0,0 +1,140 @@
+import torch
+from rainbowneko.ckpt_manager import ckpt_saver, plugin_saver, LAYERS_TRAINABLE
+from rainbowneko.parser import CfgWDPluginParser, neko_cfg, CfgWDModelParser, disable_neko_cfg
+from rainbowneko.utils import ConstantLR
+from hcpdiff.easy import SDXL_auto_loader
+from hcpdiff.models import SDXLWrapper
+from hcpdiff.models.lora_layers_patch import LoraLayer
+@neko_cfg
+def SDXL_finetuning(base_model: str, train_steps: int, dataset, save_step: int = 500, lr: float = 1e-5,
+                    dtype: str = 'fp16', low_vram: bool = False, warmup_steps: int = 0, name: str = 'SDXL'):
+    if low_vram:
+        from bitsandbytes.optim import AdamW8bit
+        optimizer = AdamW8bit(_partial_=True)
+    else:
+        optimizer = torch.optim.AdamW(_partial_=True)
+    from cfgs.train.py import train_base, tuning_base
+    return dict(
+        _base_=[train_base, tuning_base],
+        mixed_precision=dtype,
+        model_part=CfgWDModelParser([
+            dict(
+                lr=lr,
+                layers=['denoiser'],  # train UNet
+            )
+        ], weight_decay=1e-2),
+        ckpt_saver=dict(
+            SDXL=ckpt_saver(
+                ckpt_type='safetensors',
+                target_module='denoiser',
+                layers=LAYERS_TRAINABLE,
+            )
+        ),
+        train=dict(
+            train_steps=train_steps,
+            save_step=save_step,
+            optimizer=optimizer,
+            scheduler=ConstantLR(
+                _partial_=True,
+                warmup_steps=warmup_steps,
+            ),
+        ),
+        model=dict(
+            name=name,
+            ## Easy config
+            wrapper=SDXLWrapper.from_pretrained(
+                _partial_=True,
+                models=SDXL_auto_loader(ckpt_path=base_model, _partial_=True),
+            ),
+        ),
+        data_train=dataset,
+    )
+@neko_cfg
+def SDXL_lora_train(base_model: str, train_steps: int, dataset, save_step: int = 200, lr: float = 1e-4, rank: int = 4, alpha: float = None,
+                    with_conv: bool = False, dtype: str = 'fp16', low_vram: bool = False, warmup_steps: int = 0, name: str = 'SD15'):
+    with disable_neko_cfg:
+        if alpha is None:
+            alpha = rank
+        if with_conv:
+            lora_layers = [
+                r're:denoiser.*\.attn.?$',
+                r're:denoiser.*\.ff$',
+                r're:denoiser.*\.resnets$',
+                r're:denoiser.*\.proj_in$',
+                r're:denoiser.*\.proj_out$',
+                r're:denoiser.*\.conv$',
+            ]
+        else:
+            lora_layers = [
+                r're:denoiser.*\.attn.?$',
+                r're:denoiser.*\.ff$',
+            ]
+    if low_vram:
+        from bitsandbytes.optim import AdamW8bit
+        optimizer = AdamW8bit(_partial_=True, betas=(0.9, 0.99))
+    else:
+        optimizer = torch.optim.AdamW(_partial_=True, betas=(0.9, 0.99))
+    from cfgs.train.py.examples import SD_FT
+    return dict(
+        _base_=[SD_FT],
+        mixed_precision=dtype,
+        model_part=None,
+        model_plugin=CfgWDPluginParser(cfg_plugin=dict(
+            lora1=LoraLayer.wrap_model(
+                _partial_=True,
+                lr=lr,
+                rank=rank,
+                alpha=alpha,
+                layers=lora_layers
+            )
+        ), weight_decay=0.1),
+        ckpt_saver=dict(
+            _replace_ = True,
+            lora_unet=plugin_saver(
+                ckpt_type='safetensors',
+                target_plugin='lora1',
+            )
+        ),
+        train=dict(
+            train_steps=train_steps,
+            save_step=save_step,
+            optimizer=optimizer,
+            scheduler=ConstantLR(
+                _partial_=True,
+                warmup_steps=warmup_steps,
+            ),
+        ),
+        model=dict(
+            name=name,
+            wrapper=SDXLWrapper.from_pretrained(
+                models=SDXL_auto_loader(ckpt_path=base_model, _partial_=True),
+                _partial_=True,
+            ),
+        ),
+        data_train=dataset,
+    )

hcpdiff 0.9.0__py3-none-any.whl → 2.1__py3-none-any.whl

hcpdiff 0.9.0py3-none-any.whl → 2.1py3-none-any.whl