PyPI - hcpdiff - Versions diffs - 0.9.1__py3-none-any.whl → 2.2__py3-none-any.whl - Mend

hcpdiff 0.9.1py3-none-any.whl → 2.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (211) hide show

hcpdiff/__init__.py +4 -4
hcpdiff/ckpt_manager/__init__.py +4 -5
hcpdiff/ckpt_manager/ckpt.py +24 -0
hcpdiff/ckpt_manager/format/__init__.py +4 -0
hcpdiff/ckpt_manager/format/diffusers.py +59 -0
hcpdiff/ckpt_manager/format/emb.py +21 -0
hcpdiff/ckpt_manager/format/lora_webui.py +252 -0
hcpdiff/ckpt_manager/format/sd_single.py +41 -0
hcpdiff/ckpt_manager/loader.py +64 -0
hcpdiff/data/__init__.py +4 -28
hcpdiff/data/cache/__init__.py +1 -0
hcpdiff/data/cache/vae.py +102 -0
hcpdiff/data/dataset.py +20 -0
hcpdiff/data/handler/__init__.py +3 -0
hcpdiff/data/handler/controlnet.py +18 -0
hcpdiff/data/handler/diffusion.py +90 -0
hcpdiff/data/handler/text.py +111 -0
hcpdiff/data/source/__init__.py +3 -3
hcpdiff/data/source/folder_class.py +12 -29
hcpdiff/data/source/text.py +40 -0
hcpdiff/data/source/text2img.py +36 -74
hcpdiff/data/source/text2img_cond.py +9 -15
hcpdiff/diffusion/__init__.py +0 -0
hcpdiff/diffusion/noise/__init__.py +2 -0
hcpdiff/diffusion/noise/pyramid_noise.py +42 -0
hcpdiff/diffusion/noise/zero_terminal.py +39 -0
hcpdiff/diffusion/sampler/__init__.py +5 -0
hcpdiff/diffusion/sampler/base.py +72 -0
hcpdiff/diffusion/sampler/ddpm.py +20 -0
hcpdiff/diffusion/sampler/diffusers.py +66 -0
hcpdiff/diffusion/sampler/edm.py +22 -0
hcpdiff/diffusion/sampler/sigma_scheduler/__init__.py +3 -0
hcpdiff/diffusion/sampler/sigma_scheduler/base.py +14 -0
hcpdiff/diffusion/sampler/sigma_scheduler/ddpm.py +197 -0
hcpdiff/diffusion/sampler/sigma_scheduler/edm.py +48 -0
hcpdiff/easy/__init__.py +2 -0
hcpdiff/easy/cfg/__init__.py +3 -0
hcpdiff/easy/cfg/sd15_train.py +207 -0
hcpdiff/easy/cfg/sdxl_train.py +147 -0
hcpdiff/easy/cfg/t2i.py +228 -0
hcpdiff/easy/model/__init__.py +2 -0
hcpdiff/easy/model/cnet.py +31 -0
hcpdiff/easy/model/loader.py +79 -0
hcpdiff/easy/sampler.py +46 -0
hcpdiff/evaluate/__init__.py +1 -0
hcpdiff/evaluate/previewer.py +60 -0
hcpdiff/loss/__init__.py +4 -1
hcpdiff/loss/base.py +41 -0
hcpdiff/loss/gw.py +35 -0
hcpdiff/loss/ssim.py +37 -0
hcpdiff/loss/vlb.py +79 -0
hcpdiff/loss/weighting.py +66 -0
hcpdiff/models/__init__.py +2 -2
hcpdiff/models/cfg_context.py +17 -14
hcpdiff/models/compose/compose_hook.py +44 -23
hcpdiff/models/compose/compose_tokenizer.py +21 -8
hcpdiff/models/compose/sdxl_composer.py +4 -4
hcpdiff/models/controlnet.py +16 -16
hcpdiff/models/lora_base_patch.py +14 -25
hcpdiff/models/lora_layers.py +3 -9
hcpdiff/models/lora_layers_patch.py +14 -24
hcpdiff/models/text_emb_ex.py +84 -6
hcpdiff/models/textencoder_ex.py +54 -18
hcpdiff/models/wrapper/__init__.py +3 -0
hcpdiff/models/wrapper/pixart.py +19 -0
hcpdiff/models/wrapper/sd.py +218 -0
hcpdiff/models/wrapper/utils.py +20 -0
hcpdiff/parser/__init__.py +1 -0
hcpdiff/parser/embpt.py +32 -0
hcpdiff/tools/convert_caption_txt2json.py +1 -1
hcpdiff/tools/dataset_generator.py +94 -0
hcpdiff/tools/download_hf_model.py +24 -0
hcpdiff/tools/init_proj.py +3 -21
hcpdiff/tools/lora_convert.py +18 -17
hcpdiff/tools/save_model.py +12 -0
hcpdiff/tools/sd2diffusers.py +1 -1
hcpdiff/train_colo.py +1 -1
hcpdiff/train_deepspeed.py +1 -1
hcpdiff/trainer_ac.py +79 -0
hcpdiff/trainer_ac_single.py +31 -0
hcpdiff/utils/__init__.py +0 -2
hcpdiff/utils/inpaint_pipe.py +7 -2
hcpdiff/utils/net_utils.py +29 -6
hcpdiff/utils/pipe_hook.py +24 -7
hcpdiff/utils/utils.py +21 -4
hcpdiff/workflow/__init__.py +15 -10
hcpdiff/workflow/daam/__init__.py +1 -0
hcpdiff/workflow/daam/act.py +66 -0
hcpdiff/workflow/daam/hook.py +109 -0
hcpdiff/workflow/diffusion.py +118 -128
hcpdiff/workflow/fast.py +31 -0
hcpdiff/workflow/flow.py +67 -0
hcpdiff/workflow/io.py +36 -130
hcpdiff/workflow/model.py +46 -43
hcpdiff/workflow/text.py +60 -47
hcpdiff/workflow/utils.py +32 -12
hcpdiff/workflow/vae.py +37 -38
hcpdiff-2.2.dist-info/METADATA +299 -0
hcpdiff-2.2.dist-info/RECORD +115 -0
{hcpdiff-0.9.1.dist-info → hcpdiff-2.2.dist-info}/WHEEL +1 -1
hcpdiff-2.2.dist-info/entry_points.txt +5 -0
hcpdiff/ckpt_manager/base.py +0 -16
hcpdiff/ckpt_manager/ckpt_diffusers.py +0 -45
hcpdiff/ckpt_manager/ckpt_pkl.py +0 -138
hcpdiff/ckpt_manager/ckpt_safetensor.py +0 -64
hcpdiff/ckpt_manager/ckpt_webui.py +0 -54
hcpdiff/data/bucket.py +0 -358
hcpdiff/data/caption_loader.py +0 -80
hcpdiff/data/cond_dataset.py +0 -40
hcpdiff/data/crop_info_dataset.py +0 -40
hcpdiff/data/data_processor.py +0 -33
hcpdiff/data/pair_dataset.py +0 -146
hcpdiff/data/sampler.py +0 -54
hcpdiff/data/source/base.py +0 -30
hcpdiff/data/utils.py +0 -80
hcpdiff/deprecated/__init__.py +0 -1
hcpdiff/deprecated/cfg_converter.py +0 -81
hcpdiff/deprecated/lora_convert.py +0 -31
hcpdiff/infer_workflow.py +0 -57
hcpdiff/loggers/__init__.py +0 -13
hcpdiff/loggers/base_logger.py +0 -76
hcpdiff/loggers/cli_logger.py +0 -40
hcpdiff/loggers/preview/__init__.py +0 -1
hcpdiff/loggers/preview/image_previewer.py +0 -149
hcpdiff/loggers/tensorboard_logger.py +0 -30
hcpdiff/loggers/wandb_logger.py +0 -31
hcpdiff/loggers/webui_logger.py +0 -9
hcpdiff/loss/min_snr_loss.py +0 -52
hcpdiff/models/layers.py +0 -81
hcpdiff/models/plugin.py +0 -348
hcpdiff/models/wrapper.py +0 -75
hcpdiff/noise/__init__.py +0 -3
hcpdiff/noise/noise_base.py +0 -16
hcpdiff/noise/pyramid_noise.py +0 -50
hcpdiff/noise/zero_terminal.py +0 -44
hcpdiff/train_ac.py +0 -566
hcpdiff/train_ac_single.py +0 -39
hcpdiff/utils/caption_tools.py +0 -105
hcpdiff/utils/cfg_net_tools.py +0 -321
hcpdiff/utils/cfg_resolvers.py +0 -16
hcpdiff/utils/ema.py +0 -52
hcpdiff/utils/img_size_tool.py +0 -248
hcpdiff/vis/__init__.py +0 -3
hcpdiff/vis/base_interface.py +0 -12
hcpdiff/vis/disk_interface.py +0 -48
hcpdiff/vis/webui_interface.py +0 -17
hcpdiff/viser_fast.py +0 -138
hcpdiff/visualizer.py +0 -265
hcpdiff/visualizer_reloadable.py +0 -237
hcpdiff/workflow/base.py +0 -59
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/anime/text2img_anime.yaml +0 -21
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/anime/text2img_anime_lora.yaml +0 -58
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/change_vae.yaml +0 -6
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/euler_a.yaml +0 -8
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/img2img.yaml +0 -10
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/img2img_controlnet.yaml +0 -19
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/inpaint.yaml +0 -11
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/load_lora.yaml +0 -26
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/load_unet_part.yaml +0 -18
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/offload_2GB.yaml +0 -6
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/save_model.yaml +0 -44
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/text2img.yaml +0 -53
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/text2img_DA++.yaml +0 -34
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/infer/text2img_sdxl.yaml +0 -9
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/plugins/plugin_controlnet.yaml +0 -17
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/te_struct.txt +0 -193
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/dataset/base_dataset.yaml +0 -29
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/dataset/regularization_dataset.yaml +0 -31
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/CustomDiffusion.yaml +0 -74
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/DreamArtist++.yaml +0 -135
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/DreamArtist.yaml +0 -45
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/DreamBooth.yaml +0 -62
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/FT_sdxl.yaml +0 -33
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/Lion_optimizer.yaml +0 -17
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/TextualInversion.yaml +0 -41
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/add_logger_tensorboard_wandb.yaml +0 -15
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/controlnet.yaml +0 -53
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/ema.yaml +0 -10
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/fine-tuning.yaml +0 -53
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/locon.yaml +0 -24
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/lora_anime_character.yaml +0 -77
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/lora_conventional.yaml +0 -56
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/lora_sdxl.yaml +0 -41
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/min_snr.yaml +0 -7
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples/preview_in_training.yaml +0 -6
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples_noob/DreamBooth.yaml +0 -70
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples_noob/TextualInversion.yaml +0 -45
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples_noob/fine-tuning.yaml +0 -45
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/examples_noob/lora.yaml +0 -63
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/train_base.yaml +0 -81
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/train/tuning_base.yaml +0 -42
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/unet_struct.txt +0 -932
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/workflow/highres_fix_latent.yaml +0 -86
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/workflow/highres_fix_pixel.yaml +0 -99
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/workflow/text2img.yaml +0 -59
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/workflow/text2img_lora.yaml +0 -70
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/zero2.json +0 -32
hcpdiff-0.9.1.data/data/hcpdiff/cfgs/zero3.json +0 -39
hcpdiff-0.9.1.data/data/hcpdiff/prompt_tuning_template/caption.txt +0 -1
hcpdiff-0.9.1.data/data/hcpdiff/prompt_tuning_template/name.txt +0 -1
hcpdiff-0.9.1.data/data/hcpdiff/prompt_tuning_template/name_2pt_caption.txt +0 -1
hcpdiff-0.9.1.data/data/hcpdiff/prompt_tuning_template/name_caption.txt +0 -1
hcpdiff-0.9.1.data/data/hcpdiff/prompt_tuning_template/object.txt +0 -27
hcpdiff-0.9.1.data/data/hcpdiff/prompt_tuning_template/object_caption.txt +0 -27
hcpdiff-0.9.1.data/data/hcpdiff/prompt_tuning_template/style.txt +0 -19
hcpdiff-0.9.1.data/data/hcpdiff/prompt_tuning_template/style_caption.txt +0 -19
hcpdiff-0.9.1.dist-info/METADATA +0 -199
hcpdiff-0.9.1.dist-info/RECORD +0 -160
hcpdiff-0.9.1.dist-info/entry_points.txt +0 -2
{hcpdiff-0.9.1.dist-info → hcpdiff-2.2.dist-info/licenses}/LICENSE +0 -0
{hcpdiff-0.9.1.dist-info → hcpdiff-2.2.dist-info}/top_level.txt +0 -0

hcpdiff/__init__.py CHANGED Viewed

@@ -1,4 +1,4 @@
-from .train_ac import Trainer
-from .train_ac_single import TrainerSingleCard
-from .visualizer import Visualizer
-from .visualizer_reloadable import VisualizerReloadable
+#from .train_ac_old import Trainer
+#from .train_ac_single import TrainerSingleCard
+# from .visualizer import Visualizer
+# from .visualizer_reloadable import VisualizerReloadable

hcpdiff/ckpt_manager/__init__.py CHANGED Viewed

@@ -1,5 +1,4 @@
-from .ckpt_pkl import CkptManagerPKL
-from .ckpt_safetensor import CkptManagerSafe
-def auto_manager(ckpt_path:str):
-    return CkptManagerSafe() if ckpt_path.endswith('.safetensors') else CkptManagerPKL()
+from .format import EmbFormat, DiffusersSD15Format, DiffusersModelFormat, DiffusersSDXLFormat, DiffusersPixArtFormat, OfficialSDXLFormat, \
+    OfficialSD15Format, LoraWebuiFormat
+from .ckpt import EmbSaver, easy_emb_saver
+from .loader import HCPLoraLoader

hcpdiff/ckpt_manager/ckpt.py ADDED Viewed

@@ -0,0 +1,24 @@
+from rainbowneko.ckpt_manager import NekoSaver, CkptFormat, LocalCkptSource, PKLFormat
+from torch import nn
+from typing import Dict, Any
+class EmbSaver(NekoSaver):
+    def __init__(self, format: CkptFormat, source: LocalCkptSource, target_key='embs', prefix=None):
+        super().__init__(format, source)
+        self.target_key = target_key
+        self.prefix = prefix
+    def save_to(self, name, model: nn.Module, plugin_groups: Dict[str, Any], model_ema=None, exclude_key=None,
+                name_template=None):
+        train_pts = plugin_groups[self.target_key]
+        for pt_name, pt in train_pts.items():
+            self.save(pt_name, (pt_name, pt), prefix=self.prefix)
+            if name_template is not None:
+                pt_name = name_template.format(pt_name)
+                self.save(pt_name, (pt_name, pt), prefix=self.prefix)
+def easy_emb_saver():
+    return EmbSaver(
+        format=PKLFormat(),
+        source=LocalCkptSource(),
+    )

hcpdiff/ckpt_manager/format/__init__.py ADDED Viewed

@@ -0,0 +1,4 @@
+from .emb import EmbFormat
+from .diffusers import DiffusersSD15Format, DiffusersModelFormat, DiffusersSDXLFormat, DiffusersPixArtFormat
+from .sd_single import OfficialSD15Format, OfficialSDXLFormat
+from .lora_webui import LoraWebuiFormat

hcpdiff/ckpt_manager/format/diffusers.py ADDED Viewed

@@ -0,0 +1,59 @@
+import torch
+from diffusers import ModelMixin, AutoencoderKL, UNet2DConditionModel, PixArtTransformer2DModel
+from rainbowneko.ckpt_manager.format import CkptFormat
+from transformers import CLIPTextModel, AutoTokenizer, T5EncoderModel
+from hcpdiff.diffusion.sampler import DDPMSampler, DDPMDiscreteSigmaScheduler
+from hcpdiff.models.compose import SDXLTokenizer, SDXLTextEncoder
+class DiffusersModelFormat(CkptFormat):
+    def __init__(self, builder: ModelMixin):
+        self.builder = builder
+    def save_ckpt(self, sd_model: ModelMixin, save_f: str, **kwargs):
+        sd_model.save_pretrained(save_f)
+    def load_ckpt(self, ckpt_f: str, map_location="cpu", **kwargs):
+        self.builder.from_pretrained(ckpt_f, **kwargs)
+class DiffusersSD15Format(CkptFormat):
+    def load_ckpt(self, pretrained_model: str, map_location="cpu", denoiser=None, TE=None, vae: AutoencoderKL = None, noise_sampler=None,
+                  tokenizer=None, revision=None, dtype=torch.float32, **kwargs):
+        denoiser = denoiser or UNet2DConditionModel.from_pretrained(
+            pretrained_model, subfolder="unet", revision=revision, torch_dtype=dtype
+        )
+        vae = vae or AutoencoderKL.from_pretrained(pretrained_model, subfolder="vae", revision=revision, torch_dtype=dtype)
+        noise_sampler = noise_sampler or DDPMSampler(DDPMDiscreteSigmaScheduler())
+        TE = TE or CLIPTextModel.from_pretrained(pretrained_model, subfolder="text_encoder", revision=revision, torch_dtype=dtype)
+        tokenizer = tokenizer or AutoTokenizer.from_pretrained(pretrained_model, subfolder="tokenizer", revision=revision, use_fast=False)
+        return dict(denoiser=denoiser, TE=TE, vae=vae, noise_sampler=noise_sampler, tokenizer=tokenizer)
+class DiffusersSDXLFormat(CkptFormat):
+    def load_ckpt(self, pretrained_model: str, map_location="cpu", denoiser=None, TE=None, vae: AutoencoderKL = None, noise_sampler=None,
+                  tokenizer=None, revision=None, dtype=torch.float32, **kwargs):
+        denoiser = denoiser or UNet2DConditionModel.from_pretrained(
+            pretrained_model, subfolder="unet", revision=revision, torch_dtype=dtype
+        )
+        vae = vae or AutoencoderKL.from_pretrained(pretrained_model, subfolder="vae", revision=revision, torch_dtype=dtype)
+        noise_sampler = noise_sampler or DDPMSampler(DDPMDiscreteSigmaScheduler())
+        TE = TE or SDXLTextEncoder.from_pretrained(pretrained_model, subfolder="text_encoder", revision=revision, torch_dtype=dtype)
+        tokenizer = tokenizer or SDXLTokenizer.from_pretrained(pretrained_model, subfolder="tokenizer", revision=revision, use_fast=False)
+        return dict(denoiser=denoiser, TE=TE, vae=vae, noise_sampler=noise_sampler, tokenizer=tokenizer)
+class DiffusersPixArtFormat(CkptFormat):
+    def load_ckpt(self, pretrained_model: str, map_location="cpu", denoiser=None, TE=None, vae: AutoencoderKL = None, noise_sampler=None,
+                  tokenizer=None, revision=None, dtype=torch.float32, **kwargs):
+        denoiser = denoiser or PixArtTransformer2DModel.from_pretrained(
+            pretrained_model, subfolder="transformer", revision=revision, torch_dtype=dtype
+        )
+        vae = vae or AutoencoderKL.from_pretrained(pretrained_model, subfolder="vae", revision=revision, torch_dtype=dtype)
+        noise_sampler = noise_sampler or DDPMSampler(DDPMDiscreteSigmaScheduler())
+        TE = TE or T5EncoderModel.from_pretrained(pretrained_model, subfolder="text_encoder", revision=revision, torch_dtype=dtype)
+        tokenizer = tokenizer or AutoTokenizer.from_pretrained(pretrained_model, subfolder="tokenizer", revision=revision, use_fast=False)
+        return dict(denoiser=denoiser, TE=TE, vae=vae, noise_sampler=noise_sampler, tokenizer=tokenizer)

hcpdiff/ckpt_manager/format/emb.py ADDED Viewed

@@ -0,0 +1,21 @@
+from typing import Tuple
+import torch
+from rainbowneko.ckpt_manager.format import CkptFormat
+from torch.serialization import FILE_LIKE
+class EmbFormat(CkptFormat):
+    EXT = 'pt'
+    def save_ckpt(self, sd_model: Tuple[str, torch.Tensor], save_f: FILE_LIKE):
+        name, emb = sd_model
+        torch.save({'string_to_param':{'*':emb}, 'name':name}, save_f)
+    def load_ckpt(self, ckpt_f: FILE_LIKE, map_location="cpu"):
+        state = torch.load(ckpt_f, map_location=map_location)
+        if 'string_to_param' in state:
+            emb = state['string_to_param']['*']
+        else:
+            emb = state['emb_params']
+        emb.requires_grad_(False)
+        return emb

hcpdiff/ckpt_manager/format/lora_webui.py ADDED Viewed

@@ -0,0 +1,252 @@
+import math
+import re
+from typing import List, Dict, Any
+from rainbowneko.ckpt_manager.format import CkptFormat, SafeTensorFormat
+from torch.serialization import FILE_LIKE
+class LoraConverter:
+    com_name_unet = ['down_blocks', 'up_blocks', 'mid_block', 'transformer_blocks', 'to_q', 'to_k', 'to_v', 'to_out', 'proj_in', 'proj_out',
+        'input_blocks', 'middle_block', 'output_blocks']
+    com_name_TE = ['self_attn', 'q_proj', 'v_proj', 'k_proj', 'out_proj', 'text_model']
+    prefix_unet = 'lora_unet_'
+    prefix_TE = 'lora_te_'
+    prefix_TE_xl_clip_L = 'lora_te1_'
+    prefix_TE_xl_clip_bigG = 'lora_te2_'
+    lora_w_map = {'lora_down.weight':'W_down', 'lora_up.weight':'W_up'}
+    def __init__(self):
+        self.com_name_unet_tmp = [x.replace('_', '%') for x in self.com_name_unet]
+        self.com_name_TE_tmp = [x.replace('_', '%') for x in self.com_name_TE]
+    def convert_from_webui(self, state, auto_scale_alpha=False, sdxl=False):
+        if not sdxl:
+            sd_unet = self.convert_from_webui_(state, prefix=self.prefix_unet, com_name=self.com_name_unet, com_name_tmp=self.com_name_unet_tmp)
+            sd_TE = self.convert_from_webui_(state, prefix=self.prefix_TE, com_name=self.com_name_TE, com_name_tmp=self.com_name_TE_tmp)
+        else:
+            sd_unet = self.convert_from_webui_xl_unet_(state, prefix=self.prefix_unet, com_name=self.com_name_unet,
+                                                       com_name_tmp=self.com_name_unet_tmp)
+            sd_TE = self.convert_from_webui_xl_te_(state, prefix=self.prefix_TE_xl_clip_L, com_name=self.com_name_TE,
+                                                   com_name_tmp=self.com_name_TE_tmp)
+            sd_TE2 = self.convert_from_webui_xl_te_(state, prefix=self.prefix_TE_xl_clip_bigG, com_name=self.com_name_TE,
+                                                    com_name_tmp=self.com_name_TE_tmp)
+            sd_TE.update(sd_TE2)
+        if auto_scale_alpha:
+            sd_unet = self.alpha_scale_from_webui(sd_unet)
+            sd_TE = self.alpha_scale_from_webui(sd_TE)
+        sd = {
+            **{f'denoiser.{k}':v for k,v in sd_unet.items()},
+            **{f'TE.{k}':v for k,v in sd_TE.items()},
+        }
+        return {'base': sd}
+    def convert_to_webui(self, sd_unet, sd_TE, auto_scale_alpha=False, sdxl=False):
+        sd_unet = self.convert_to_webui_(sd_unet, prefix=self.prefix_unet)
+        if sdxl:
+            sd_TE = self.convert_to_webui_xl_(sd_TE, prefix=self.prefix_TE)
+        else:
+            sd_TE = self.convert_to_webui_(sd_TE, prefix=self.prefix_TE)
+        sd_unet.update(sd_TE)
+        if auto_scale_alpha:
+            sd_unet = self.alpha_scale_to_webui(sd_unet)
+        return sd_unet
+    def convert_from_webui_(self, state, prefix, com_name, com_name_tmp):
+        state = {k:v for k, v in state.items() if k.startswith(prefix)}
+        prefix_len = len(prefix)
+        sd_covert = {}
+        for k, v in state.items():
+            model_k, lora_k = k[prefix_len:].split('.', 1)
+            model_k = self.replace_all(model_k, com_name, com_name_tmp).replace('_', '.').replace('%', '_')
+            if lora_k == 'alpha':
+                sd_covert[f'{model_k}.___.{lora_k}'] = v
+            else:
+                sd_covert[f'{model_k}.___.layer.{self.lora_w_map[lora_k]}'] = v
+        return sd_covert
+    def convert_to_webui_(self, state, prefix):
+        sd_covert = {}
+        for k, v in state.items():
+            if k.endswith('W_down'):
+                model_k, _ = k.split('.___.', 1)
+                lora_k = 'lora_down.weight'
+            elif k.endswith('W_up'):
+                model_k, _ = k.split('.___.', 1)
+                lora_k = 'lora_up.weight'
+            else:
+                model_k, lora_k = k.split('.___.', 1)
+            sd_covert[f"{prefix}{model_k.replace('.', '_')}.{lora_k}"] = v
+        return sd_covert
+    def convert_to_webui_xl_(self, state, prefix):
+        sd_convert = {}
+        for k, v in state.items():
+            if k.endswith('W_down'):
+                model_k, _ = k.split('.___.', 1)
+                lora_k = 'lora_down.weight'
+            elif k.endswith('W_up'):
+                model_k, _ = k.split('.___.', 1)
+                lora_k = 'lora_up.weight'
+            else:
+                model_k, lora_k = k.split('.___.', 1)
+            new_k = f"{prefix}{model_k.replace('.', '_')}.{lora_k}"
+            if 'clip' in new_k:
+                new_k = new_k.replace('_clip_L', '1') if 'clip_L' in new_k else new_k.replace('_clip_bigG', '2')
+            sd_convert[new_k] = v
+        return sd_convert
+    def convert_from_webui_xl_te_(self, state, prefix, com_name, com_name_tmp):
+        state = {k:v for k, v in state.items() if k.startswith(prefix)}
+        sd_covert = {}
+        prefix_len = len(prefix)
+        for k, v in state.items():
+            model_k, lora_k = k[prefix_len:].split('.', 1)
+            model_k = self.replace_all(model_k, com_name, com_name_tmp).replace('_', '.').replace('%', '_')
+            if prefix == 'lora_te1_':
+                model_k = f'clip_L.{model_k}'
+            else:
+                model_k = f'clip_bigG.{model_k}'
+            if lora_k == 'alpha':
+                sd_covert[f'{model_k}.___.{lora_k}'] = v
+            else:
+                sd_covert[f'{model_k}.___.layer.{self.lora_w_map[lora_k]}'] = v
+        return sd_covert
+    def convert_from_webui_xl_unet_(self, state, prefix, com_name, com_name_tmp):
+        # Down:
+        # 4 -> 1, 0  4 = 1 + 3 * 1 + 0
+        # 5 -> 1, 1  5 = 1 + 3 * 1 + 1
+        # 7 -> 2, 0  7 = 1 + 3 * 2 + 0
+        # 8 -> 2, 1  8 = 1 + 3 * 2 + 1
+        # Up
+        # 0 -> 0, 0  0 = 0 * 3 + 0
+        # 1 -> 0, 1  1 = 0 * 3 + 1
+        # 2 -> 0, 2  2 = 0 * 3 + 2
+        # 3 -> 1, 0  3 = 1 * 3 + 0
+        # 4 -> 1, 1  4 = 1 * 3 + 1
+        # 5 -> 1, 2  5 = 1 * 3 + 2
+        down = {
+            '4':[1, 0],
+            '5':[1, 1],
+            '7':[2, 0],
+            '8':[2, 1],
+        }
+        up = {
+            '0':[0, 0],
+            '1':[0, 1],
+            '2':[0, 2],
+            '3':[1, 0],
+            '4':[1, 1],
+            '5':[1, 2],
+        }
+        m = []
+        def match(key, regex_text):
+            regex = re.compile(regex_text)
+            r = re.match(regex, key)
+            if not r:
+                return False
+            m.clear()
+            m.extend(r.groups())
+            return True
+        state = {k:v for k, v in state.items() if k.startswith(prefix)}
+        sd_covert = {}
+        prefix_len = len(prefix)
+        for k, v in state.items():
+            model_k, lora_k = k[prefix_len:].split('.', 1)
+            model_k = self.replace_all(model_k, com_name, com_name_tmp).replace('_', '.').replace('%', '_')
+            if match(model_k, r'input_blocks.(\d+).1.(.+)'):
+                new_k = f'down_blocks.{down[m[0]][0]}.attentions.{down[m[0]][1]}.{m[1]}'
+            elif match(model_k, r'middle_block.1.(.+)'):
+                new_k = f'mid_block.attentions.0.{m[0]}'
+                pass
+            elif match(model_k, r'output_blocks.(\d+).(\d+).(.+)'):
+                new_k = f'up_blocks.{up[m[0]][0]}.attentions.{up[m[0]][1]}.{m[2]}'
+            else:
+                raise NotImplementedError
+            if lora_k == 'alpha':
+                sd_covert[f'{new_k}.___.{lora_k}'] = v
+            else:
+                sd_covert[f'{new_k}.___.layer.{self.lora_w_map[lora_k]}'] = v
+        return sd_covert
+    @staticmethod
+    def replace_all(data: str, srcs: List[str], dsts: List[str]):
+        for src, dst in zip(srcs, dsts):
+            data = data.replace(src, dst)
+        return data
+    @staticmethod
+    def alpha_scale_from_webui(state):
+        # Apply to "lora_down" and "lora_up" respectively to prevent overflow
+        for k, v in state.items():
+            if 'W_up' in k:
+                state[k] = v*math.sqrt(v.shape[1])
+            elif 'W_down' in k:
+                state[k] = v*math.sqrt(v.shape[0])
+        return state
+    @staticmethod
+    def alpha_scale_to_webui(state):
+        for k, v in state.items():
+            if 'lora_up' in k:
+                state[k] = v*math.sqrt(v.shape[1])
+            elif 'lora_down' in k:
+                state[k] = v*math.sqrt(v.shape[0])
+        return state
+class LoraWebuiFormat(CkptFormat):
+    def __init__(self, format=None, auto_scale_alpha=False):
+        self.converter = LoraConverter()
+        self.auto_scale_alpha = auto_scale_alpha
+        if format is None:
+            format = SafeTensorFormat()
+        self.format = format
+    def save_ckpt(self, sd_model: Dict[str, Any], save_f: FILE_LIKE):
+        sd_denoiser = {k.removeprefix('denoiser.'):v for k, v in sd_model['base'].items() if k.startswith('denoiser.')}
+        sd_TE = {k.removeprefix('TE.'):v for k, v in sd_model['base'].items() if k.startswith('TE.')}
+        if len(sd_denoiser)>0 or len(sd_TE)>0:
+            sdxl = False
+            for k in sd_TE.keys():
+                if 'clip_L' in k or 'clip_bigG' in k:
+                    sdxl = True
+                    break
+            sd_webui = self.converter.convert_to_webui(sd_denoiser, sd_TE, auto_scale_alpha=self.auto_scale_alpha, sdxl=sdxl)
+        else:
+            sd_webui = self.converter.convert_to_webui(sd_model['base'], {}, auto_scale_alpha=self.auto_scale_alpha)
+        self.format.save_ckpt(sd_webui, save_f)
+    def load_ckpt(self, ckpt_f: str, map_location="cpu", **kwargs):
+        sd_webui = self.format.load_ckpt(ckpt_f, map_location=map_location, **kwargs)
+        sdxl = False
+        for k in sd_webui.keys():
+            if ('lora_te1_' in k or 'lora_te2_' in k or
+                    re.match(r'input_blocks.(\d+).1.(.+)', k) or
+                    re.match(r'middle_block.1.(.+)', k) or
+                    re.match(r'output_blocks.(\d+).(\d+).(.+)', k)):
+                sdxl = True
+                break
+        sd_all = self.converter.convert_from_webui(sd_webui, auto_scale_alpha=self.auto_scale_alpha, sdxl=sdxl)
+        return sd_all

hcpdiff/ckpt_manager/format/sd_single.py ADDED Viewed

@@ -0,0 +1,41 @@
+import torch
+from diffusers import AutoencoderKL, StableDiffusionPipeline, StableDiffusionXLPipeline
+from rainbowneko.ckpt_manager.format import CkptFormat
+from hcpdiff.diffusion.sampler import DDPMSampler, DDPMDiscreteSigmaScheduler
+from hcpdiff.models.compose import SDXLTextEncoder, SDXLTokenizer
+class OfficialSD15Format(CkptFormat):
+    # Single file format
+    def load_ckpt(self, pretrained_model: str, map_location="cpu", denoiser=None, TE=None, vae: AutoencoderKL = None, noise_sampler=None,
+                  tokenizer=None, revision=None, dtype=torch.float32, **kwargs):
+        pipe_args = dict(unet=denoiser, vae=vae, text_encoder=TE, tokenizer=tokenizer)
+        pipe_args = {k:v for k,v in pipe_args.items() if v is not None}
+        pipe = StableDiffusionPipeline.from_single_file(
+            pretrained_model, revision=revision, torch_dtype=dtype, **pipe_args
+        )
+        noise_sampler = noise_sampler or DDPMSampler(DDPMDiscreteSigmaScheduler())
+        return dict(denoiser=pipe.unet, TE=pipe.text_encoder, vae=pipe.vae, noise_sampler=noise_sampler, tokenizer=pipe.tokenizer)
+class OfficialSDXLFormat(CkptFormat):
+    # Single file format
+    def load_ckpt(self, pretrained_model: str, map_location="cpu", denoiser=None, TE=None, vae: AutoencoderKL = None, noise_sampler=None,
+                  tokenizer=None, revision=None, dtype=torch.float32, **kwargs):
+        pipe_args = dict(unet=denoiser, vae=vae)
+        if TE is not None:
+            pipe_args['text_encoder'] = TE.clip_L
+            pipe_args['text_encoder_2'] = TE.clip_bigG
+        if tokenizer is not None:
+            pipe_args['tokenizer'] = tokenizer.clip_L
+            pipe_args['tokenizer_2'] = tokenizer.clip_bigG
+        pipe_args = {k:v for k,v in pipe_args.items() if v is not None}
+        pipe = StableDiffusionXLPipeline.from_single_file(
+            pretrained_model, revision=revision, torch_dtype=dtype, **pipe_args
+        )
+        noise_sampler = noise_sampler or DDPMSampler(DDPMDiscreteSigmaScheduler())
+        TE = SDXLTextEncoder([('clip_L', pipe.text_encoder), ('clip_bigG', pipe.text_encoder_2)])
+        tokenizer = SDXLTokenizer([('clip_L', pipe.tokenizer), ('clip_bigG', pipe.tokenizer_2)])
+        return dict(denoiser=pipe.unet, TE=TE, vae=pipe.vae, noise_sampler=noise_sampler, tokenizer=tokenizer)

hcpdiff/ckpt_manager/loader.py ADDED Viewed

@@ -0,0 +1,64 @@
+from hcpdiff.models.lora_layers_patch import LoraLayer
+from torch import nn
+from hcpdiff.utils.net_utils import split_module_name
+from rainbowneko.ckpt_manager import NekoPluginLoader, LocalCkptSource, CkptFormat
+from rainbowneko.ckpt_manager.locator import get_match_layers
+from rainbowneko.models.plugin import PluginGroup
+def get_lora_rank_and_cls(lora_state):
+    if 'layer.W_down' in lora_state:
+        rank = lora_state['layer.W_down'].shape[0]
+        return LoraLayer, rank
+    else:
+        raise ValueError('Unknown lora format.')
+class HCPLoraLoader(NekoPluginLoader):
+    def __init__(self, format: CkptFormat=None, source: LocalCkptSource=None, path: str = None, layers='all', target_plugin=None,
+                 state_prefix=None, base_model_alpha=0.0, load_ema=False, module_to_load='', **plugin_kwargs):
+        super().__init__(format, source, path=path, layers=layers, target_plugin=target_plugin, state_prefix=state_prefix,
+                         base_model_alpha=base_model_alpha, load_ema=load_ema, **plugin_kwargs)
+        self.module_to_load = module_to_load
+    def load_to(self, name, model):
+        # get model to load plugin and its named_modules
+        model = model if self.module_to_load == '' else eval(f"model.{self.module_to_load}")
+        named_modules = {k:v for k, v in model.named_modules()}
+        plugin_state = self.load(self.path, map_location='cpu')['base_ema' if self.load_ema else 'base']
+        # filter layers to load
+        if self.layers != 'all':
+            match_blocks = get_match_layers(self.layers, named_modules)
+            plugin_state = {k: v for blk in match_blocks for k, v in plugin_state.items() if k.startswith(blk)}
+        if self.state_prefix:
+            state_prefix_len = len(self.state_prefix)
+            plugin_state = {k[state_prefix_len:]: v for k, v in plugin_state.items() if k.startswith(self.state_prefix)}
+        lora_block_state = {}
+        # get all layers in the lora_state
+        for pname, p in plugin_state.items():
+            # lora_block. is the old format
+            prefix, block_name = pname.split('.___.', 1)
+            if prefix not in lora_block_state:
+                lora_block_state[prefix] = {}
+            lora_block_state[prefix][block_name] = p
+        # add lora to host and load weights
+        lora_blocks = {}
+        for layer_name, lora_state in lora_block_state.items():
+            lora_layer_cls, rank = get_lora_rank_and_cls(lora_state)
+            if 'alpha' in lora_state:
+                lora_state['alpha'] *= self.plugin_kwargs.get('alpha', 1.0)
+            parent_name, host_name = split_module_name(layer_name)
+            lora_block = lora_layer_cls.wrap_layer(name, named_modules[layer_name], rank=rank, bias='layer.bias' in lora_state,
+                                                parent_block=named_modules[parent_name], host_name=host_name)
+            lora_block.set_hyper_params(**self.plugin_kwargs)
+            lora_blocks[layer_name] = lora_block
+            load_info = lora_block.load_state_dict(lora_state, strict=False)
+            if len(load_info.unexpected_keys) > 0:
+                print(name, 'unexpected_keys', load_info.unexpected_keys)
+        return PluginGroup(lora_blocks)

hcpdiff/data/__init__.py CHANGED Viewed

@@ -1,28 +1,4 @@
-from .pair_dataset import TextImagePairDataset
-from .cond_dataset import TextImageCondPairDataset
-from .crop_info_dataset import CropInfoPairDataset
-from .bucket import BaseBucket, FixedBucket, RatioBucket, SizeBucket, RatioSizeBucket, LongEdgeBucket
-from .utils import CycleData
-from .caption_loader import JsonCaptionLoader, TXTCaptionLoader
-from .sampler import DistributedCycleSampler, get_sampler
-class DataGroup:
-    def __init__(self, loader_list, loss_weights):
-        self.loader_list = loader_list
-        self.loss_weights = loss_weights
-    def __iter__(self):
-        self.data_iter_list = [iter(CycleData(loader)) for loader in self.loader_list]
-        return self
-    def __next__(self):
-        return [next(data_iter) for data_iter in self.data_iter_list]
-    def __len__(self):
-        return len(self.loader_list)
-    def get_dataset(self, idx):
-        return self.loader_list[idx].dataset
-    def get_loss_weights(self, idx):
-        return self.loss_weights[idx]
+from .dataset import TextImagePairDataset
+from .source import Text2ImageSource, Text2ImageLossMapSource, Text2ImageCondSource, T2IFolderClassSource, TextSource
+from .handler import StableDiffusionHandler, LossMapHandler, DiffusionImageHandler, DiffusionTextHandler
+from .cache import VaeCache

hcpdiff/data/cache/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ from .vae import VaeCache

hcpdiff/data/cache/vae.py ADDED Viewed

@@ -0,0 +1,102 @@
+from io import BytesIO
+from pathlib import Path
+from typing import Dict, Any
+import lmdb
+import torch
+from hcpdiff.models.wrapper import SD15Wrapper
+from rainbowneko import _share
+from rainbowneko.data import DataCache, CacheableDataset
+from rainbowneko.utils import Path_Like
+from torch.utils.data import DataLoader
+from torch.utils.data.distributed import DistributedSampler
+from tqdm import tqdm
+class VaeCache(DataCache):
+    def __init__(self, pre_build: Path_Like = None, lazy=False, bs=1):
+        super().__init__(pre_build)
+        self.lazy = lazy
+        self.bs = bs
+    def load_latent(self, id):
+        if self.lazy:
+            with self.env.begin() as txn:
+                byte_tensor = txn.get(str(id).encode())
+                return torch.load(BytesIO(byte_tensor))
+        else:
+            return self.cache[id]
+    def before_handler(self, index: int, data: Dict[str, Any]):
+        cached_data = self.load_latent(data['id'])
+        data['image'] = cached_data['latent']
+        data['coord'] = cached_data['coord']
+        return data
+    def on_finish(self, index, data):
+        return data
+    def load(self, path):
+        if self.lazy:
+            self.env = lmdb.open(path, subdir=False, readonly=True, lock=False, readahead=False, meminit=False)
+            return {}
+        elif len(self.cache)>0:
+            return self.cache
+        else:
+            env = lmdb.open(path, subdir=False, readonly=True, lock=False, readahead=False, meminit=False)
+            with env.begin() as txn:
+                cache = {k.decode():torch.load(BytesIO(v)) for k, v in txn.cursor()}
+            env.close()
+            return cache
+    def build(self, dataset: CacheableDataset, model: SD15Wrapper, all_gather):
+        if (self.pre_build and Path(self.pre_build).exists()) or len(self.cache)>0:
+            model.vae = None
+            return
+        vae = model.vae.to(_share.device)
+        with dataset.disable_cache():
+            dataset.bucket.rest(0)
+            loader = DataLoader(
+                dataset,
+                batch_size=self.bs,
+                num_workers=0,
+                sampler=DistributedSampler(dataset, num_replicas=_share.world_size, rank=_share.local_rank, shuffle=False),
+                collate_fn=dataset.collate_fn,
+                drop_last=False,
+            )
+            if self.pre_build:
+                Path(self.pre_build).parent.mkdir(parents=True, exist_ok=True)
+                env = lmdb.open(self.pre_build, map_size=1099511627776)
+                with env.begin(write=True) as txn:
+                    for data in tqdm(loader):
+                        image = data['image'].to(device=_share.device, dtype=vae.dtype)
+                        latents = model.vae.encode(image).latent_dist.sample()
+                        latents = (latents*vae.config.scaling_factor).cpu()
+                        for img_id, latent, coord in zip(data['id'], latents, data['coord']):
+                            data_cache = {'latent': latent, 'coord': coord}
+                            byte_stream = BytesIO()
+                            torch.save(data_cache, byte_stream)
+                            txn.put(str(img_id).encode(), byte_stream.getvalue())
+                            if not self.lazy:
+                                self.cache[img_id] = data_cache
+                env.close()
+            else:
+                for data in tqdm(loader):
+                    img_id = data['id']
+                    image = data['image'].to(device=_share.device, dtype=vae.dtype)
+                    latents = model.vae.encode(image).latent_dist.sample()
+                    latents = (latents*vae.config.scaling_factor).cpu()
+                    for img_id, latent, coord in zip(data['id'], latents, data['coord']):
+                        self.cache[img_id] = {'latent': latent, 'coord': coord}
+        model.vae.to('cpu')
+        #model.vae = None
+        torch.cuda.empty_cache()
+        cache_all = all_gather(self.cache)
+        for cache in cache_all:
+            self.cache.update(cache)

hcpdiff/data/dataset.py ADDED Viewed

@@ -0,0 +1,20 @@
+"""
+pair_dataset.py
+====================
+    :Name:        text-image pair dataset
+    :Author:      Dong Ziyi
+    :Affiliation: HCP Lab, SYSU
+    :Created:     10/03/2023
+    :Licence:     Apache-2.0
+"""
+from typing import Union, Dict
+from rainbowneko.data import CacheableDataset, BaseDataset, BaseBucket, DataSource, DataHandler, DataCache
+def TextImagePairDataset(bucket: BaseBucket = None, source: Dict[str, DataSource] = None, handler: DataHandler = None,
+                         batch_handler: DataHandler = None, cache: DataCache = None, **kwargs) -> Union[CacheableDataset, BaseDataset]:
+    if cache is None:
+        return BaseDataset(bucket=bucket, source=source, handler=handler, batch_handler=batch_handler, **kwargs)
+    else:
+        return CacheableDataset(bucket=bucket, source=source, handler=handler, batch_handler=batch_handler, cache=cache, **kwargs)

hcpdiff/data/handler/__init__.py ADDED Viewed

@@ -0,0 +1,3 @@
+from .diffusion import StableDiffusionHandler, DiffusionImageHandler, LossMapHandler, DiffusionTextHandler
+from .text import TokenizeHandler, TagEraseHandler, TagDropoutHandler, TagShuffleHandler, TemplateFillHandler
+from .controlnet import ControlNetHandler

hcpdiff 0.9.1__py3-none-any.whl → 2.2__py3-none-any.whl

hcpdiff 0.9.1py3-none-any.whl → 2.2py3-none-any.whl