PyPI - hcpdiff - Versions diffs - 0.9.0__py3-none-any.whl → 2.1__py3-none-any.whl - Mend

hcpdiff 0.9.0py3-none-any.whl → 2.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (208) hide show

hcpdiff/__init__.py +4 -4
hcpdiff/ckpt_manager/__init__.py +4 -5
hcpdiff/ckpt_manager/ckpt.py +24 -0
hcpdiff/ckpt_manager/format/__init__.py +4 -0
hcpdiff/ckpt_manager/format/diffusers.py +59 -0
hcpdiff/ckpt_manager/format/emb.py +21 -0
hcpdiff/ckpt_manager/format/lora_webui.py +244 -0
hcpdiff/ckpt_manager/format/sd_single.py +41 -0
hcpdiff/ckpt_manager/loader.py +64 -0
hcpdiff/data/__init__.py +4 -28
hcpdiff/data/cache/__init__.py +1 -0
hcpdiff/data/cache/vae.py +102 -0
hcpdiff/data/dataset.py +20 -0
hcpdiff/data/handler/__init__.py +3 -0
hcpdiff/data/handler/controlnet.py +18 -0
hcpdiff/data/handler/diffusion.py +80 -0
hcpdiff/data/handler/text.py +111 -0
hcpdiff/data/source/__init__.py +1 -2
hcpdiff/data/source/folder_class.py +12 -29
hcpdiff/data/source/text2img.py +36 -74
hcpdiff/data/source/text2img_cond.py +9 -15
hcpdiff/diffusion/__init__.py +0 -0
hcpdiff/diffusion/noise/__init__.py +2 -0
hcpdiff/diffusion/noise/pyramid_noise.py +42 -0
hcpdiff/diffusion/noise/zero_terminal.py +39 -0
hcpdiff/diffusion/sampler/__init__.py +5 -0
hcpdiff/diffusion/sampler/base.py +72 -0
hcpdiff/diffusion/sampler/ddpm.py +20 -0
hcpdiff/diffusion/sampler/diffusers.py +66 -0
hcpdiff/diffusion/sampler/edm.py +22 -0
hcpdiff/diffusion/sampler/sigma_scheduler/__init__.py +3 -0
hcpdiff/diffusion/sampler/sigma_scheduler/base.py +14 -0
hcpdiff/diffusion/sampler/sigma_scheduler/ddpm.py +197 -0
hcpdiff/diffusion/sampler/sigma_scheduler/edm.py +48 -0
hcpdiff/easy/__init__.py +2 -0
hcpdiff/easy/cfg/__init__.py +3 -0
hcpdiff/easy/cfg/sd15_train.py +201 -0
hcpdiff/easy/cfg/sdxl_train.py +140 -0
hcpdiff/easy/cfg/t2i.py +177 -0
hcpdiff/easy/model/__init__.py +2 -0
hcpdiff/easy/model/cnet.py +31 -0
hcpdiff/easy/model/loader.py +79 -0
hcpdiff/easy/sampler.py +46 -0
hcpdiff/evaluate/__init__.py +1 -0
hcpdiff/evaluate/previewer.py +60 -0
hcpdiff/loss/__init__.py +4 -1
hcpdiff/loss/base.py +41 -0
hcpdiff/loss/gw.py +35 -0
hcpdiff/loss/ssim.py +37 -0
hcpdiff/loss/vlb.py +79 -0
hcpdiff/loss/weighting.py +66 -0
hcpdiff/models/__init__.py +2 -2
hcpdiff/models/cfg_context.py +17 -14
hcpdiff/models/compose/compose_hook.py +44 -23
hcpdiff/models/compose/compose_tokenizer.py +21 -8
hcpdiff/models/compose/sdxl_composer.py +4 -4
hcpdiff/models/container.py +1 -1
hcpdiff/models/controlnet.py +16 -16
hcpdiff/models/lora_base_patch.py +14 -25
hcpdiff/models/lora_layers.py +3 -9
hcpdiff/models/lora_layers_patch.py +14 -24
hcpdiff/models/text_emb_ex.py +84 -6
hcpdiff/models/textencoder_ex.py +54 -18
hcpdiff/models/wrapper/__init__.py +3 -0
hcpdiff/models/wrapper/pixart.py +19 -0
hcpdiff/models/wrapper/sd.py +218 -0
hcpdiff/models/wrapper/utils.py +20 -0
hcpdiff/parser/__init__.py +1 -0
hcpdiff/parser/embpt.py +32 -0
hcpdiff/tools/convert_caption_txt2json.py +1 -1
hcpdiff/tools/dataset_generator.py +94 -0
hcpdiff/tools/download_hf_model.py +24 -0
hcpdiff/tools/embedding_convert.py +6 -2
hcpdiff/tools/init_proj.py +3 -21
hcpdiff/tools/lora_convert.py +19 -15
hcpdiff/tools/save_model.py +12 -0
hcpdiff/tools/sd2diffusers.py +1 -1
hcpdiff/train_colo.py +1 -1
hcpdiff/train_deepspeed.py +1 -1
hcpdiff/trainer_ac.py +79 -0
hcpdiff/trainer_ac_single.py +31 -0
hcpdiff/utils/__init__.py +0 -2
hcpdiff/utils/inpaint_pipe.py +790 -0
hcpdiff/utils/net_utils.py +29 -6
hcpdiff/utils/pipe_hook.py +46 -33
hcpdiff/utils/utils.py +21 -4
hcpdiff/workflow/__init__.py +15 -10
hcpdiff/workflow/daam/__init__.py +1 -0
hcpdiff/workflow/daam/act.py +66 -0
hcpdiff/workflow/daam/hook.py +109 -0
hcpdiff/workflow/diffusion.py +128 -136
hcpdiff/workflow/fast.py +31 -0
hcpdiff/workflow/flow.py +67 -0
hcpdiff/workflow/io.py +36 -68
hcpdiff/workflow/model.py +46 -43
hcpdiff/workflow/text.py +84 -52
hcpdiff/workflow/utils.py +32 -12
hcpdiff/workflow/vae.py +37 -38
hcpdiff-2.1.dist-info/METADATA +285 -0
hcpdiff-2.1.dist-info/RECORD +114 -0
{hcpdiff-0.9.0.dist-info → hcpdiff-2.1.dist-info}/WHEEL +1 -1
hcpdiff-2.1.dist-info/entry_points.txt +5 -0
hcpdiff/ckpt_manager/base.py +0 -16
hcpdiff/ckpt_manager/ckpt_diffusers.py +0 -45
hcpdiff/ckpt_manager/ckpt_pkl.py +0 -138
hcpdiff/ckpt_manager/ckpt_safetensor.py +0 -60
hcpdiff/ckpt_manager/ckpt_webui.py +0 -54
hcpdiff/data/bucket.py +0 -358
hcpdiff/data/caption_loader.py +0 -80
hcpdiff/data/cond_dataset.py +0 -40
hcpdiff/data/crop_info_dataset.py +0 -40
hcpdiff/data/data_processor.py +0 -33
hcpdiff/data/pair_dataset.py +0 -146
hcpdiff/data/sampler.py +0 -54
hcpdiff/data/source/base.py +0 -30
hcpdiff/data/utils.py +0 -80
hcpdiff/infer_workflow.py +0 -57
hcpdiff/loggers/__init__.py +0 -13
hcpdiff/loggers/base_logger.py +0 -76
hcpdiff/loggers/cli_logger.py +0 -40
hcpdiff/loggers/preview/__init__.py +0 -1
hcpdiff/loggers/preview/image_previewer.py +0 -149
hcpdiff/loggers/tensorboard_logger.py +0 -30
hcpdiff/loggers/wandb_logger.py +0 -31
hcpdiff/loggers/webui_logger.py +0 -9
hcpdiff/loss/min_snr_loss.py +0 -52
hcpdiff/models/layers.py +0 -81
hcpdiff/models/plugin.py +0 -348
hcpdiff/models/wrapper.py +0 -75
hcpdiff/noise/__init__.py +0 -3
hcpdiff/noise/noise_base.py +0 -16
hcpdiff/noise/pyramid_noise.py +0 -50
hcpdiff/noise/zero_terminal.py +0 -44
hcpdiff/train_ac.py +0 -565
hcpdiff/train_ac_single.py +0 -39
hcpdiff/utils/caption_tools.py +0 -105
hcpdiff/utils/cfg_net_tools.py +0 -321
hcpdiff/utils/cfg_resolvers.py +0 -16
hcpdiff/utils/ema.py +0 -52
hcpdiff/utils/img_size_tool.py +0 -248
hcpdiff/vis/__init__.py +0 -3
hcpdiff/vis/base_interface.py +0 -12
hcpdiff/vis/disk_interface.py +0 -48
hcpdiff/vis/webui_interface.py +0 -17
hcpdiff/visualizer.py +0 -258
hcpdiff/visualizer_reloadable.py +0 -237
hcpdiff/workflow/base.py +0 -59
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/anime/text2img_anime.yaml +0 -21
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/anime/text2img_anime_lora.yaml +0 -58
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/change_vae.yaml +0 -6
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/euler_a.yaml +0 -8
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/img2img.yaml +0 -10
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/img2img_controlnet.yaml +0 -19
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/inpaint.yaml +0 -11
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/load_lora.yaml +0 -26
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/load_unet_part.yaml +0 -18
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/offload_2GB.yaml +0 -6
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/save_model.yaml +0 -44
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/text2img.yaml +0 -53
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/text2img_DA++.yaml +0 -34
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/infer/text2img_sdxl.yaml +0 -9
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/plugins/plugin_controlnet.yaml +0 -17
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/te_struct.txt +0 -193
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/dataset/base_dataset.yaml +0 -29
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/dataset/regularization_dataset.yaml +0 -31
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/CustomDiffusion.yaml +0 -74
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/DreamArtist++.yaml +0 -135
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/DreamArtist.yaml +0 -45
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/DreamBooth.yaml +0 -62
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/FT_sdxl.yaml +0 -33
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/Lion_optimizer.yaml +0 -17
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/TextualInversion.yaml +0 -41
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/add_logger_tensorboard_wandb.yaml +0 -15
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/controlnet.yaml +0 -53
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/ema.yaml +0 -10
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/fine-tuning.yaml +0 -53
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/locon.yaml +0 -24
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/lora_anime_character.yaml +0 -77
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/lora_conventional.yaml +0 -56
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/lora_sdxl.yaml +0 -41
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/min_snr.yaml +0 -7
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples/preview_in_training.yaml +0 -6
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples_noob/DreamBooth.yaml +0 -70
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples_noob/TextualInversion.yaml +0 -45
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples_noob/fine-tuning.yaml +0 -45
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/examples_noob/lora.yaml +0 -63
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/train_base.yaml +0 -81
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/train/tuning_base.yaml +0 -42
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/unet_struct.txt +0 -932
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/workflow/highres_fix_latent.yaml +0 -86
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/workflow/highres_fix_pixel.yaml +0 -99
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/workflow/text2img.yaml +0 -57
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/workflow/text2img_lora.yaml +0 -70
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/zero2.json +0 -32
hcpdiff-0.9.0.data/data/hcpdiff/cfgs/zero3.json +0 -39
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/caption.txt +0 -1
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/name.txt +0 -1
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/name_2pt_caption.txt +0 -1
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/name_caption.txt +0 -1
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/object.txt +0 -27
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/object_caption.txt +0 -27
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/style.txt +0 -19
hcpdiff-0.9.0.data/data/hcpdiff/prompt_tuning_template/style_caption.txt +0 -19
hcpdiff-0.9.0.dist-info/METADATA +0 -199
hcpdiff-0.9.0.dist-info/RECORD +0 -155
hcpdiff-0.9.0.dist-info/entry_points.txt +0 -2
{hcpdiff-0.9.0.dist-info → hcpdiff-2.1.dist-info/licenses}/LICENSE +0 -0
{hcpdiff-0.9.0.dist-info → hcpdiff-2.1.dist-info}/top_level.txt +0 -0

hcpdiff/utils/img_size_tool.py DELETED Viewed

@@ -1,248 +0,0 @@
-"""
-img_size_tool.py
-====================
-    :Name:        get_image_size
-    :Purpose:     extract image dimensions given a file path
-    :Author:      Paulo Scardine (based on code from Emmanuel VAÏSSE)
-                  Dong Ziyi, add webp support
-    :Created:     26/09/2013
-    :Modified:    02/03/2023
-    :Copyright:   (c) Paulo Scardine 2013
-    :Licence:     MIT
-"""
-import collections
-import os
-import io
-import struct
-from PIL import Image
-FILE_UNKNOWN = "Sorry, don't know how to get size for this file."
-class UnknownImageFormat(Exception):
-    pass
-types_support = ['bmp', 'gif', 'ico', 'jpeg', 'jpg', 'png', 'tiff', 'webp']
-def get_image_size(file_path):
-    """
-    Return (width, height) for a given img file content - no external
-    dependencies except the os and struct builtin modules
-    """
-    width, height = get_image_metadata(file_path)
-    return width, height
-def get_image_size_from_bytesio(input, size):
-    """
-    Return (width, height) for a given img file content - no external
-    dependencies except the os and struct builtin modules
-    Args:
-        input (io.IOBase): io object support read & seek
-        size (int): size of buffer in byte
-    """
-    width, height = get_image_metadata_from_bytesio(input, size)
-    return width, height
-def get_image_metadata(file_path):
-    """
-    Return an `Image` object for a given img file content - no external
-    dependencies except the os and struct builtin modules
-    Args:
-        file_path (str): path to an image file
-    Returns:
-        (width, height)
-    """
-    size = os.path.getsize(file_path)
-    # be explicit with open arguments - we need binary mode
-    with io.open(file_path, "rb") as input:
-        return get_image_metadata_from_bytesio(input, size, file_path)
-def get_image_metadata_from_bytesio(input, size, file_path=None):
-    """
-    Return an `Image` object for a given img file content - no external
-    dependencies except the os and struct builtin modules
-    Args:
-        input (io.IOBase): io object support read & seek
-        size (int): size of buffer in byte
-        file_path (str): path to an image file
-    Returns:
-        (width, height)
-    """
-    height = -1
-    width = -1
-    data = input.read(30)
-    msg = " raised while trying to decode as JPEG."
-    if (size >= 10) and data[:6] in (b'GIF87a', b'GIF89a'):
-        # GIFs
-        #imgtype = GIF
-        w, h = struct.unpack("<HH", data[6:10])
-        width = int(w)
-        height = int(h)
-    elif (size >= 24) and data[8:12] == b'WEBP':
-        # WEBPs
-        #imgtype = WEBP
-        if data[15]==b'X': #VP8X
-            w = int.from_bytes(data[24:27], 'little')+1
-            h = int.from_bytes(data[27:30], 'little')+1
-        elif data[15]==b' ': #VP8
-            w, h = struct.unpack("<HH", data[0x1A:0x1E])
-        else:
-            w, h = Image.open(file_path).size
-        width = int(w)
-        height = int(h)
-    elif ((size >= 24) and data.startswith(b'\211PNG\r\n\032\n')
-            and (data[12:16] == b'IHDR')):
-        # PNGs
-        #imgtype = PNG
-        w, h = struct.unpack(">LL", data[16:24])
-        width = int(w)
-        height = int(h)
-    elif (size >= 16) and data.startswith(b'\211PNG\r\n\032\n'):
-        # older PNGs
-        #imgtype = PNG
-        w, h = struct.unpack(">LL", data[8:16])
-        width = int(w)
-        height = int(h)
-    elif (size >= 2) and data.startswith(b'\377\330'):
-        # JPEG
-        #imgtype = JPEG
-        input.seek(0)
-        input.read(2)
-        b = input.read(1)
-        try:
-            while (b and ord(b) != 0xDA):
-                while (ord(b) != 0xFF):
-                    b = input.read(1)
-                while (ord(b) == 0xFF):
-                    b = input.read(1)
-                if (ord(b) >= 0xC0 and ord(b) <= 0xC3):
-                    input.read(3)
-                    h, w = struct.unpack(">HH", input.read(4))
-                    break
-                else:
-                    input.read(
-                        int(struct.unpack(">H", input.read(2))[0]) - 2)
-                b = input.read(1)
-            width = int(w)
-            height = int(h)
-        except struct.error:
-            raise UnknownImageFormat("StructError" + msg)
-        except ValueError:
-            raise UnknownImageFormat("ValueError" + msg)
-        except Exception as e:
-            raise UnknownImageFormat(e.__class__.__name__ + msg)
-    elif (size >= 26) and data.startswith(b'BM'):
-        # BMP
-        #imgtype = BMP
-        headersize = struct.unpack("<I", data[14:18])[0]
-        if headersize == 12:
-            w, h = struct.unpack("<HH", data[18:22])
-            width = int(w)
-            height = int(h)
-        elif headersize >= 40:
-            w, h = struct.unpack("<ii", data[18:26])
-            width = int(w)
-            # as h is negative when stored upside down
-            height = abs(int(h))
-        else:
-            raise UnknownImageFormat(
-                "Unkown DIB header size:" +
-                str(headersize))
-    elif (size >= 8) and data[:4] in (b"II\052\000", b"MM\000\052"):
-        # Standard TIFF, big- or little-endian
-        # BigTIFF and other different but TIFF-like formats are not
-        # supported currently
-        #imgtype = TIFF
-        byteOrder = data[:2]
-        boChar = ">" if byteOrder == "MM" else "<"
-        # maps TIFF type id to size (in bytes)
-        # and python format char for struct
-        tiffTypes = {
-            1: (1, boChar + "B"),  # BYTE
-            2: (1, boChar + "c"),  # ASCII
-            3: (2, boChar + "H"),  # SHORT
-            4: (4, boChar + "L"),  # LONG
-            5: (8, boChar + "LL"),  # RATIONAL
-            6: (1, boChar + "b"),  # SBYTE
-            7: (1, boChar + "c"),  # UNDEFINED
-            8: (2, boChar + "h"),  # SSHORT
-            9: (4, boChar + "l"),  # SLONG
-            10: (8, boChar + "ll"),  # SRATIONAL
-            11: (4, boChar + "f"),  # FLOAT
-            12: (8, boChar + "d")   # DOUBLE
-        }
-        ifdOffset = struct.unpack(boChar + "L", data[4:8])[0]
-        try:
-            countSize = 2
-            input.seek(ifdOffset)
-            ec = input.read(countSize)
-            ifdEntryCount = struct.unpack(boChar + "H", ec)[0]
-            # 2 bytes: TagId + 2 bytes: type + 4 bytes: count of values + 4
-            # bytes: value offset
-            ifdEntrySize = 12
-            for i in range(ifdEntryCount):
-                entryOffset = ifdOffset + countSize + i * ifdEntrySize
-                input.seek(entryOffset)
-                tag = input.read(2)
-                tag = struct.unpack(boChar + "H", tag)[0]
-                if(tag == 256 or tag == 257):
-                    # if type indicates that value fits into 4 bytes, value
-                    # offset is not an offset but value itself
-                    type = input.read(2)
-                    type = struct.unpack(boChar + "H", type)[0]
-                    if type not in tiffTypes:
-                        raise UnknownImageFormat(
-                            "Unkown TIFF field type:" +
-                            str(type))
-                    typeSize = tiffTypes[type][0]
-                    typeChar = tiffTypes[type][1]
-                    input.seek(entryOffset + 8)
-                    value = input.read(typeSize)
-                    value = int(struct.unpack(typeChar, value)[0])
-                    if tag == 256:
-                        width = value
-                    else:
-                        height = value
-                if width > -1 and height > -1:
-                    break
-        except Exception as e:
-            raise UnknownImageFormat(str(e))
-    elif size >= 2:
-            # see http://en.wikipedia.org/wiki/ICO_(file_format)
-        #imgtype = 'ICO'
-        input.seek(0)
-        reserved = input.read(2)
-        if 0 != struct.unpack("<H", reserved)[0]:
-            raise UnknownImageFormat(FILE_UNKNOWN)
-        format = input.read(2)
-        assert 1 == struct.unpack("<H", format)[0]
-        num = input.read(2)
-        num = struct.unpack("<H", num)[0]
-        if num > 1:
-            import warnings
-            warnings.warn("ICO File contains more than one image")
-        # http://msdn.microsoft.com/en-us/library/ms997538.aspx
-        w = input.read(1)
-        h = input.read(1)
-        width = ord(w)
-        height = ord(h)
-    else:
-        raise UnknownImageFormat(FILE_UNKNOWN)
-    return width, height

hcpdiff/vis/__init__.py DELETED Viewed

@@ -1,3 +0,0 @@
-from .base_interface import BaseInterface
-from .disk_interface import DiskInterface
-from .webui_interface import WebUIInterface

hcpdiff/vis/base_interface.py DELETED Viewed

@@ -1,12 +0,0 @@
-class BaseInterface:
-    need_inter_imgs = False
-    def __init__(self, show_steps=0):
-        self.show_steps = show_steps
-    def on_inter_step(self, i, num_steps, t, latents, images):
-        pass
-    def on_infer_finish(self, images, prompt, negative_prompt, save_cfg=False, seeds=None):
-        pass

hcpdiff/vis/disk_interface.py DELETED Viewed

@@ -1,48 +0,0 @@
-import os
-from hcpdiff.utils.img_size_tool import types_support
-from hcpdiff.utils.utils import to_validate_file
-from omegaconf import OmegaConf
-from .base_interface import BaseInterface
-class DiskInterface(BaseInterface):
-    def __init__(self, save_root, save_cfg=True, image_type='png', quality=95, show_steps=0):
-        super(DiskInterface, self).__init__(show_steps=show_steps)
-        os.makedirs(save_root, exist_ok=True)
-        self.save_root = save_root
-        self.save_cfg = save_cfg
-        self.image_type = image_type
-        self.quality = quality
-        self.inter_imgs = []
-        if show_steps>0:
-            self.need_inter_imgs = True
-    def on_inter_step(self, i, num_steps, t, latents, images):
-        if len(self.inter_imgs) == 0:
-            for _ in range(len(images)):
-                self.inter_imgs.append([])
-        for u, img in enumerate(images):
-            self.inter_imgs[u].append(img)
-    def on_save_one(self, num_img_exist, img_path):
-        pass
-    def on_infer_finish(self, images, prompt, negative_prompt, cfgs_raw=None, seeds=None):
-        num_img_exist = max([0]+[int(x.split('-', 1)[0]) for x in os.listdir(self.save_root) if x.rsplit('.', 1)[-1] in types_support])+1
-        for bid, (p, pn, img) in enumerate(zip(prompt, negative_prompt, images)):
-            img_path = os.path.join(self.save_root, f"{num_img_exist}-{seeds[bid]}-{to_validate_file(prompt[0])}.{self.image_type}")
-            img.save(img_path, quality=self.quality)
-            self.on_save_one(num_img_exist, img_path)
-            if self.save_cfg and cfgs_raw is not None:
-                with open(os.path.join(self.save_root, f"{num_img_exist}-{seeds[bid]}-info.yaml"), 'w', encoding='utf-8') as f:
-                    cfgs_raw.seed = seeds[bid]
-                    f.write(OmegaConf.to_yaml(cfgs_raw))
-            if self.need_inter_imgs:
-                inter = self.inter_imgs[bid]
-                inter[0].save(os.path.join(self.save_root, f'{num_img_exist}-{seeds[bid]}-steps.webp'), "webp", save_all=True,
-                              append_images=inter[1:], duration=100)
-            num_img_exist += 1

hcpdiff/vis/webui_interface.py DELETED Viewed

@@ -1,17 +0,0 @@
-from .disk_interface import DiskInterface
-from loguru import logger
-class WebUIInterface(DiskInterface):
-    def __init__(self, save_root, image_type='png', quality=95, show_steps=1, show_inter=False):
-        super(WebUIInterface, self).__init__(save_root, image_type, quality, show_steps)
-        self.show_inter = show_inter
-        self.need_inter_imgs = self.need_inter_imgs and show_inter
-    def on_inter_step(self, i, num_steps, t, latents, images):
-        if self.show_inter:
-            super(WebUIInterface, self).on_inter_step(i, num_steps, t, latents, images)
-        logger.info(f'\nthis progress steps: {i}/{num_steps}')
-    def on_save_one(self, num_img_exist, img_path):
-        logger.info(f'this images output path: {img_path}')

hcpdiff/visualizer.py DELETED Viewed

@@ -1,258 +0,0 @@
-import argparse
-import os
-import random
-from typing import List
-import hydra
-import torch
-from PIL import Image
-from accelerate import infer_auto_device_map, dispatch_model
-from diffusers.utils.import_utils import is_xformers_available
-from hcpdiff.models import TokenizerHook, LoraBlock
-from hcpdiff.models.compose import ComposeTEEXHook, ComposeEmbPTHook, ComposeTextEncoder
-from hcpdiff.utils.cfg_net_tools import HCPModelLoader, make_plugin
-from hcpdiff.utils.net_utils import to_cpu, to_cuda, auto_tokenizer, auto_text_encoder
-from hcpdiff.utils.pipe_hook import HookPipe_T2I, HookPipe_I2I, HookPipe_Inpaint
-from hcpdiff.utils.utils import load_config_with_cli, load_config, size_to_int, int_to_size, prepare_seed, is_list, pad_attn_bias
-from omegaconf import OmegaConf
-from torch.cuda.amp import autocast
-class Visualizer:
-    dtype_dict = {'fp32':torch.float32, 'fp16':torch.float16, 'bf16':torch.bfloat16}
-    def __init__(self, cfgs):
-        self.cfgs_raw = cfgs
-        self.cfgs = hydra.utils.instantiate(self.cfgs_raw)
-        self.cfg_merge = self.cfgs.merge
-        self.offload = 'offload' in self.cfgs and self.cfgs.offload is not None
-        self.dtype = self.dtype_dict[self.cfgs.dtype]
-        self.need_inter_imgs = any(item.need_inter_imgs for item in self.cfgs.interface)
-        self.pipe = self.load_model(self.cfgs.pretrained_model)
-        if self.cfg_merge:
-            self.merge_model()
-        self.pipe = self.pipe.to(torch_dtype=self.dtype)
-        if isinstance(self.pipe.text_encoder, ComposeTextEncoder):
-            self.pipe.vae = self.pipe.vae.to(dtype=torch.float32)
-        if 'save_model' in self.cfgs and self.cfgs.save_model is not None:
-            self.save_model(self.cfgs.save_model)
-            os._exit(0)
-        self.build_optimize()
-    def load_model(self, pretrained_model):
-        pipeline = self.get_pipeline()
-        te = auto_text_encoder(pretrained_model, subfolder="text_encoder", torch_dtype=self.dtype, resume_download=True)
-        tokenizer = auto_tokenizer(pretrained_model, subfolder="tokenizer", use_fast=False)
-        return pipeline.from_pretrained(pretrained_model, safety_checker=None, requires_safety_checker=False,
-                                        text_encoder=te, tokenizer=tokenizer, resume_download=True,
-                                        torch_dtype=self.dtype, **self.cfgs.new_components)
-    def build_optimize(self):
-        if self.offload:
-            self.build_offload(self.cfgs.offload)
-        else:
-            self.pipe.unet.to('cuda')
-        self.build_vae_offload()
-        if getattr(self.cfgs, 'vae_optimize', None) is not None:
-            if self.cfgs.vae_optimize.tiling:
-                self.pipe.vae.enable_tiling()
-            if self.cfgs.vae_optimize.slicing:
-                self.pipe.vae.enable_slicing()
-        self.emb_hook, _ = ComposeEmbPTHook.hook_from_dir(self.cfgs.emb_dir, self.pipe.tokenizer, self.pipe.text_encoder,
-                                                          N_repeats=self.cfgs.N_repeats)
-        self.te_hook = ComposeTEEXHook.hook_pipe(self.pipe, N_repeats=self.cfgs.N_repeats, clip_skip=self.cfgs.clip_skip,
-                                                 clip_final_norm=self.cfgs.clip_final_norm, use_attention_mask=self.cfgs.encoder_attention_mask)
-        self.token_ex = TokenizerHook(self.pipe.tokenizer)
-        if is_xformers_available():
-            self.pipe.unet.enable_xformers_memory_efficient_attention()
-            # self.te_hook.enable_xformers()
-    def save_model(self, save_cfg):
-        for k, v in self.pipe.unet.named_modules():
-            if isinstance(v, LoraBlock):
-                v.reparameterization_to_host()
-                v.remove()
-        for k, v in self.pipe.text_encoder.named_modules():
-            if isinstance(v, LoraBlock):
-                v.reparameterization_to_host()
-                v.remove()
-        if save_cfg.path.endswith('.ckpt'):
-            from hcpdiff.tools.diffusers2sd import save_state_dict
-            save_state_dict(save_cfg.path, self.pipe.unet.state_dict(), self.pipe.vae.state_dict(), self.pipe.text_encoder.state_dict(),
-                            use_safetensors=save_cfg.to_safetensors)
-        else:
-            self.pipe.save_pretrained(save_cfg.path, safe_serialization=save_cfg.to_safetensors)
-    def get_pipeline(self):
-        if self.cfgs.condition is None:
-            pipe_cls = HookPipe_T2I
-        else:
-            if self.cfgs.condition.type == 'i2i':
-                pipe_cls = HookPipe_I2I
-            elif self.cfgs.condition.type == 'inpaint':
-                pipe_cls = HookPipe_Inpaint
-            else:
-                raise NotImplementedError(f'No condition type named {self.cfgs.condition.type}')
-        return pipe_cls
-    def build_offload(self, offload_cfg):
-        vram = size_to_int(offload_cfg.max_VRAM)
-        device_map = infer_auto_device_map(self.pipe.unet, max_memory={0:int_to_size(vram >> 1), "cpu":offload_cfg.max_RAM}, dtype=self.dtype)
-        self.pipe.unet = dispatch_model(self.pipe.unet, device_map)
-        if not offload_cfg.vae_cpu:
-            device_map = infer_auto_device_map(self.pipe.vae, max_memory={0:int_to_size(vram >> 5), "cpu":offload_cfg.max_RAM}, dtype=self.dtype)
-            self.pipe.vae = dispatch_model(self.pipe.vae, device_map)
-    def build_vae_offload(self):
-        def vae_decode_offload(latents, return_dict=True, decode_raw=self.pipe.vae.decode):
-            if self.need_inter_imgs:
-                to_cuda(self.pipe.vae)
-                res = decode_raw(latents, return_dict=return_dict)
-            else:
-                to_cpu(self.pipe.unet)
-                if self.offload and self.cfgs.offload.vae_cpu:
-                    self.pipe.vae.to(dtype=torch.float32)
-                    res = decode_raw(latents.cpu().to(dtype=torch.float32), return_dict=return_dict)
-                else:
-                    to_cuda(self.pipe.vae)
-                    res = decode_raw(latents.to(dtype=self.pipe.vae.dtype), return_dict=return_dict)
-                to_cpu(self.pipe.vae)
-                to_cuda(self.pipe.unet)
-            return res
-        self.pipe.vae.decode = vae_decode_offload
-        def vae_encode_offload(x, return_dict=True, encode_raw=self.pipe.vae.encode):
-            to_cuda(self.pipe.vae)
-            res = encode_raw(x.to(dtype=self.pipe.vae.dtype), return_dict=return_dict)
-            to_cpu(self.pipe.vae)
-            return res
-        self.pipe.vae.encode = vae_encode_offload
-    def merge_model(self):
-        if 'plugin_cfg' in self.cfg_merge:  # Build plugins
-            if isinstance(self.cfg_merge.plugin_cfg, str):
-                plugin_cfg = load_config(self.cfg_merge.plugin_cfg)
-                plugin_cfg = {'plugin_unet': hydra.utils.instantiate(plugin_cfg['plugin_unet']),
-                              'plugin_TE': hydra.utils.instantiate(plugin_cfg['plugin_TE'])}
-            else:
-                plugin_cfg = self.cfg_merge.plugin_cfg
-            make_plugin(self.pipe.unet, plugin_cfg['plugin_unet'])
-            make_plugin(self.pipe.text_encoder, plugin_cfg['plugin_TE'])
-        load_ema = self.cfg_merge.get('load_ema', False)
-        for cfg_group in self.cfg_merge.values():
-            if hasattr(cfg_group, 'type'):
-                if cfg_group.type == 'unet':
-                    HCPModelLoader(self.pipe.unet).load_all(cfg_group, load_ema=load_ema)
-                elif cfg_group.type == 'TE':
-                    HCPModelLoader(self.pipe.text_encoder).load_all(cfg_group, load_ema=load_ema)
-    def set_scheduler(self, scheduler):
-        self.pipe.scheduler = scheduler
-    def get_ex_input(self):
-        ex_input_dict, pipe_input_dict = {}, {}
-        if self.cfgs.condition is not None:
-            if self.cfgs.condition.type == 'i2i':
-                pipe_input_dict['image'] = Image.open(self.cfgs.condition.image).convert('RGB')
-            elif self.cfgs.condition.type == 'inpaint':
-                pipe_input_dict['image'] = Image.open(self.cfgs.condition.image).convert('RGB')
-                pipe_input_dict['mask_image'] = Image.open(self.cfgs.condition.mask).convert('L')
-        if getattr(self.cfgs, 'ex_input', None) is not None:
-            for key, processor in self.cfgs.ex_input.items():
-                ex_input_dict[key] = processor(self.cfgs.infer_args.width, self.cfgs.infer_args.height, self.cfgs.bs*2, 'cuda', self.dtype)
-        return ex_input_dict, pipe_input_dict
-    @torch.no_grad()
-    def vis_images(self, prompt, negative_prompt='', seeds: List[int] = None, **kwargs):
-        G = prepare_seed(seeds or [None]*len(prompt))
-        ex_input_dict, pipe_input_dict = self.get_ex_input()
-        kwargs.update(pipe_input_dict)
-        to_cuda(self.pipe.text_encoder)
-        mult_p, clean_text_p = self.token_ex.parse_attn_mult(prompt)
-        mult_n, clean_text_n = self.token_ex.parse_attn_mult(negative_prompt)
-        with autocast(enabled=self.cfgs.amp, dtype=self.dtype):
-            emb, pooled_output, attention_mask = self.te_hook.encode_prompt_to_emb(clean_text_n+clean_text_p)
-            if self.cfgs.encoder_attention_mask:
-                emb, attention_mask = pad_attn_bias(emb, attention_mask)
-            else:
-                attention_mask = None
-            emb_n, emb_p = emb.chunk(2)
-            emb_p = self.te_hook.mult_attn(emb_p, mult_p)
-            emb_n = self.te_hook.mult_attn(emb_n, mult_n)
-            to_cpu(self.pipe.text_encoder)
-            to_cuda(self.pipe.unet)
-            if hasattr(self.pipe.unet, 'input_feeder'):
-                for feeder in self.pipe.unet.input_feeder:
-                    feeder(ex_input_dict)
-            images = self.pipe(prompt_embeds=emb_p, negative_prompt_embeds=emb_n, callback=self.inter_callback, generator=G,
-                               pooled_output=pooled_output[-1], encoder_attention_mask=attention_mask, **kwargs).images
-        return images
-    def inter_callback(self, i, t, num_t, latents):
-        images = None
-        interrupt = False
-        for interface in self.cfgs.interface:
-            if interface.show_steps>0 and i%interface.show_steps == 0:
-                if self.need_inter_imgs and images is None:
-                    images = self.pipe.decode_latents(latents)
-                    images = self.pipe.numpy_to_pil(images)
-                feed_back = interface.on_inter_step(i, num_t, t, latents, images)
-                interrupt |= bool(feed_back)
-        return interrupt
-    def save_images(self, images, prompt, negative_prompt='', seeds: List[int] = None):
-        for interface in self.cfgs.interface:
-            interface.on_infer_finish(images, prompt, negative_prompt, self.cfgs_raw, seeds=seeds)
-    def vis_to_dir(self, prompt, negative_prompt='', seeds: List[int] = None, **kwargs):
-        seeds = [s or random.randint(0, 1 << 30) for s in seeds]
-        images = self.vis_images(prompt, negative_prompt, seeds=seeds, **kwargs)
-        self.save_images(images, prompt, negative_prompt, seeds=seeds)
-if __name__ == '__main__':
-    parser = argparse.ArgumentParser(description='Stable Diffusion Training')
-    parser.add_argument('--cfg', type=str, default='')
-    args, cfg_args = parser.parse_known_args()
-    cfgs = load_config_with_cli(args.cfg, args_list=cfg_args)  # skip --cfg
-    if cfgs.seed is not None:
-        if is_list(cfgs.seed):
-            assert len(cfgs.seed) == cfgs.num*cfgs.bs, 'seed list length should be equal to num*bs'
-            seeds = list(cfgs.seed)
-        else:
-            seeds = list(range(cfgs.seed, cfgs.seed+cfgs.num*cfgs.bs))
-    else:
-        seeds = [None]*(cfgs.num*cfgs.bs)
-    viser = Visualizer(cfgs)
-    for i in range(cfgs.num):
-        prompt = cfgs.prompt[i*cfgs.bs:(i+1)*cfgs.bs] if is_list(cfgs.prompt) else [cfgs.prompt]*cfgs.bs
-        negative_prompt = cfgs.neg_prompt[i*cfgs.bs:(i+1)*cfgs.bs] if is_list(cfgs.neg_prompt) else [cfgs.neg_prompt]*cfgs.bs
-        viser.vis_to_dir(prompt=prompt, negative_prompt=negative_prompt,
-                         seeds=seeds[i*cfgs.bs:(i+1)*cfgs.bs], save_cfg=cfgs.save.save_cfg, **cfgs.infer_args)

hcpdiff 0.9.0__py3-none-any.whl → 2.1__py3-none-any.whl

hcpdiff 0.9.0py3-none-any.whl → 2.1py3-none-any.whl