PyPI - hcpdiff - Versions diffs - 2.1__py3-none-any.whl → 2.2__py3-none-any.whl - Mend

hcpdiff 2.1py3-none-any.whl → 2.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (20) hide show

hcpdiff/ckpt_manager/__init__.py +1 -1
hcpdiff/ckpt_manager/format/lora_webui.py +13 -5
hcpdiff/data/__init__.py +2 -2
hcpdiff/data/handler/__init__.py +1 -1
hcpdiff/data/handler/diffusion.py +17 -7
hcpdiff/data/source/__init__.py +2 -1
hcpdiff/data/source/text.py +40 -0
hcpdiff/data/source/text2img.py +1 -1
hcpdiff/easy/cfg/__init__.py +1 -1
hcpdiff/easy/cfg/sd15_train.py +10 -4
hcpdiff/easy/cfg/sdxl_train.py +11 -4
hcpdiff/easy/cfg/t2i.py +64 -13
hcpdiff/workflow/diffusion.py +6 -5
hcpdiff/workflow/text.py +6 -25
{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/METADATA +15 -1
{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/RECORD +20 -19
{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/WHEEL +0 -0
{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/entry_points.txt +0 -0
{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/licenses/LICENSE +0 -0
{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/top_level.txt +0 -0

hcpdiff/ckpt_manager/__init__.py CHANGED Viewed

@@ -1,4 +1,4 @@
 from .format import EmbFormat, DiffusersSD15Format, DiffusersModelFormat, DiffusersSDXLFormat, DiffusersPixArtFormat, OfficialSDXLFormat, \
-    OfficialSD15Format
+    OfficialSD15Format, LoraWebuiFormat
 from .ckpt import EmbSaver, easy_emb_saver
 from .loader import HCPLoraLoader

hcpdiff/ckpt_manager/format/lora_webui.py CHANGED Viewed

@@ -2,7 +2,7 @@ import math
 import re
 from typing import List, Dict, Any
-from rainbowneko.ckpt_manager.format import CkptFormat
+from rainbowneko.ckpt_manager.format import CkptFormat, SafeTensorFormat
 from torch.serialization import FILE_LIKE
 class LoraConverter:
@@ -36,7 +36,12 @@ class LoraConverter:
         if auto_scale_alpha:
             sd_unet = self.alpha_scale_from_webui(sd_unet)
             sd_TE = self.alpha_scale_from_webui(sd_TE)
-        return {'plugin':sd_TE}, {'plugin':sd_unet}
+        sd = {
+            **{f'denoiser.{k}':v for k,v in sd_unet.items()},
+            **{f'TE.{k}':v for k,v in sd_TE.items()},
+        }
+        return {'base': sd}
     def convert_to_webui(self, sd_unet, sd_TE, auto_scale_alpha=False, sdxl=False):
         sd_unet = self.convert_to_webui_(sd_unet, prefix=self.prefix_unet)
@@ -207,9 +212,12 @@ class LoraConverter:
         return state
 class LoraWebuiFormat(CkptFormat):
-    def __init__(self, format, auto_scale_alpha=False):
+    def __init__(self, format=None, auto_scale_alpha=False):
         self.converter = LoraConverter()
         self.auto_scale_alpha = auto_scale_alpha
+        if format is None:
+            format = SafeTensorFormat()
         self.format = format
     def save_ckpt(self, sd_model: Dict[str, Any], save_f: FILE_LIKE):
@@ -240,5 +248,5 @@ class LoraWebuiFormat(CkptFormat):
                 sdxl = True
                 break
-        sd_TE, sd_unet = self.converter.convert_from_webui(sd_webui, auto_scale_alpha=self.auto_scale_alpha, sdxl=sdxl)
-        return sd_TE, sd_unet
+        sd_all = self.converter.convert_from_webui(sd_webui, auto_scale_alpha=self.auto_scale_alpha, sdxl=sdxl)
+        return sd_all

hcpdiff/data/__init__.py CHANGED Viewed

@@ -1,4 +1,4 @@
 from .dataset import TextImagePairDataset
-from .source import Text2ImageSource, Text2ImageLossMapSource, Text2ImageCondSource, T2IFolderClassSource
-from .handler import StableDiffusionHandler, LossMapHandler, DiffusionImageHandler
+from .source import Text2ImageSource, Text2ImageLossMapSource, Text2ImageCondSource, T2IFolderClassSource, TextSource
+from .handler import StableDiffusionHandler, LossMapHandler, DiffusionImageHandler, DiffusionTextHandler
 from .cache import VaeCache

hcpdiff/data/handler/__init__.py CHANGED Viewed

@@ -1,3 +1,3 @@
-from .diffusion import StableDiffusionHandler, DiffusionImageHandler, LossMapHandler
+from .diffusion import StableDiffusionHandler, DiffusionImageHandler, LossMapHandler, DiffusionTextHandler
 from .text import TokenizeHandler, TagEraseHandler, TagDropoutHandler, TagShuffleHandler, TemplateFillHandler
 from .controlnet import ControlNetHandler

hcpdiff/data/handler/diffusion.py CHANGED Viewed

@@ -49,14 +49,11 @@ class DiffusionImageHandler(DataHandler):
         else:
             return self.handlers(dict(image=image, image_size=image_size))
-class StableDiffusionHandler(DataHandler):
-    def __init__(self, bucket, encoder_attention_mask=False, key_map_in=('image -> image', 'image_size -> image_size', 'prompt -> prompt'),
-                 key_map_out=('image -> image', 'coord -> coord', 'prompt -> prompt'),
-                 erase=0.15, dropout=0.0, shuffle=0.0, word_names={}, tokenize=True):
+class DiffusionTextHandler(DataHandler):
+    def __init__(self, encoder_attention_mask=False, erase=0.0, dropout=0.0, shuffle=0.0, word_names={}, tokenize=True,
+                 key_map_in=('prompt -> prompt', ), key_map_out=('prompt -> prompt', )):
         super().__init__(key_map_in, key_map_out)
-        self.image_handlers = DiffusionImageHandler(bucket)
         text_handlers = {}
         if dropout>0:
             text_handlers['dropout'] = TagDropoutHandler(p=dropout)
@@ -67,7 +64,20 @@ class StableDiffusionHandler(DataHandler):
         text_handlers['fill'] = TemplateFillHandler(word_names)
         if tokenize:
             text_handlers['tokenize'] = TokenizeHandler(encoder_attention_mask)
-        self.text_handlers = HandlerChain(**text_handlers)
+        self.handlers = HandlerChain(**text_handlers)
+    def handle(self, prompt: Union[str, Dict[str, str]]):
+        return self.handlers(dict(prompt=prompt))
+class StableDiffusionHandler(DataHandler):
+    def __init__(self, bucket, encoder_attention_mask=False, key_map_in=('image -> image', 'image_size -> image_size', 'prompt -> prompt'),
+                 key_map_out=('image -> image', 'coord -> coord', 'prompt -> prompt'),
+                 erase=0.0, dropout=0.0, shuffle=0.0, word_names={}, tokenize=True):
+        super().__init__(key_map_in, key_map_out)
+        self.image_handlers = DiffusionImageHandler(bucket)
+        self.text_handlers = DiffusionTextHandler(encoder_attention_mask=encoder_attention_mask, erase=erase, dropout=dropout, shuffle=shuffle,
+                                                  word_names=word_names, tokenize=tokenize)
     def handle(self, image: Image.Image, image_size: np.ndarray[int], prompt: str):
         return dict(**self.image_handlers(dict(image=image, image_size=image_size)), **self.text_handlers(dict(prompt=prompt)))

hcpdiff/data/source/__init__.py CHANGED Viewed

@@ -1,3 +1,4 @@
 from .text2img import Text2ImageSource, Text2ImageLossMapSource
 from .text2img_cond import Text2ImageCondSource
-from .folder_class import T2IFolderClassSource
+from .folder_class import T2IFolderClassSource
+from .text import TextSource

hcpdiff/data/source/text.py ADDED Viewed

@@ -0,0 +1,40 @@
+from rainbowneko.data import UnLabelSource, DataSource
+from rainbowneko.data.label_loader import BaseLabelLoader, auto_label_loader
+from typing import Union, Dict, Any
+import random
+class TextSource(DataSource):
+    def __init__(self, label_file, prompt_template=None, repeat=1, **kwargs):
+        super().__init__(repeat=repeat)
+        self.label_file = label_file
+        self.label_dict = self._load_label_data(label_file)
+        self.img_ids = self._load_img_ids(self.label_dict)
+        self.prompt_template = self.load_template(prompt_template)
+    def _load_img_ids(self, label_dict):
+        return list(label_dict.keys()) * self.repeat
+    def _load_label_data(self, label_file: Union[str, BaseLabelLoader]):
+        if label_file is None:
+            return {}
+        elif isinstance(label_file, str):
+            return auto_label_loader(label_file).load()
+        else:
+            return label_file.load()
+    def load_template(self, template_file):
+        if template_file is None:
+            return ['{caption}']
+        else:
+            with open(template_file, 'r', encoding='utf-8') as f:
+                return f.read().strip().split('\n')
+    def __getitem__(self, index) -> Dict[str, Any]:
+        img_name = self.img_ids[index]
+        return {
+            'id':img_name,
+            'prompt':{
+                'template':random.choice(self.prompt_template),
+                'caption':self.label_dict[img_name],
+            }
+        }

hcpdiff/data/source/text2img.py CHANGED Viewed

@@ -25,7 +25,7 @@ class Text2ImageSource(ImageLabelSource):
     def __getitem__(self, index) -> Dict[str, Any]:
         img_name = self.img_ids[index]
-        path = os.path.join(self.img_root, img_name)
+        path = self.img_root / img_name
         return {
             'id':img_name,

hcpdiff/easy/cfg/__init__.py CHANGED Viewed

@@ -1,3 +1,3 @@
 from .sd15_train import SD15_lora_train, cfg_data_SD_ARB, cfg_data_SD_resize_crop, SD15_finetuning
 from .sdxl_train import SDXL_lora_train, SDXL_finetuning
-from .t2i import SD15_t2i, SDXL_t2i, SDXL_t2i_lora, SD15_t2i_lora
+from .t2i import SD15_t2i, SDXL_t2i, SDXL_t2i_lora, SD15_t2i_lora, SDXL_t2i_parts, SD15_t2i_parts

hcpdiff/easy/cfg/sd15_train.py CHANGED Viewed

@@ -1,9 +1,10 @@
 import torch
-from rainbowneko.ckpt_manager import ckpt_saver, LAYERS_TRAINABLE, plugin_saver
+from rainbowneko.ckpt_manager import ckpt_saver, LAYERS_TRAINABLE, NekoPluginSaver, SafeTensorFormat
 from rainbowneko.data import RatioBucket, FixedBucket
 from rainbowneko.parser import CfgWDPluginParser, neko_cfg, CfgWDModelParser, disable_neko_cfg
 from rainbowneko.utils import ConstantLR, Path_Like
+from hcpdiff.ckpt_manager import LoraWebuiFormat
 from hcpdiff.data import TextImagePairDataset, Text2ImageSource, StableDiffusionHandler
 from hcpdiff.data import VaeCache
 from hcpdiff.easy import SD15_auto_loader
@@ -69,7 +70,7 @@ def SD15_finetuning(base_model: str, train_steps: int, dataset, save_step: int =
 @neko_cfg
 def SD15_lora_train(base_model: str, train_steps: int, dataset, save_step: int = 200, lr: float = 1e-4, rank: int = 4, alpha: float = None,
                     clip_skip: int = 0, with_conv: bool = False, dtype: str = 'fp16', low_vram: bool = False, warmup_steps: int = 0,
-                    name: str = 'SD15'):
+                    name: str = 'SD15', save_webui_format=False):
     with disable_neko_cfg:
         if alpha is None:
             alpha = rank
@@ -95,6 +96,11 @@ def SD15_lora_train(base_model: str, train_steps: int, dataset, save_step: int =
     else:
         optimizer = torch.optim.AdamW(_partial_=True, betas=(0.9, 0.99))
+    if save_webui_format:
+        lora_format = LoraWebuiFormat()
+    else:
+        lora_format = SafeTensorFormat()
     from cfgs.train.py.examples import SD_FT
     return dict(
@@ -114,8 +120,8 @@ def SD15_lora_train(base_model: str, train_steps: int, dataset, save_step: int =
         ckpt_saver=dict(
             _replace_ = True,
-            lora_unet=plugin_saver(
-                ckpt_type='safetensors',
+            lora_unet=NekoPluginSaver(
+                format=lora_format,
                 target_plugin='lora1',
             )
         ),

hcpdiff/easy/cfg/sdxl_train.py CHANGED Viewed

@@ -1,11 +1,12 @@
 import torch
-from rainbowneko.ckpt_manager import ckpt_saver, plugin_saver, LAYERS_TRAINABLE
+from rainbowneko.ckpt_manager import ckpt_saver, NekoPluginSaver, LAYERS_TRAINABLE, SafeTensorFormat
 from rainbowneko.parser import CfgWDPluginParser, neko_cfg, CfgWDModelParser, disable_neko_cfg
 from rainbowneko.utils import ConstantLR
 from hcpdiff.easy import SDXL_auto_loader
 from hcpdiff.models import SDXLWrapper
 from hcpdiff.models.lora_layers_patch import LoraLayer
+from hcpdiff.ckpt_manager import LoraWebuiFormat
 @neko_cfg
 def SDXL_finetuning(base_model: str, train_steps: int, dataset, save_step: int = 500, lr: float = 1e-5,
@@ -64,7 +65,8 @@ def SDXL_finetuning(base_model: str, train_steps: int, dataset, save_step: int =
 @neko_cfg
 def SDXL_lora_train(base_model: str, train_steps: int, dataset, save_step: int = 200, lr: float = 1e-4, rank: int = 4, alpha: float = None,
-                    with_conv: bool = False, dtype: str = 'fp16', low_vram: bool = False, warmup_steps: int = 0, name: str = 'SD15'):
+                    with_conv: bool = False, dtype: str = 'fp16', low_vram: bool = False, warmup_steps: int = 0, name: str = 'SDXL',
+                    save_webui_format=False):
     with disable_neko_cfg:
         if alpha is None:
             alpha = rank
@@ -90,6 +92,11 @@ def SDXL_lora_train(base_model: str, train_steps: int, dataset, save_step: int =
     else:
         optimizer = torch.optim.AdamW(_partial_=True, betas=(0.9, 0.99))
+    if save_webui_format:
+        lora_format = LoraWebuiFormat()
+    else:
+        lora_format = SafeTensorFormat()
     from cfgs.train.py.examples import SD_FT
     return dict(
@@ -109,8 +116,8 @@ def SDXL_lora_train(base_model: str, train_steps: int, dataset, save_step: int =
         ckpt_saver=dict(
             _replace_ = True,
-            lora_unet=plugin_saver(
-                ckpt_type='safetensors',
+            lora_unet=NekoPluginSaver(
+                format=lora_format,
                 target_plugin='lora1',
             )
         ),

hcpdiff/easy/cfg/t2i.py CHANGED Viewed

@@ -1,5 +1,6 @@
 import torch
 from rainbowneko.infer.workflow import (Actions, PrepareAction, LoopAction, LoadModelAction)
+from rainbowneko.ckpt_manager import NekoModelLoader
 from rainbowneko.parser import neko_cfg, disable_neko_cfg
 from typing import Union, List
@@ -25,6 +26,29 @@ def build_model(pretrained_model='ckpts/any5', noise_sampler=Diffusers_SD.dpmpp_
         ),
     ])
+@neko_cfg
+def load_parts(info: List[str]) -> Actions:
+    acts = []
+    for i, path in enumerate(info):
+        part_unet = LoadModelAction(cfg={
+            f'part_unet_{i}':NekoModelLoader(
+                path=path,
+                state_prefix='denoiser.'
+            )
+        }, key_map_in=('denoiser -> model', 'in_preview -> in_preview'))
+        part_TE = LoadModelAction(cfg={
+            f'part_TE_{i}':NekoModelLoader(
+                path=path,
+                state_prefix='TE.',
+            )
+        }, key_map_in=('TE -> model', 'in_preview -> in_preview'))
+        with disable_neko_cfg:
+            acts.append(part_unet)
+            acts.append(part_TE)
+    return Actions(acts)
 @neko_cfg
 def load_lora(info: List[List]) -> Actions:
     lora_acts = []
@@ -37,7 +61,7 @@ def load_lora(info: List[List]) -> Actions:
             )
         }, key_map_in=('denoiser -> model', 'in_preview -> in_preview'))
         lora_TE = LoadModelAction(cfg={
-            f'lora_unet_{i}':HCPLoraLoader(
+            f'lora_TE_{i}':HCPLoraLoader(
                 path=item[0],
                 state_prefix='TE.',
                 alpha=item[1],
@@ -59,9 +83,9 @@ def optimize_model() -> Actions:
     ])
 @neko_cfg
-def text(prompt, negative_prompt=negative_prompt, bs=4) -> Actions:
+def text(prompt, negative_prompt=negative_prompt, bs=4, N_repeats=1, layer_skip=1) -> Actions:
     return Actions([
-        TextHookAction(N_repeats=1, layer_skip=1),
+        TextHookAction(N_repeats=N_repeats, layer_skip=layer_skip),
         AttnMultTextEncodeAction(
             prompt=prompt,
             negative_prompt=negative_prompt,
@@ -84,9 +108,9 @@ def build_model_SDXL(pretrained_model='ckpts/any5', noise_sampler=Diffusers_SD.d
     ])
 @neko_cfg
-def text_SDXL(prompt, negative_prompt=negative_prompt, bs=4) -> Actions:
+def text_SDXL(prompt, negative_prompt=negative_prompt, bs=4, N_repeats=1, layer_skip=1) -> Actions:
     return Actions([
-        TextHookAction(N_repeats=1, layer_skip=1, TE_final_norm=False),
+        TextHookAction(N_repeats=N_repeats, layer_skip=layer_skip, TE_final_norm=False),
         AttnMultTextEncodeAction(
             prompt=prompt,
             negative_prompt=negative_prompt,
@@ -128,11 +152,24 @@ def resize(width=1024, height=1024):
 @neko_cfg
 def SD15_t2i(pretrained_model, prompt, negative_prompt=negative_prompt, noise_sampler=Diffusers_SD.dpmpp_2m_karras, bs=4, width=512, height=512,
-             seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/'):
+             seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/', N_repeats=1, layer_skip=1):
+    return dict(workflow=Actions(actions=[
+        build_model(pretrained_model=pretrained_model, noise_sampler=noise_sampler),
+        optimize_model(),
+        text(prompt=prompt, negative_prompt=negative_prompt, bs=bs, N_repeats=N_repeats, layer_skip=layer_skip),
+        config_diffusion(width=width, height=height, seed=seed, N_steps=N_steps),
+        diffusion(guidance_scale=guidance_scale),
+        decode(save_root=save_root)
+    ]))
+@neko_cfg
+def SD15_t2i_parts(pretrained_model, parts, prompt, negative_prompt=negative_prompt, noise_sampler=Diffusers_SD.dpmpp_2m_karras, bs=4, width=512, height=512,
+             seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/', N_repeats=1, layer_skip=1):
     return dict(workflow=Actions(actions=[
         build_model(pretrained_model=pretrained_model, noise_sampler=noise_sampler),
+        load_parts(parts),
         optimize_model(),
-        text(prompt=prompt, negative_prompt=negative_prompt, bs=bs),
+        text(prompt=prompt, negative_prompt=negative_prompt, bs=bs, N_repeats=N_repeats, layer_skip=layer_skip),
         config_diffusion(width=width, height=height, seed=seed, N_steps=N_steps),
         diffusion(guidance_scale=guidance_scale),
         decode(save_root=save_root)
@@ -140,12 +177,12 @@ def SD15_t2i(pretrained_model, prompt, negative_prompt=negative_prompt, noise_sa
 @neko_cfg
 def SD15_t2i_lora(pretrained_model, lora_info, prompt, negative_prompt=negative_prompt, noise_sampler=Diffusers_SD.dpmpp_2m_karras, bs=4,
-                  width=512, height=512, seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/'):
+                  width=512, height=512, seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/', N_repeats=1, layer_skip=1):
     return dict(workflow=Actions(actions=[
         build_model(pretrained_model=pretrained_model, noise_sampler=noise_sampler),
         load_lora(info=lora_info),
         optimize_model(),
-        text(prompt=prompt, negative_prompt=negative_prompt, bs=bs),
+        text(prompt=prompt, negative_prompt=negative_prompt, bs=bs, N_repeats=N_repeats, layer_skip=layer_skip),
         config_diffusion(width=width, height=height, seed=seed, N_steps=N_steps),
         diffusion(guidance_scale=guidance_scale),
         decode(save_root=save_root)
@@ -153,24 +190,38 @@ def SD15_t2i_lora(pretrained_model, lora_info, prompt, negative_prompt=negative_
 @neko_cfg
 def SDXL_t2i(pretrained_model, prompt, negative_prompt=negative_prompt, noise_sampler=Diffusers_SD.dpmpp_2m_karras, bs=4, width=1024, height=1024,
-             seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/'):
+             seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/', N_repeats=1, layer_skip=1):
     return dict(workflow=Actions(actions=[
         build_model_SDXL(pretrained_model=pretrained_model, noise_sampler=noise_sampler),
         optimize_model(),
-        text_SDXL(prompt=prompt, negative_prompt=negative_prompt, bs=bs),
+        text_SDXL(prompt=prompt, negative_prompt=negative_prompt, bs=bs, N_repeats=N_repeats, layer_skip=layer_skip),
         config_diffusion(width=width, height=height, seed=seed, N_steps=N_steps),
         diffusion(guidance_scale=guidance_scale),
         decode(save_root=save_root)
     ]))
+@neko_cfg
+def SDXL_t2i_parts(pretrained_model, parts, prompt, negative_prompt=negative_prompt, noise_sampler=Diffusers_SD.dpmpp_2m_karras, bs=4, width=1024, height=1024,
+             seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/', N_repeats=1, layer_skip=1):
+    return dict(workflow=Actions(actions=[
+        build_model_SDXL(pretrained_model=pretrained_model, noise_sampler=noise_sampler),
+        load_parts(parts),
+        optimize_model(),
+        text_SDXL(prompt=prompt, negative_prompt=negative_prompt, bs=bs, N_repeats=N_repeats, layer_skip=layer_skip),
+        config_diffusion(width=width, height=height, seed=seed, N_steps=N_steps),
+        diffusion(guidance_scale=guidance_scale),
+        decode(save_root=save_root)
+    ]))
 @neko_cfg
 def SDXL_t2i_lora(pretrained_model, lora_info, prompt, negative_prompt=negative_prompt, noise_sampler=Diffusers_SD.dpmpp_2m_karras, bs=4,
-                  width=1024, height=1024, seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/'):
+                  width=1024, height=1024, seed=None, N_steps=20, guidance_scale=7.0, save_root='output_pipe/', N_repeats=1, layer_skip=1):
     return dict(workflow=Actions(actions=[
         build_model_SDXL(pretrained_model=pretrained_model, noise_sampler=noise_sampler),
         load_lora(info=lora_info),
         optimize_model(),
-        text_SDXL(prompt=prompt, negative_prompt=negative_prompt, bs=bs),
+        text_SDXL(prompt=prompt, negative_prompt=negative_prompt, bs=bs, N_repeats=N_repeats, layer_skip=layer_skip),
         config_diffusion(width=width, height=height, seed=seed, N_steps=N_steps),
         diffusion(guidance_scale=guidance_scale),
         decode(save_root=save_root)

hcpdiff/workflow/diffusion.py CHANGED Viewed

@@ -32,14 +32,15 @@ class SeedAction(BasicAction):
         self.seed = seed
         self.bs = bs
-    def forward(self, device, gen_step=0, **states):
+    def forward(self, device, seed=None, **states):
         bs = states['prompt_embeds'].shape[0]//2 if 'prompt_embeds' in states else self.bs
-        if self.seed is None:
+        seed = seed or self.seed
+        if seed is None:
             seeds = [None]*bs
-        elif isinstance(self.seed, int):
-            seeds = list(range(self.seed+gen_step*bs, self.seed+(gen_step+1)*bs))
+        elif isinstance(seed, int):
+            seeds = list(range(seed, seed+bs))
         else:
-            seeds = self.seed
+            seeds = seed
         seeds = [s or random.randint(0, 1 << 30) for s in seeds]
         G = prepare_seed(seeds, device=device)

hcpdiff/workflow/text.py CHANGED Viewed

@@ -48,18 +48,9 @@ class TextEncodeAction(BasicAction):
         self.negative_prompt = negative_prompt
         self.bs = bs
-    def forward(self, te_hook, TE, dtype: str, device, amp=None, gen_step=None, prompt_all=None, negative_prompt_all=None, model_offload=False,
-                **states):
-        prompt_all = prompt_all or self.prompt
-        negative_prompt_all = negative_prompt_all or self.negative_prompt
-        if gen_step is not None:
-            idx = (gen_step*self.bs)%len(prompt_all)
-            prompt = prompt_all[idx:idx+self.bs]
-            negative_prompt = negative_prompt_all[idx:idx+self.bs]
-        else:
-            prompt = prompt_all
-            negative_prompt = negative_prompt_all
+    def forward(self, te_hook, TE, dtype: str, device, amp=None, prompt=None, negative_prompt=None, model_offload=False, **states):
+        prompt = prompt or self.prompt
+        negative_prompt = negative_prompt or self.negative_prompt
         if model_offload:
             to_cuda(TE)
@@ -78,19 +69,9 @@ class TextEncodeAction(BasicAction):
             'pooled_output':pooled_output}
 class AttnMultTextEncodeAction(TextEncodeAction):
-    def forward(self, te_hook, token_ex, TE, dtype: str, device, amp=None, gen_step=None, prompt_all=None, negative_prompt_all=None,
-                model_offload=False, **states):
-        prompt_all = prompt_all if prompt_all is not None else self.prompt
-        negative_prompt_all = negative_prompt_all if negative_prompt_all is not None else self.negative_prompt
-        if gen_step is not None:
-            idx = (gen_step*self.bs)%len(prompt_all)
-            prompt = prompt_all[idx:idx+self.bs]
-            negative_prompt = negative_prompt_all[idx:idx+self.bs]
-        else:
-            prompt = prompt_all
-            negative_prompt = negative_prompt_all
+    def forward(self, te_hook, token_ex, TE, dtype: str, device, amp=None, prompt=None, negative_prompt=None, model_offload=False, **states):
+        prompt = prompt or self.prompt
+        negative_prompt = negative_prompt or self.negative_prompt
         if model_offload:
             to_cuda(TE)

{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: hcpdiff
-Version: 2.1
+Version: 2.2
 Summary: A universal Diffusion toolbox
 Home-page: https://github.com/IrisRainbowNeko/HCP-Diffusion
 Author: Ziyi Dong
@@ -65,6 +65,8 @@ Compared to the original DreamArtist, it offers better stability, image quality,
 ## Installation
+Install [pytorch](https://pytorch.org/)
 Install via pip:
 ```bash
@@ -205,6 +207,18 @@ After parsing, the framework will instantiate the components accordingly. This m
 | CCIP Score       | 🚧 In Development                        |
 | Corrupt Score    | 🚧 In Development                        |
+---
+### ⚡️ Image Generation
+| 功能                           | 描述/支持情况                            |
+|------------------------------|------------------------------------|
+| Batch Generation             | ✅ Supported                   |
+| Generate from Prompt Dataset | ✅ Supported                               |
+| Image to Image               | ✅ Supported                               |
+| Inpaint                      | ✅ Supported                               |
+| Token Weight                 | ✅ Supported |
 </details>
 ---

{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/RECORD RENAMED Viewed

@@ -3,25 +3,26 @@ hcpdiff/train_colo.py,sha256=EsuNSzLBvGTZWU_LEk0JpP-F5eNW0lwkawIRAX38jmE,9250
 hcpdiff/train_deepspeed.py,sha256=PwyNukWi0of6TXy_VRDgBQSMLCZBhipO5g3Lq0nCYNk,2988
 hcpdiff/trainer_ac.py,sha256=6KAzo54in7ZRHud_rHjJdwRRZ4uWtc0B4SxVCxgcrmM,2990
 hcpdiff/trainer_ac_single.py,sha256=0PIC5EScqcxp49EaeIWq4KS5K_09OZfKajqbFu-hUb8,1108
-hcpdiff/ckpt_manager/__init__.py,sha256=LfMwz9R4jV4xpiSFt5vhpwaF7-8UHEZ_iDoW-3QGvt0,239
+hcpdiff/ckpt_manager/__init__.py,sha256=Mn_5KOC4xbf2GcN6OXg_XdbF5wO9zWeER_1ZO_prKAI,256
 hcpdiff/ckpt_manager/ckpt.py,sha256=Pa3uXQbCi2T99mpV5fYddQ-OGHcpk8r1ll-0lmP_WXk,965
 hcpdiff/ckpt_manager/loader.py,sha256=Ch1xsZmseq4nyPhpox9-nebN-dZB4k0rqBEHos-ZLso,3245
 hcpdiff/ckpt_manager/format/__init__.py,sha256=a3cdKkOTDgdVbDQwSC4mlxOigjX2hBvRb5_X7E3TQWs,237
 hcpdiff/ckpt_manager/format/diffusers.py,sha256=T81WN95Nj1il9DfQp9iioVn0uqFEWOlmdIYs2beNOFU,3769
 hcpdiff/ckpt_manager/format/emb.py,sha256=FrqfTfJ8H7f0Zw17NTWCP2AJtpsJI5oXR5IAd4NekhU,680
-hcpdiff/ckpt_manager/format/lora_webui.py,sha256=j7SpXnSx_Ys8tnWBgojuB1HEJIm46lhCBuNNYLhaF9w,9824
+hcpdiff/ckpt_manager/format/lora_webui.py,sha256=4y_T9RdmFTxWzsXd8guNjCiukmyILa5j4MPrhVIL4Qk,10017
 hcpdiff/ckpt_manager/format/sd_single.py,sha256=LpCAL_7nAVooCHTFznVVsNMku1G3C77NBORxxr8GDtQ,2328
-hcpdiff/data/__init__.py,sha256=-z47HsEQSubc-AfriVComMACbQXlXTWAKMOPBkATHxA,258
+hcpdiff/data/__init__.py,sha256=ZFKtanOoMo3G3eKUJPhysnHXnr8BNARERkcMB6B897U,292
 hcpdiff/data/dataset.py,sha256=1k4GldW13eVyqK_9hrQniqr3_XYAapnWF7iXl_1GXGg,877
 hcpdiff/data/cache/__init__.py,sha256=ToCmokYH6DghlSwm7HJFirPRIWJ0LkgzqVOYlgoAkQw,25
 hcpdiff/data/cache/vae.py,sha256=gB89zs4CdNlvukDXhVYU9QZrY6VTFUWfzjeF2psNQ50,4070
-hcpdiff/data/handler/__init__.py,sha256=D1HyqY0qfrUHgf25itpYj57JUvgn06G6EQ9d2vRRtys,236
+hcpdiff/data/handler/__init__.py,sha256=G8ZTQF91ilkTRmUoWdmAissTSZ7fvNUpm_hBYmXKTtk,258
 hcpdiff/data/handler/controlnet.py,sha256=bRDMD9BP8-VaG5VrxzvcFKfkqeTbChNfrJSZ3vXbQgY,658
-hcpdiff/data/handler/diffusion.py,sha256=8n60UYdGNR08xw45HoI4EB5AaIui03tSGNDfjazO-5w,3516
+hcpdiff/data/handler/diffusion.py,sha256=S-_7o5Z1tm6LmRZVZs21rbJC7iUoq0tHOsSjKK6geVk,4156
 hcpdiff/data/handler/text.py,sha256=gOzqB2oEkEUbiuy0kZWduo0c-w4Buu60KI6q6Nyl3aM,4208
-hcpdiff/data/source/__init__.py,sha256=AB1VicA272KjTm-Q5L6XvDM8CLQhVPylAPuPMtpfw4g,158
+hcpdiff/data/source/__init__.py,sha256=265M8qfWNUE4SKX0pdXhLYjCnCuae5YE4bfZpO-ydXc,187
 hcpdiff/data/source/folder_class.py,sha256=bs4qPMTzwcnT6ZFlT3tpi9sclsRF9a2MBA1pQD-9EYs,961
-hcpdiff/data/source/text2img.py,sha256=MWXqAEbzmK6pkBY40t9u37ngY25mgdKQ2idwNld8-bo,1826
+hcpdiff/data/source/text.py,sha256=VgI5Ouq986Yy1jwD2fZ9iBlsRciPCeARZmOPEZIcaQY,1468
+hcpdiff/data/source/text2img.py,sha256=acYdolQhZUEpkd7tUAdNkCTVnPc1SMJOVTmGqFt9ZpE,1813
 hcpdiff/data/source/text2img_cond.py,sha256=yj1KpARA2rkjENutnnzC4uDkcU2Rye21FL2VdC25Hac,585
 hcpdiff/diffusion/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 hcpdiff/diffusion/noise/__init__.py,sha256=seBpOtd0YsU53PqMn7Nyl_RtwoC-ONEIOX7v2XLGpZQ,93
@@ -38,10 +39,10 @@ hcpdiff/diffusion/sampler/sigma_scheduler/ddpm.py,sha256=2PMIpg2K6CVoxew1y1pIqvC
 hcpdiff/diffusion/sampler/sigma_scheduler/edm.py,sha256=fOPB3lgnS9uVo4oW26Fur_nc8X_wQ6mmUcbkKhnoQjs,1900
 hcpdiff/easy/__init__.py,sha256=-emoyCOZlLCu3KNMI8L4qapUEtEYFSoiGU6-rKv1at4,149
 hcpdiff/easy/sampler.py,sha256=dQSBkeGh71O0DAmZLhTHTbk1bY7XzyUCeW1oJO14A4I,1250
-hcpdiff/easy/cfg/__init__.py,sha256=aVDEDPxHdX5n-aFkP_4ic8ZhQfSeKu8lZOkgW_4m398,221
-hcpdiff/easy/cfg/sd15_train.py,sha256=LRCJLHNU0JEd1m3MC_NFWUCw5LmwztiLiJlV7u_DeKM,6493
-hcpdiff/easy/cfg/sdxl_train.py,sha256=R0wolSVOrRlI9A-vAfz592SzSnwuDd4ku1oc5yRKrfU,4038
-hcpdiff/easy/cfg/t2i.py,sha256=6Pyy4werXNalwoBBHVMBLBg67kMS85Heb7R3t26GJqQ,6871
+hcpdiff/easy/cfg/__init__.py,sha256=SxHMWG6T2CXhX3dP0xizSMd9vFWPaZQDc4Gj4CF__yQ,253
+hcpdiff/easy/cfg/sd15_train.py,sha256=KtplqN-OhzdZjsX2s60J3XR6o7tRJ-QDx7Eqza_eDkM,6704
+hcpdiff/easy/cfg/sdxl_train.py,sha256=ZKfJ19IvR2dZqDNXULmhZEmqjE7qV4QYxSTvEhI7efQ,4269
+hcpdiff/easy/cfg/t2i.py,sha256=SnjFjZAKd9orjJr3RW5_N2_EIlW2Ree7JMvdNUAR9gc,9507
 hcpdiff/easy/model/__init__.py,sha256=CA-7r3R2Jgweekk1XNByFYttLolbWyUV2bCnXygcD8w,133
 hcpdiff/easy/model/cnet.py,sha256=m0NTH9V1kLzb5GybwBrSNT0KvTcRpPfGkzUeMz9jZZQ,1084
 hcpdiff/easy/model/loader.py,sha256=Tdx-lhQEYf2NYjVM1A5B8x6ZZpJKcXUkFIPIbr7h7XM,3456
@@ -95,20 +96,20 @@ hcpdiff/utils/net_utils.py,sha256=gdwLYDNKV2t3SP0jBIO3d0HtY6E7jRaf_rmPT8gKZZE,97
 hcpdiff/utils/pipe_hook.py,sha256=-UDX3FtZGl-bxSk13gdbPXc1OvtbCcpk_fvKxLQo3Ag,31987
 hcpdiff/utils/utils.py,sha256=hZnZP1IETgVpScxES0yIuRfc34TnzvAqmgOTK_56ssw,4976
 hcpdiff/workflow/__init__.py,sha256=t7Zyc0XFORdNvcwHp9AsCtEkhJ3l7Hm41ugngIL0Sag,867
-hcpdiff/workflow/diffusion.py,sha256=yrl2cXE2d2FNeVzYZDRQNLjy5-QnVgOWioIHSmszk2Y,8662
+hcpdiff/workflow/diffusion.py,sha256=yzhqKA3019OPu1RKggrLoytMgm919qf6j9S85PYOwjQ,8644
 hcpdiff/workflow/fast.py,sha256=kZt7bKrvpFInSn7GzbkTkpoCSM0Z6IbDjgaDvcbFYf8,1024
 hcpdiff/workflow/flow.py,sha256=FFbFFOAXT4c31L5bHBEB_qeVGuBQDLYhq8kTD1chGNo,2548
 hcpdiff/workflow/io.py,sha256=aTrMR3s44apVJpnSyvZIabW2Op0tslk_Z9JFJl5svm0,2635
 hcpdiff/workflow/model.py,sha256=1gj5yOTefYTnGXVR6JPAfxIwuB69YwN6E-BontRcuyQ,2913
-hcpdiff/workflow/text.py,sha256=FSFUm_zEeZjMeg0qRXZAPplnJkg2pR_2FA3XljpoN2w,5110
+hcpdiff/workflow/text.py,sha256=Z__SJHZyuaKyzkYJ6rbiAzOGRiYcCjwCGeqfpP1Jo7o,4336
 hcpdiff/workflow/utils.py,sha256=xojaMG4lHsymslc8df5uiVXmmBVWpn_Phqka8qzJEWw,2226
 hcpdiff/workflow/vae.py,sha256=cingDPkIOc4qGpOwwhXJK4EQbGoIxO583pm6gGov5t8,3118
 hcpdiff/workflow/daam/__init__.py,sha256=ySIDaxloN-D3qM7OuVaG1BR3D-CibDoXYpoTgw0zUhU,59
 hcpdiff/workflow/daam/act.py,sha256=tHbsFWTYYU4bvcZOo1Bpi_z6ofpJatRYccl4vvf8wIA,2756
 hcpdiff/workflow/daam/hook.py,sha256=z9f9mBjKW21xuUZ-iQxQ0HbWOBXtZrisFB0VNMq6d0U,4383
-hcpdiff-2.1.dist-info/licenses/LICENSE,sha256=xx0jnfkXJvxRnG63LTGOxlggYnIysveWIZ6H3PNdCrQ,11357
-hcpdiff-2.1.dist-info/METADATA,sha256=NpBZuj23d1gTKPQhJ0TBRV8QsfICa4LCGSk6PJNniSw,9248
-hcpdiff-2.1.dist-info/WHEEL,sha256=CmyFI0kx5cdEMTLiONQRbGQwjIoR1aIYB7eCAQ4KPJ0,91
-hcpdiff-2.1.dist-info/entry_points.txt,sha256=86wPOMzsfWWflTJ-sQPLc7WG5Vtu0kGYBH9C_vR3ur8,207
-hcpdiff-2.1.dist-info/top_level.txt,sha256=shyf78x-HVgykYpsmY22mKG0xIc7Qk30fDMdavdYWQ8,8
-hcpdiff-2.1.dist-info/RECORD,,
+hcpdiff-2.2.dist-info/licenses/LICENSE,sha256=xx0jnfkXJvxRnG63LTGOxlggYnIysveWIZ6H3PNdCrQ,11357
+hcpdiff-2.2.dist-info/METADATA,sha256=u52mZtA0hI2P_fObmJZRUkZZfnKFYg5c24f4p0trH0o,9833
+hcpdiff-2.2.dist-info/WHEEL,sha256=CmyFI0kx5cdEMTLiONQRbGQwjIoR1aIYB7eCAQ4KPJ0,91
+hcpdiff-2.2.dist-info/entry_points.txt,sha256=86wPOMzsfWWflTJ-sQPLc7WG5Vtu0kGYBH9C_vR3ur8,207
+hcpdiff-2.2.dist-info/top_level.txt,sha256=shyf78x-HVgykYpsmY22mKG0xIc7Qk30fDMdavdYWQ8,8
+hcpdiff-2.2.dist-info/RECORD,,

{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/WHEEL RENAMED Viewed

File without changes

{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{hcpdiff-2.1.dist-info → hcpdiff-2.2.dist-info}/top_level.txt RENAMED Viewed

File without changes

hcpdiff 2.1__py3-none-any.whl → 2.2__py3-none-any.whl

hcpdiff 2.1py3-none-any.whl → 2.2py3-none-any.whl