PyPI - flaxdiff - Versions diffs - 0.1.24__tar.gz → 0.1.26__tar.gz - Mend

flaxdiff 0.1.24tar.gz → 0.1.26tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (45) hide show

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: flaxdiff
-Version: 0.1.24
+Version: 0.1.26
 Summary: A versatile and easy to understand Diffusion library
 Author: Ashish Kumar Singh
 Author-email: ashishkmr472@gmail.com

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/common.py RENAMED Viewed

@@ -108,13 +108,13 @@ class FourierEmbedding(nn.Module):
 class TimeProjection(nn.Module):
     features:int
     activation:Callable=jax.nn.gelu
-    kernel_init:Callable=partial(kernel_init, 1.0)
+    kernel_init:Callable=kernel_init(1.0)
     @nn.compact
     def __call__(self, x):
-        x = nn.DenseGeneral(self.features, kernel_init=self.kernel_init())(x)
+        x = nn.DenseGeneral(self.features, kernel_init=self.kernel_init)(x)
         x = self.activation(x)
-        x = nn.DenseGeneral(self.features, kernel_init=self.kernel_init())(x)
+        x = nn.DenseGeneral(self.features, kernel_init=self.kernel_init)(x)
         x = self.activation(x)
         return x
@@ -123,7 +123,7 @@ class SeparableConv(nn.Module):
     kernel_size:tuple=(3, 3)
     strides:tuple=(1, 1)
     use_bias:bool=False
-    kernel_init:Callable=partial(kernel_init, 1.0)
+    kernel_init:Callable=kernel_init(1.0)
     padding:str="SAME"
     dtype: Optional[Dtype] = None
     precision: PrecisionLike = None
@@ -133,7 +133,7 @@ class SeparableConv(nn.Module):
         in_features = x.shape[-1]
         depthwise = nn.Conv(
             features=in_features, kernel_size=self.kernel_size,
-            strides=self.strides, kernel_init=self.kernel_init(),
+            strides=self.strides, kernel_init=self.kernel_init,
             feature_group_count=in_features, use_bias=self.use_bias,
             padding=self.padding,
             dtype=self.dtype,
@@ -141,7 +141,7 @@ class SeparableConv(nn.Module):
         )(x)
         pointwise = nn.Conv(
             features=self.features, kernel_size=(1, 1),
-            strides=(1, 1), kernel_init=self.kernel_init(),
+            strides=(1, 1), kernel_init=self.kernel_init,
             use_bias=self.use_bias,
             dtype=self.dtype,
             precision=self.precision
@@ -153,7 +153,7 @@ class ConvLayer(nn.Module):
     features:int
     kernel_size:tuple=(3, 3)
     strides:tuple=(1, 1)
-    kernel_init:Callable=partial(kernel_init, 1.0)
+    kernel_init:Callable=kernel_init(1.0)
     dtype: Optional[Dtype] = None
     precision: PrecisionLike = None
@@ -164,7 +164,7 @@ class ConvLayer(nn.Module):
                 features=self.features,
                 kernel_size=self.kernel_size,
                 strides=self.strides,
-                kernel_init=self.kernel_init(),
+                kernel_init=self.kernel_init,
                 dtype=self.dtype,
                 precision=self.precision
             )
@@ -183,7 +183,7 @@ class ConvLayer(nn.Module):
                 features=self.features,
                 kernel_size=self.kernel_size,
                 strides=self.strides,
-                kernel_init=self.kernel_init(),
+                kernel_init=self.kernel_init,
                 dtype=self.dtype,
                 precision=self.precision
             )
@@ -192,7 +192,7 @@ class ConvLayer(nn.Module):
                 features=self.features,
                 kernel_size=self.kernel_size,
                 strides=self.strides,
-                kernel_init=self.kernel_init(),
+                kernel_init=self.kernel_init,
                 dtype=self.dtype,
                 precision=self.precision
             )
@@ -206,7 +206,7 @@ class Upsample(nn.Module):
     activation:Callable=jax.nn.swish
     dtype: Optional[Dtype] = None
     precision: PrecisionLike = None
-    kernel_init:Callable=partial(kernel_init, 1.0)
+    kernel_init:Callable=kernel_init(1.0)
     @nn.compact
     def __call__(self, x, residual=None):
@@ -221,7 +221,7 @@ class Upsample(nn.Module):
             strides=(1, 1),
             dtype=self.dtype,
             precision=self.precision,
-            kernel_init=self.kernel_init()
+            kernel_init=self.kernel_init
         )(out)
         if residual is not None:
             out = jnp.concatenate([out, residual], axis=-1)
@@ -233,7 +233,7 @@ class Downsample(nn.Module):
     activation:Callable=jax.nn.swish
     dtype: Optional[Dtype] = None
     precision: PrecisionLike = None
-    kernel_init:Callable=partial(kernel_init, 1.0)
+    kernel_init:Callable=kernel_init(1.0)
     @nn.compact
     def __call__(self, x, residual=None):
@@ -244,7 +244,7 @@ class Downsample(nn.Module):
             strides=(2, 2),
             dtype=self.dtype,
             precision=self.precision,
-            kernel_init=self.kernel_init()
+            kernel_init=self.kernel_init
         )(x)
         if residual is not None:
             if residual.shape[1] > out.shape[1]:
@@ -269,7 +269,7 @@ class ResidualBlock(nn.Module):
     direction:str=None
     res:int=2
     norm_groups:int=8
-    kernel_init:Callable=partial(kernel_init, 1.0)
+    kernel_init:Callable=kernel_init(1.0)
     dtype: Optional[Dtype] = None
     precision: PrecisionLike = None
     named_norms:bool=False
@@ -296,7 +296,7 @@ class ResidualBlock(nn.Module):
             features=self.features,
             kernel_size=self.kernel_size,
             strides=self.strides,
-            kernel_init=self.kernel_init(),
+            kernel_init=self.kernel_init,
             name="conv1",
             dtype=self.dtype,
             precision=self.precision
@@ -321,7 +321,7 @@ class ResidualBlock(nn.Module):
             features=self.features,
             kernel_size=self.kernel_size,
             strides=self.strides,
-            kernel_init=self.kernel_init(),
+            kernel_init=self.kernel_init,
             name="conv2",
             dtype=self.dtype,
             precision=self.precision
@@ -333,7 +333,7 @@ class ResidualBlock(nn.Module):
                 features=self.features,
                 kernel_size=(1, 1),
                 strides=1,
-                kernel_init=self.kernel_init(),
+                kernel_init=self.kernel_init,
                 name="residual_conv",
                 dtype=self.dtype,
                 precision=self.precision

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/simple_vit.py RENAMED Viewed

@@ -23,6 +23,7 @@ class PatchEmbedding(nn.Module):
     embedding_dim: int
     dtype: Any = jnp.float32
     precision: Any = jax.lax.Precision.HIGH
+    kernel_init: Callable = partial(kernel_init, 1.0)
     @nn.compact
     def __call__(self, x):
@@ -33,6 +34,7 @@ class PatchEmbedding(nn.Module):
                     kernel_size=(self.patch_size, self.patch_size),
                     strides=(self.patch_size, self.patch_size),
                     dtype=self.dtype,
+                    kernel_init=self.kernel_init(),
                     precision=self.precision)(x)
         x = jnp.reshape(x, (batch, -1, self.embedding_dim))
         return x
@@ -96,7 +98,7 @@ class UViT(nn.Module):
         # print(f'Shape of x after time embedding: {x.shape}')
         # Add positional encoding
-        x = PositionalEncoding(max_len=x.shape[1], embedding_dim=self.emb_features)(x)
+        x = PositionalEncoding(max_len=x.shape[1], embedding_dim=self.emb_features, kernel_init=self.kernel_init)(x)
         # print(f'Shape of x after positional encoding: {x.shape}')
@@ -113,20 +115,20 @@ class UViT(nn.Module):
         # Middle block
         x = TransformerBlock(heads=self.num_heads, dim_head=self.emb_features // self.num_heads,
                              dtype=self.dtype, precision=self.precision, use_projection=self.use_projection,
-                             use_flash_attention=self.use_flash_attention, use_self_and_cross=self.use_self_and_cross, force_fp32_for_softmax=self.fforce_fp32_for_softmax,
+                             use_flash_attention=self.use_flash_attention, use_self_and_cross=self.use_self_and_cross, force_fp32_for_softmax=self.force_fp32_for_softmax,
                              only_pure_attention=False,
                              kernel_init=self.kernel_init())(x)
         # # Out blocks
         for i in range(self.num_layers // 2):
-            skip = jnp.concatenate([x, skips.pop()], axis=-1)
-            skip = nn.DenseGeneral(features=self.emb_features, kernel_init=self.kernel_init(),
-                                   dtype=self.dtype, precision=self.precision)(skip)
+            x = jnp.concatenate([x, skips.pop()], axis=-1)
+            x = nn.DenseGeneral(features=self.emb_features, kernel_init=self.kernel_init(),
+                                   dtype=self.dtype, precision=self.precision)(x)
             x = TransformerBlock(heads=self.num_heads, dim_head=self.emb_features // self.num_heads,
                                  dtype=self.dtype, precision=self.precision, use_projection=self.use_projection,
-                                 use_flash_attention=self.use_flash_attention, use_self_and_cross=self.use_self_and_cross, force_fp32_for_softmax=self.fforce_fp32_for_softmax,
+                                 use_flash_attention=self.use_flash_attention, use_self_and_cross=self.use_self_and_cross, force_fp32_for_softmax=self.force_fp32_for_softmax,
                                  only_pure_attention=False,
-                                 kernel_init=self.kernel_init())(skip)
+                                 kernel_init=self.kernel_init())(x)
         # print(f'Shape of x after transformer blocks: {x.shape}')
         x = self.norm()(x)
@@ -139,6 +141,14 @@ class UViT(nn.Module):
         x = x[:, 1 + num_text_tokens:, :]
         x = unpatchify(x, channels=self.output_channels)
         # print(f'Shape of x after final dense layer: {x.shape}')
-        x = nn.Dense(features=self.output_channels, dtype=self.dtype, precision=self.precision, kernel_init=self.kernel_init())(x)
+        x = nn.Conv(
+            features=self.output_channels,
+            kernel_size=(3, 3),
+            strides=(1, 1),
+            padding='SAME',
+            dtype=self.dtype,
+            precision=self.precision,
+            kernel_init=kernel_init(0.0),
+        )(x)
         return x

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: flaxdiff
-Version: 0.1.24
+Version: 0.1.26
 Summary: A versatile and easy to understand Diffusion library
 Author: Ashish Kumar Singh
 Author-email: ashishkmr472@gmail.com

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/setup.py RENAMED Viewed

@@ -11,7 +11,7 @@ required_packages=[
 setup(
     name='flaxdiff',
     packages=find_packages(),
-    version='0.1.24',
+    version='0.1.26',
     description='A versatile and easy to understand Diffusion library',
     long_description=open('README.md').read(),
     long_description_content_type='text/markdown',

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/README.md RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/__init__.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/data/__init__.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/data/online_loader.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/__init__.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/attention.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/autoencoder/__init__.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/autoencoder/autoencoder.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/autoencoder/diffusers.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/autoencoder/simple_autoenc.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/favor_fastattn.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/models/simple_unet.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/predictors/__init__.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/samplers/__init__.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/samplers/common.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/samplers/ddim.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/samplers/ddpm.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/samplers/euler.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/samplers/heun_sampler.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/samplers/multistep_dpm.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/samplers/rk4_sampler.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/schedulers/__init__.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/schedulers/common.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/schedulers/continuous.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/schedulers/cosine.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/schedulers/discrete.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/schedulers/exp.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/schedulers/karras.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/schedulers/linear.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/schedulers/sqrt.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/trainer/__init__.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/trainer/autoencoder_trainer.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/trainer/diffusion_trainer.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/trainer/simple_trainer.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff/utils.py RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff.egg-info/SOURCES.txt RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff.egg-info/dependency_links.txt RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff.egg-info/requires.txt RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/flaxdiff.egg-info/top_level.txt RENAMED Viewed

File without changes

{flaxdiff-0.1.24 → flaxdiff-0.1.26}/setup.cfg RENAMED Viewed

File without changes

flaxdiff 0.1.24__tar.gz → 0.1.26__tar.gz

flaxdiff 0.1.24tar.gz → 0.1.26tar.gz