PyPI - SM2ST - Versions diffs - 0.0.1__py3-none-any.whl - Mend

SM2ST 0.0.1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

SM2ST/SMLED.py +332 -0
SM2ST/Train_SMLED.py +363 -0
SM2ST/__init__.py +15 -0
SM2ST/dataset.py +85 -0
SM2ST/gatv2_conv.py +213 -0
SM2ST/rectification.py +204 -0
SM2ST/utils.py +447 -0
sm2st-0.0.1.dist-info/LICENSE.txt +21 -0
sm2st-0.0.1.dist-info/METADATA +17 -0
sm2st-0.0.1.dist-info/RECORD +12 -0
sm2st-0.0.1.dist-info/WHEEL +5 -0
sm2st-0.0.1.dist-info/top_level.txt +1 -0

SM2ST/SMLED.py ADDED Viewed

@@ -0,0 +1,332 @@
+import numpy as np
+import torch
+import torch.nn as nn
+import torch.backends.cudnn as cudnn
+import torch.nn.functional as F
+import random
+# from .gatv2_conv_or import GATv2Conv as GATConv
+from torch.nn.utils import spectral_norm
+class encoding_mask_noise(torch.nn.Module):
+    def __init__(self, hidden_dims):
+        super(encoding_mask_noise, self).__init__()
+        [in_dim, num_hidden, out_dim] = hidden_dims
+        self.enc_mask_token = nn.Parameter(torch.zeros(size=(1, in_dim)))
+        self.reset_parameters_for_token()
+    def reset_parameters_for_token(self):
+        nn.init.xavier_normal_(self.enc_mask_token.data, gain=1.414)#
+    def forward(self, x, mask_rate=0.5, replace_rate=0.05):
+        # num_nodes = g.num_nodes()
+        num_nodes = x.size()[0]
+        perm = torch.randperm(num_nodes, device=x.device)
+        num_mask_nodes = int(mask_rate * num_nodes)
+        mask_token_rate = 1-replace_rate
+        # random masking
+        num_mask_nodes = int(mask_rate * num_nodes)
+        mask_nodes = perm[: num_mask_nodes]
+        keep_nodes = perm[num_mask_nodes: ]
+        if replace_rate > 0.0:
+            num_noise_nodes = int(replace_rate * num_mask_nodes)
+            perm_mask = torch.randperm(num_mask_nodes, device=x.device)
+            token_nodes = mask_nodes[perm_mask[: -num_noise_nodes]]#int(mask_token_rate * num_mask_nodes)
+            noise_nodes = mask_nodes[perm_mask[-num_noise_nodes:]]
+            noise_to_be_chosen = torch.randperm(num_nodes, device=x.device)[:num_noise_nodes]
+            out_x = x.clone()
+            # out_x[token_nodes] = torch.zeros_like(out_x[token_nodes])
+            out_x[token_nodes] = 0.0
+            out_x[noise_nodes] = x[noise_to_be_chosen]
+            # out_x[noise_nodes] = torch.add(x[noise_to_be_chosen], out_x[noise_nodes])
+        else:
+            out_x = x.clone()
+            token_nodes = mask_nodes
+            out_x[mask_nodes] = 0.0
+        out_x[token_nodes] += self.enc_mask_token
+        # use_g = g.clone()
+        return out_x, mask_nodes, keep_nodes
+class random_remask(torch.nn.Module):
+    def __init__(self, hidden_dims):
+        super(random_remask, self).__init__()
+        [in_dim, num_hidden, out_dim] = hidden_dims
+        self.dec_mask_token = nn.Parameter(torch.zeros(size=(1, out_dim)))
+        self.reset_parameters_for_token()
+    def reset_parameters_for_token(self):
+        nn.init.xavier_normal_(self.dec_mask_token.data, gain=1.414)
+    def forward(self,rep,remask_rate=0.5):
+        num_nodes = rep.size()[0]
+        # num_nodes = g.num_nodes()
+        perm = torch.randperm(num_nodes, device=rep.device)
+        num_remask_nodes = int(remask_rate * num_nodes)
+        remask_nodes = perm[: num_remask_nodes]
+        rekeep_nodes = perm[num_remask_nodes: ]
+        out_rep = rep.clone()
+        out_rep[remask_nodes] = 0.0
+        out_rep[remask_nodes] += self.dec_mask_token
+        return out_rep, remask_nodes, rekeep_nodes
+# class Encoder(nn.Module):
+#     def __init__(self, mz_number, X_dim):
+#         super(Encoder, self).__init__()
+#         # self.encoding_mask_noise = encoding_mask_noise(hidden_dims)
+#         # self.random_remask = random_remask(hidden_dims)
+#         self.fc1 = nn.Linear(mz_number, 1024)
+#         self.fc1_bn = nn.BatchNorm1d(1024)
+#         self.fc2 = nn.Linear(1024, 256)
+#         self.fc2_bn = nn.BatchNorm1d(256)
+#         self.fc3 = nn.Linear(256, 64)
+#         self.fc3_bn = nn.BatchNorm1d(64)
+#         self.fc4 = nn.Linear(64, 8)
+#         self.fc4_bn = nn.BatchNorm1d(8)
+#         self.fc5 = nn.Linear(8, X_dim)
+#         # Initialize parameters
+#         self.init_weights()
+#     def init_weights(self):
+#         gain = nn.init.calculate_gain('relu')
+#         # Initialize weights and biases for all linear layers
+#         for module in self.modules():
+#             if isinstance(module, nn.Linear):
+#                 # Use the Xavier initialization method to specify the gain value
+#                 nn.init.xavier_uniform_(module.weight, gain=gain)
+#                 if module.bias is not None:
+#                     # Initialize the bias to 0
+#                     nn.init.zeros_(module.bias)
+#     def forward(self, features, relu=False, mask = 0.0):
+#         if mask:
+#             mask_tensor = torch.bernoulli(torch.full_like(features, mask)).to(features.device)  # Random mask with 50% probability
+#             features = features * mask_tensor  # Apply mask
+#         h1 = F.relu(self.fc1_bn(self.fc1(features)))
+#         h2 = F.relu(self.fc2_bn(self.fc2(h1)))
+#         h3 = F.relu(self.fc3_bn(self.fc3(h2)))
+#         h4 = F.relu(self.fc4_bn(self.fc4(h3)))
+#         if relu:
+#             return F.relu(self.fc5(h4))
+#         else:
+#             return self.fc5(h4)
+class Encoder(nn.Module):
+    def __init__(self, mz_number, X_dim, down_ratio):
+        super(Encoder, self).__init__()
+        self.dropout_rate = down_ratio
+        self.fc1 = nn.Linear(mz_number, 1024)
+        self.fc1_bn = nn.BatchNorm1d(1024)
+        self.dropout1 = nn.Dropout(self.dropout_rate)
+        self.fc2 = nn.Linear(1024, 256)
+        self.fc2_bn = nn.BatchNorm1d(256)
+        self.dropout2 = nn.Dropout(self.dropout_rate)
+        self.fc3 = nn.Linear(256, 64)
+        self.fc3_bn = nn.BatchNorm1d(64)
+        self.dropout3 = nn.Dropout(self.dropout_rate)
+        self.fc4 = nn.Linear(64, 16)#8
+        self.fc4_bn = nn.BatchNorm1d(16)#8
+        self.dropout4 = nn.Dropout(self.dropout_rate)
+        self.fc5 = nn.Linear(16, X_dim)
+        # Initialize parameters
+        self.init_weights()
+    def init_weights(self):
+        gain = nn.init.calculate_gain('relu')
+        # Initialize weights and biases for all linear layers
+        for module in self.modules():
+            if isinstance(module, nn.Linear):
+                # Use the Xavier initialization method to specify the gain value
+                nn.init.xavier_uniform_(module.weight, gain=gain)
+                if module.bias is not None:
+                    # Initialize the bias to 0
+                    nn.init.zeros_(module.bias)
+    def forward(self, features, relu=False):
+        # h1 = self.CustomDropout1(features)
+        # h1 = F.relu(self.fc1_bn(self.fc1(h1)))
+        h1 = F.relu(self.fc1_bn(self.fc1(features)))
+        h1 = self.dropout1(h1)
+        h2 = F.relu(self.fc2_bn(self.fc2(h1)))
+        h2 = self.dropout2(h2)
+        h3 = F.relu(self.fc3_bn(self.fc3(h2)))
+        h3 = self.dropout3(h3)
+        h4 = F.relu(self.fc4_bn(self.fc4(h3)))
+        h4 = self.dropout4(h4)
+        if relu:
+            return F.relu(self.fc5(h4))
+        else:
+            return self.fc5(h4)
+# class Decoder(nn.Module):
+#     def __init__(self, mz_number, X_dim):
+#         super(Decoder, self).__init__()
+#         self.fc6 = nn.Linear(X_dim, 8)
+#         self.fc6_bn = nn.BatchNorm1d(8)
+#         self.fc7 = nn.Linear(8, 64)
+#         self.fc7_bn = nn.BatchNorm1d(64)
+#         self.fc8 = nn.Linear(64, 256)
+#         self.fc8_bn = nn.BatchNorm1d(256)
+#         self.fc9 = nn.Linear(256, 1024)
+#         self.fc9_bn = nn.BatchNorm1d(1024)
+#         self.fc10 = nn.Linear(1024, mz_number)
+#         # Initialize parameters
+#         self.init_weights()
+#     def init_weights(self):
+#         # Initialize weights and biases for all linear layers
+#         gain = nn.init.calculate_gain('relu')
+#         for module in self.modules():
+#             if isinstance(module, nn.Linear):
+#                 # Use the Xavier initialization method to specify the gain value
+#                 nn.init.xavier_uniform_(module.weight, gain=gain)
+#                 if module.bias is not None:
+#                     # Initialize the bias to 0
+#                     nn.init.zeros_(module.bias)
+#     def forward(self, z, relu=False):
+#         h6 = F.relu(self.fc6_bn(self.fc6(z)))
+#         h7 = F.relu(self.fc7_bn(self.fc7(h6)))
+#         h8 = F.relu(self.fc8_bn(self.fc8(h7)))
+#         h9 = F.relu(self.fc9_bn(self.fc9(h8)))
+#         if relu:
+#             return F.relu(self.fc10(h9))
+#         else:
+#             return self.fc10(h9)
+class Decoder(nn.Module):
+    def __init__(self, mz_number, X_dim, down_ratio):
+        super(Decoder, self).__init__()
+        self.dropout_rate = down_ratio
+        self.fc6 = nn.Linear(X_dim, 16)#8
+        self.fc6_bn = nn.BatchNorm1d(16)#8
+        self.dropout6 = nn.Dropout(self.dropout_rate)
+        self.fc7 = nn.Linear(16, 64)
+        self.fc7_bn = nn.BatchNorm1d(64)
+        self.dropout7 = nn.Dropout(self.dropout_rate)
+        self.fc8 = nn.Linear(64, 256)
+        self.fc8_bn = nn.BatchNorm1d(256)
+        self.dropout8 = nn.Dropout(self.dropout_rate)
+        self.fc9 = nn.Linear(256, 1024)
+        self.fc9_bn = nn.BatchNorm1d(1024)
+        self.dropout9 = nn.Dropout(self.dropout_rate)
+        self.fc10 = nn.Linear(1024, mz_number)
+        # Initialize parameters
+        self.init_weights()
+    def init_weights(self):
+        gain = nn.init.calculate_gain('relu')
+        # Initialize weights and biases for all linear layers
+        for module in self.modules():
+            if isinstance(module, nn.Linear):
+                # Use the Xavier initialization method to specify the gain value
+                nn.init.xavier_uniform_(module.weight, gain=gain)
+                if module.bias is not None:
+                    # Initialize the bias to 0
+                    nn.init.zeros_(module.bias)
+    def forward(self, z, relu=False):
+        h6 = F.relu(self.fc6_bn(self.fc6(z)))
+        h6 = self.dropout6(h6)
+        h7 = F.relu(self.fc7_bn(self.fc7(h6)))
+        h7 = self.dropout7(h7)
+        h8 = F.relu(self.fc8_bn(self.fc8(h7)))
+        h8 = self.dropout8(h8)
+        h9 = F.relu(self.fc9_bn(self.fc9(h8)))
+        h9 = self.dropout9(h9)
+        if relu:
+            return F.relu(self.fc10(h9))
+        else:
+            return self.fc10(h9)
+class Discriminator_A(torch.nn.Module):
+    def __init__(self, X_dim):
+        super(Discriminator_A, self).__init__()
+        self.fc = torch.nn.Sequential(
+            spectral_norm(nn.Linear(X_dim, 128)),# last best
+            nn.LeakyReLU(0.2),
+            spectral_norm(nn.Linear(128, 32)),
+            nn.LeakyReLU(0.2),
+            spectral_norm(nn.Linear(32, 8)),
+            nn.LeakyReLU(0.2),
+            spectral_norm(nn.Linear(8, 1)),
+            nn.Sigmoid()
+            # nn.Linear(X_dim, 64),
+            # nn.LeakyReLU(0.2),
+            # nn.Linear(64, 8),
+            # nn.LeakyReLU(0.2),
+            # nn.Linear(8, 1),
+            # nn.Sigmoid()
+        )
+        self.init_weights()
+    def init_weights(self):
+        gain = nn.init.calculate_gain('leaky_relu', 0.2)
+        # Initialize weights and biases for all linear layers
+        for module in self.modules():
+            if isinstance(module, nn.Linear):
+                # Use the Xavier initialization method to specify the gain value
+                nn.init.xavier_uniform_(module.weight, gain=gain)
+                if module.bias is not None:
+                    # Initialize the bias to 0
+                    nn.init.zeros_(module.bias)
+    def forward(self, x):
+        return self.fc(x)
+class Discriminator_B(torch.nn.Module):
+    def __init__(self, X_dim):
+        super(Discriminator_B, self).__init__()
+        self.fc = torch.nn.Sequential(
+            nn.Linear(X_dim, 512),
+            nn.LeakyReLU(0.2),
+            nn.Linear(512, 128),
+            nn.LeakyReLU(0.2),
+            nn.Linear(128, 32),
+            nn.LeakyReLU(0.2),
+            nn.Linear(32, 1),
+            # nn.Linear(X_dim, 16),
+            # nn.LeakyReLU(0.2),
+            # nn.Linear(16, 4),
+            # nn.LeakyReLU(0.2),
+            # nn.Linear(4, 1),
+            # nn.Sigmoid()
+        )
+        self.init_weights()
+    def init_weights(self):
+        gain = nn.init.calculate_gain('leaky_relu', 0.2)
+        # Initialize weights and biases for all linear layers
+        for module in self.modules():
+            if isinstance(module, nn.Linear):
+                # Use the Xavier initialization method to specify the gain value
+                nn.init.xavier_uniform_(module.weight, gain=gain)
+                if module.bias is not None:
+                    # Initialize the bias to 0
+                    nn.init.zeros_(module.bias)
+    def forward(self, x):
+        return self.fc(x)

SM2ST/Train_SMLED.py ADDED Viewed

@@ -0,0 +1,363 @@
+import numpy as np
+import pandas as pd
+from tqdm import tqdm
+import scipy.sparse as sp
+import os
+from .SMLED import Encoder, Decoder, Discriminator_A,Discriminator_B
+from .utils import Transfer_pytorch_Data, positional_pixel_step, recovery_coord, generation_coord, Cal_Spatial_Net
+from .dataset import *
+import random
+import torch
+import torch.backends.cudnn as cudnn
+from torch.autograd import Variable
+import os
+import torch.nn.functional as F
+from scipy.sparse import csr_matrix, csc_matrix, coo_matrix
+from torch_sparse import SparseTensor
+def sce_loss(x, y, alpha=1.0):
+    x = F.normalize(x, p=2, dim=-1)
+    y = F.normalize(y, p=2, dim=-1)
+    loss = (1 - (x * y).sum(dim=-1)).pow_(alpha)
+    loss = loss.mean()
+    return loss
+class WeightedMSELoss(torch.nn.Module):
+    def __init__(self, weights):
+        super(WeightedMSELoss, self).__init__()
+        self.weights = weights
+    def forward(self, y_pred, y_true):
+        # Ensure that the shape of the weights is consistent with that of the input tensor
+        return torch.mean(self.weights * (y_pred -y_true) ** 2)
+class WeightedMAELoss(torch.nn.Module):
+    def __init__(self, weights):
+        super(WeightedMAELoss, self).__init__()
+        self.weights = weights
+    def forward(self, y_pred, y_true):
+        # Ensure that the shape of the weights is consistent with that of the input tensor
+        return torch.mean(self.weights * torch.abs(y_pred - y_true))
+def rand_projections(
+        embedding_dim,
+        num_samples=50,
+        device='cpu'
+):
+    """This function generates `num_samples` random samples from the latent space's unit sphere.
+        Args:
+            embedding_dim (int): embedding dimensionality
+            num_samples (int): number of random projection samples
+        Return:
+            torch.Tensor: tensor of size (num_samples, embedding_dim)
+    """
+    projections = [w / np.sqrt((w**2).sum())  # L2 normalization
+                   for w in np.random.normal(size=(num_samples, embedding_dim))]
+    projections = np.asarray(projections)
+    return torch.from_numpy(projections).type(torch.FloatTensor).to(device)
+def wasserstein_loss(disc_real, disc_fake):
+    return -torch.mean(disc_real) + torch.mean(disc_fake)
+def gradient_penalty(discriminator, real_data, fake_data, device, lambda_gp=10):
+    alpha = torch.rand(real_data.size(0), 1).to(device)
+    interpolated = alpha * real_data + ((1 - alpha) * fake_data)
+    interpolated = interpolated.requires_grad_(True)
+    mixed_scores = discriminator(interpolated)
+    gradients = torch.autograd.grad(
+        inputs=interpolated,
+        outputs=mixed_scores,
+        grad_outputs=torch.ones(mixed_scores.size()).to(device),
+        create_graph=True,
+        retain_graph=True,
+        only_inputs=True
+    )[0]
+    gradients_norm = torch.norm(gradients.view(gradients.size(0), -1), dim=1)
+    gradient_penalty = lambda_gp * ((gradients_norm - 1) ** 2).mean()
+    return gradient_penalty
+def train_SMLED(adata=None, X_dim = 2, delta = 1.0, train_epoch=15000,lr=0.001,mask_ratio=0.5,alpha=1.0,key_added='SMLED',step_size=10000,gamma=1.0,
+                relu=True, gradient_clipping=5., experiment='generation', weight_decay=0.0001, verbose=True, batch_size = 1000,lambda_gp = 1.0,
+                random_seed=2025, save_path = './SMLED_pyG_result',down_ratio = 0., coord_sf=1.0,
+                WMMSE=0.0, res = 2.0, device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')):
+    """\
+    Training GAN auto-encoder.
+    Parameters
+    ----------
+    adata
+        AnnData object of scanpy package.
+    delta
+        Coordinate scaling.
+    train_epoch
+        Number of total epochs in training.
+    lr
+        Learning rate for AdamOptimizer.
+    key_added
+        The latent embeddings are saved in adata.obsm[key_added].
+    gradient_clipping
+        Gradient Clipping.
+    weight_decay
+        Weight decay for AdamOptimizer.
+    mask_ratio
+        Random masking ratio.
+    WMMSE
+        The weight distribution of wmse.
+    device
+        See torch.device.
+    Returns
+    -------
+    AnnData
+    """
+    # seed_everything()
+    seed=random_seed
+    fix_seed(seed)
+    if not os.path.isdir(save_path):
+        os.mkdir(save_path)
+    if verbose:
+        print('Size of Input: ', adata.X.shape)
+    if experiment=='recovery':
+        # adata, masked_adata, adata_filtered, picked_index, remaining_index = masked_anndata(adata = adata, mask_ratio=0.5)
+        coor, full_coor, sample_index, sample_barcode = recovery_coord(adata,name='spatial',mask_ratio = mask_ratio)
+        used_gene, normed_data, adata_sample = get_data(adata, experiment=experiment, sample_index=sample_index, sample_barcode=sample_barcode)
+        xlabel_df,full_xlabel_df = positional_pixel_step(coor, full_coor, delta, coord_sf)
+        print(xlabel_df,full_xlabel_df)
+        transformed_dataset = MyDataset(normed_data=normed_data, coor_df=xlabel_df, transform=transforms.Compose([ToTensor()]))
+        train_loader = DataLoader(transformed_dataset, batch_size=batch_size, shuffle=True, num_workers=4, drop_last=False)
+    elif experiment == 'higher_res':
+        coor, full_coor = generation_coord(adata,name='spatial',res=res)
+        used_gene, normed_data = get_data(adata, experiment=experiment)
+        xlabel_df,full_xlabel_df = positional_pixel_step(coor, full_coor, delta, coord_sf)
+        print(xlabel_df,full_xlabel_df)
+        transformed_dataset = MyDataset(normed_data=normed_data, coor_df = xlabel_df, transform=transforms.Compose([ToTensor()]))
+        train_loader = DataLoader(transformed_dataset, batch_size=batch_size, shuffle=True, num_workers=4, drop_last=False)
+    elif experiment == 'generation':
+        coor = adata.obsm['spatial']
+        full_coor = adata.uns['coord']
+        used_gene, normed_data = get_data(adata, experiment=experiment)
+        xlabel_df,full_xlabel_df = positional_pixel_step(coor, full_coor, delta, coord_sf)
+        print(xlabel_df,full_xlabel_df)
+        transformed_dataset = MyDataset(normed_data=normed_data, coor_df=xlabel_df, transform=transforms.Compose([ToTensor()]))
+        train_loader = DataLoader(transformed_dataset, batch_size=batch_size, shuffle=True, num_workers=4, drop_last=False)
+    gene_number = len(used_gene)
+    encoder, decoder = Encoder(gene_number, X_dim, down_ratio), Decoder(gene_number, X_dim, down_ratio=0.)
+    discriminator_AB  = Discriminator_A(X_dim) #, Discriminator_B(gene_number) #, discriminator_BA
+    # encoder.train()
+    # decoder.train()
+    encoder, decoder = encoder.to(device), decoder.to(device)
+    discriminator_AB = discriminator_AB.to(device) # ,discriminator_BA.to(device) , discriminator_BA
+    enc_optim = torch.optim.Adam(encoder.parameters(), lr=lr, weight_decay=weight_decay, eps=1e-8, betas=(0.5, 0.999))#
+    dec_optim = torch.optim.Adam(decoder.parameters(), lr=lr, weight_decay=weight_decay, eps=1e-8, betas=(0.5, 0.999))
+    disc_optim_AB = torch.optim.Adam(discriminator_AB.parameters(), lr=lr, weight_decay=weight_decay, eps=1e-8, betas=(0.5, 0.999))
+    # enc_optim_gan = torch.optim.Adam(encoder.parameters(), lr=lr, weight_decay=weight_decay, eps=1e-8, betas=(0.5, 0.999)) #
+    # dec_optim_gan = torch.optim.Adam(decoder.parameters(), lr=lr, weight_decay=weight_decay, eps=1e-8, betas=(0.5, 0.999))
+    n_gen = 1
+    n_crit = 2
+    # disc_optim_BA = torch.optim.Adam(discriminator_BA.parameters(), lr=lr, weight_decay=weight_decay, eps=1e-8, betas=(0.5, 0.999))
+    enc_sche = torch.optim.lr_scheduler.StepLR(enc_optim, step_size=n_gen*step_size, gamma=gamma)
+    dec_sche = torch.optim.lr_scheduler.StepLR(dec_optim, step_size=n_gen*step_size, gamma=gamma)
+    disc_sche_AB = torch.optim.lr_scheduler.StepLR(disc_optim_AB, step_size=n_crit*step_size, gamma=gamma)
+    # enc_sche_gan = torch.optim.lr_scheduler.StepLR(enc_optim_gan, step_size=step_size, gamma=gamma)
+    # dec_sche_gan = torch.optim.lr_scheduler.StepLR(dec_optim_gan, step_size=step_size, gamma=gamma)
+    # loss function
+    criterion = torch.nn.BCELoss()
+    # loss function
+    if WMMSE>0:
+        if sp.issparse(adata.X):
+            matrix = adata.X.A
+        else:
+            matrix = adata.X
+        column_sums = matrix.sum(axis=0)
+        normalized = column_sums * (WMMSE / column_sums.sum())
+        weights = WMMSE - normalized
+        weights = torch.tensor(weights, dtype=torch.float32,device = device)
+        loss2 = WeightedMSELoss(weights)
+        loss1 = WeightedMAELoss(weights)
+    else:
+        loss2 = torch.nn.MSELoss()
+        loss1 = torch.nn.L1Loss()
+    MAE = torch.nn.L1Loss()
+    with tqdm(range(train_epoch), total=train_epoch, desc='Epochs') as epoch:
+        for j in epoch:
+            train_reloss = []
+            train_GAloss = []
+            train_latloss = []
+            train_loss = []
+            train_DAloss = []
+            # train_DBloss = []
+            for xdata, xlabel in train_loader:
+                xdata = xdata.to(torch.float32)
+                xlabel = xlabel.to(torch.float32)
+                xdata, xlabel = Variable(xdata.to(device)), Variable(xlabel.to(device))
+                for _ in range(n_crit): #3
+                    discriminator_AB.train()
+                    disc_optim_AB.zero_grad()
+                    fake_xlabel = encoder(xdata, relu)
+                    # fake_xdata = decoder(fake_xlabel, relu)
+                    # fake_xdata = decoder(fake_xlabel, relu)
+                    # combined_xlabel = torch.cat((xdata, xlabel), dim=1)
+                    # combined_fake_xlabel = torch.cat((fake_xdata, fake_xlabel), dim=1)
+                    # disc_realA = discriminator_AB(combined_xlabel)
+                    # disc_fakeA = discriminator_AB(combined_fake_xlabel)
+                    disc_realA = discriminator_AB(xlabel)
+                    disc_fakeA = discriminator_AB(fake_xlabel)
+                    # d_loss = wasserstein_loss(disc_realA, disc_fakeA)
+                    # gp = gradient_penalty(discriminator_AB, xlabel, fake_xlabel, device, lambda_gp = lambda_gp)
+                    # d_total_loss = d_loss + gp
+                    disc_real = disc_realA.view(-1)
+                    disc_fake = disc_fakeA.view(-1)
+                    loss_dis_real = criterion(disc_real, torch.ones_like(disc_real))
+                    loss_dis_fake = criterion(disc_fake, torch.zeros_like(disc_fake))
+                    d_total_loss = loss_dis_real + loss_dis_fake
+                    train_DAloss.append(d_total_loss.item())
+                    d_total_loss.backward()
+                    # torch.nn.utils.clip_grad_norm_(discriminator_AB.parameters(), gradient_clipping)
+                    disc_optim_AB.step()
+                    disc_sche_AB.step()
+                discriminator_AB.eval()
+                # discriminator_BA.eval()
+                for _ in range(n_gen):#
+                    encoder.train()
+                    decoder.train()
+                    enc_optim.zero_grad()
+                    dec_optim.zero_grad()
+                    fake_xlabel = encoder(xdata, relu)
+                    fake_xdata = decoder(fake_xlabel, relu)
+                    # fake_xdata_ = decoder(xlabel, relu)
+                    # disc_fakeA = discriminator_AB(fake_xlabel)
+                    # disc_fake = disc_fakeA.view(-1)
+                    # gA_loss = criterion(disc_fake, torch.ones_like(disc_fake))
+                    # combined_xlabel = torch.cat((xdata, xlabel), dim=1)
+                    # combined_fake_xlabel = torch.cat((fake_xdata, fake_xlabel), dim=1)
+                    # disc_realA = discriminator_AB(combined_xlabel)
+                    # disc_fakeA = discriminator_AB(combined_fake_xlabel)
+                    disc_realA = discriminator_AB(xlabel)
+                    disc_fakeA = discriminator_AB(fake_xlabel)
+                    # gA_loss = -wasserstein_loss(disc_realA, disc_fakeA)
+                    gA_loss = torch.abs(wasserstein_loss(disc_realA, disc_fakeA))
+                    # gA_loss = torch.abs(wasserstein_loss(disc_realA, disc_fakeA))
+                    # gp = gradient_penalty(discriminator_AB, xlabel, fake_xlabel, device, lambda_gp = lambda_gp)
+                    # d_total_loss = gA_loss + gp
+                    # disc_fakeB = discriminator_BA(fake_xdata)
+                    # gA_loss = -disc_fakeA.mean()
+                    # gB_loss = -disc_fakeB.mean()
+                    latent_loss = MAE(fake_xlabel, xlabel)
+                    # + 0.1 * sliced_wasserstein_distance(fake_xlabel, xlabel, 1000, device=device)
+                    recon_loss = loss2(fake_xdata, xdata) + 0.1*loss1(fake_xdata, xdata)
+                    loss = recon_loss + 0.3*latent_loss + gA_loss  #
+                    # loss = 0.4*recon_loss + 0.6*latent_loss + gA_loss # last best
+                    train_latloss.append(latent_loss.item())
+                    train_GAloss.append(gA_loss.item())
+                    # train_GBloss.append(gB_loss.item())
+                    train_reloss.append(recon_loss.item())
+                    # train_Gloss.append(g_loss.item())
+                    train_loss.append(loss.item())
+                    loss.backward()
+                    # gA_loss.backward()
+                    # torch.nn.utils.clip_grad_norm_(encoder.parameters(), gradient_clipping)
+                    # torch.nn.utils.clip_grad_norm_(decoder.parameters(), gradient_clipping)
+                    enc_optim.step()
+                    dec_optim.step()
+                    enc_sche.step()
+                    dec_sche.step()
+                encoder.eval()
+                decoder.eval()
+            #, loss_GB: %.5f , loss_DB: %.5f
+            epoch_info = 'loss_re: %.5f, loss_lat: %.5f, loss_GA: %.5f, loss: %.5f, loss_DA: %.5f' % \
+                         (torch.mean(torch.FloatTensor(train_reloss)),
+                          torch.mean(torch.FloatTensor(train_latloss)),
+                          torch.mean(torch.FloatTensor(train_GAloss)),
+                          torch.mean(torch.FloatTensor(train_loss)),
+                          torch.mean(torch.FloatTensor(train_DAloss))
+                          # torch.mean(torch.FloatTensor(train_DBloss))
+                         )#
+            epoch.set_postfix_str(epoch_info)
+    torch.save(encoder, save_path+'/encoder.pth')
+    torch.save(decoder, save_path+'/decoder.pth')
+    # torch.save(discriminator_AB, save_path+'/discriminator_AB.pth')
+    # torch.save(discriminator_BA, save_path+'/discriminator_BA.pth')
+    encoder.eval()
+    decoder.eval()
+    # Get generated or recovered data
+    if experiment=='generation' or experiment=='recovery' or experiment=='higher_res':
+        full_coor_df = full_xlabel_df.copy()
+        full_coor_t = torch.from_numpy(np.array(full_coor_df))
+        full_coor_t = full_coor_t.to(torch.float32)
+        full_coor_t = Variable(full_coor_t.to(device))
+        # if experiment=='higher_res':
+        dataloader_t = DataLoader(full_coor_t, batch_size=1000, shuffle=False)
+        generate_profile_list = []
+        for batch_coor_t in dataloader_t:
+            batch_coor_t = batch_coor_t.to(torch.float32)
+            batch_coor_t = Variable(batch_coor_t.to(device))
+            batch_generate_profile = decoder(batch_coor_t, relu)
+            batch_generate_profile = batch_generate_profile.cpu().detach().numpy()
+            generate_profile_list.append(batch_generate_profile)
+            generate_profile = np.concatenate(generate_profile_list, axis=0)
+        # else:
+        #     generate_profile = decoder(full_coor_t, relu)
+        #     generate_profile = generate_profile.cpu().detach().numpy()
+        if not relu:
+            generate_profile = np.clip(generate_profile, a_min=0, a_max=None)
+        if experiment=='recovery':
+            np.savetxt(save_path+"/fill_data.txt", generate_profile)
+        st_intensity = csr_matrix(generate_profile, dtype=np.float32)
+        adata_SMLED = sc.AnnData(st_intensity)
+        # adata_SMLED = sc.AnnData(generate_profile)
+        adata_SMLED.obsm["spatial"] = full_coor
+        adata_SMLED.var.index = used_gene
+        adata.write(save_path + '/original_data.h5ad')
+        if experiment=='generation' or experiment=='higher_res':
+            adata_SMLED.write(save_path + '/generated_data.h5ad')
+            return adata_SMLED
+        elif experiment=='recovery':
+            adata_sample.write(save_path + '/sampled_data.h5ad')
+            adata_SMLED.obs = adata.obs
+            adata_SMLED.write(save_path + '/recovered_data.h5ad')
+            return adata_sample, adata_SMLED
+def fix_seed(seed):
+    #seed = 2025
+    os.environ['PYTHONHASHSEED'] = str(seed)
+    random.seed(seed)
+    np.random.seed(seed)
+    torch.manual_seed(seed)
+    torch.cuda.manual_seed(seed)
+    torch.cuda.manual_seed_all(seed)
+    cudnn.deterministic = True
+    cudnn.benchmark = False
+    # os.environ['CUBLAS_WORKSPACE_CONFIG'] = ':4096:8'