PyPI - biopipen - Versions diffs - 0.33.1__py3-none-any.whl → 0.34.0__py3-none-any.whl - Mend

biopipen 0.33.1py3-none-any.whl → 0.34.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of biopipen might be problematic. Click here for more details.

Files changed (149) hide show

biopipen/__init__.py +1 -1
biopipen/core/filters.py +10 -183
biopipen/core/proc.py +5 -3
biopipen/core/testing.py +8 -1
biopipen/ns/bam.py +40 -4
biopipen/ns/cnv.py +1 -1
biopipen/ns/cnvkit.py +1 -1
biopipen/ns/delim.py +1 -1
biopipen/ns/gsea.py +63 -37
biopipen/ns/misc.py +38 -0
biopipen/ns/plot.py +8 -0
biopipen/ns/scrna.py +290 -288
biopipen/ns/scrna_metabolic_landscape.py +207 -366
biopipen/ns/tcr.py +165 -97
biopipen/reports/bam/CNVpytor.svelte +4 -9
biopipen/reports/cnvkit/CNVkitDiagram.svelte +1 -1
biopipen/reports/cnvkit/CNVkitHeatmap.svelte +1 -1
biopipen/reports/cnvkit/CNVkitScatter.svelte +1 -1
biopipen/reports/{delim/SampleInfo.svelte → common.svelte} +2 -3
biopipen/reports/scrna/DimPlots.svelte +1 -1
biopipen/reports/scrna_metabolic_landscape/MetabolicFeatures.svelte +51 -22
biopipen/reports/scrna_metabolic_landscape/MetabolicPathwayActivity.svelte +46 -42
biopipen/reports/scrna_metabolic_landscape/MetabolicPathwayHeterogeneity.svelte +63 -6
biopipen/reports/snp/PlinkCallRate.svelte +2 -2
biopipen/reports/snp/PlinkFreq.svelte +1 -1
biopipen/reports/snp/PlinkHWE.svelte +1 -1
biopipen/reports/snp/PlinkHet.svelte +1 -1
biopipen/reports/snp/PlinkIBD.svelte +1 -1
biopipen/reports/tcr/CDR3AAPhyschem.svelte +1 -1
biopipen/scripts/bam/CNAClinic.R +41 -6
biopipen/scripts/bam/CNVpytor.py +2 -1
biopipen/scripts/bam/ControlFREEC.py +2 -3
biopipen/scripts/bam/SamtoolsView.py +33 -0
biopipen/scripts/cnv/AneuploidyScore.R +25 -13
biopipen/scripts/cnv/AneuploidyScoreSummary.R +218 -163
biopipen/scripts/cnv/TMADScore.R +4 -4
biopipen/scripts/cnv/TMADScoreSummary.R +51 -84
biopipen/scripts/cnvkit/CNVkitGuessBaits.py +3 -3
biopipen/scripts/cnvkit/CNVkitHeatmap.py +3 -3
biopipen/scripts/cnvkit/CNVkitReference.py +3 -3
biopipen/scripts/delim/RowsBinder.R +1 -1
biopipen/scripts/delim/SampleInfo.R +4 -1
biopipen/scripts/gene/GeneNameConversion.R +14 -12
biopipen/scripts/gsea/Enrichr.R +2 -2
biopipen/scripts/gsea/FGSEA.R +184 -50
biopipen/scripts/gsea/PreRank.R +3 -3
biopipen/scripts/misc/Plot.R +80 -0
biopipen/scripts/plot/VennDiagram.R +2 -2
biopipen/scripts/protein/ProdigySummary.R +34 -27
biopipen/scripts/regulatory/MotifAffinityTest.R +11 -9
biopipen/scripts/regulatory/MotifAffinityTest_AtSNP.R +5 -5
biopipen/scripts/regulatory/MotifAffinityTest_MotifBreakR.R +4 -4
biopipen/scripts/regulatory/VariantMotifPlot.R +10 -8
biopipen/scripts/regulatory/motifs-common.R +10 -9
biopipen/scripts/rnaseq/Simulation-ESCO.R +14 -11
biopipen/scripts/rnaseq/Simulation-RUVcorr.R +7 -4
biopipen/scripts/rnaseq/Simulation.R +0 -2
biopipen/scripts/rnaseq/UnitConversion.R +6 -5
biopipen/scripts/scrna/AnnData2Seurat.R +25 -73
biopipen/scripts/scrna/CellCellCommunication.py +1 -1
biopipen/scripts/scrna/CellCellCommunicationPlots.R +51 -168
biopipen/scripts/scrna/CellTypeAnnotation-celltypist.R +99 -150
biopipen/scripts/scrna/CellTypeAnnotation-direct.R +11 -9
biopipen/scripts/scrna/CellTypeAnnotation-hitype.R +12 -9
biopipen/scripts/scrna/CellTypeAnnotation-sccatch.R +14 -11
biopipen/scripts/scrna/CellTypeAnnotation-sctype.R +19 -16
biopipen/scripts/scrna/CellTypeAnnotation.R +10 -2
biopipen/scripts/scrna/CellsDistribution.R +1 -1
biopipen/scripts/scrna/ExprImputation-alra.R +87 -11
biopipen/scripts/scrna/ExprImputation-rmagic.R +247 -21
biopipen/scripts/scrna/ExprImputation-scimpute.R +8 -5
biopipen/scripts/scrna/MarkersFinder.R +348 -217
biopipen/scripts/scrna/MetaMarkers.R +3 -3
biopipen/scripts/scrna/ModuleScoreCalculator.R +14 -13
biopipen/scripts/scrna/RadarPlots.R +1 -1
biopipen/scripts/scrna/ScFGSEA.R +157 -75
biopipen/scripts/scrna/ScSimulation.R +11 -10
biopipen/scripts/scrna/ScVelo.py +605 -0
biopipen/scripts/scrna/Seurat2AnnData.R +2 -3
biopipen/scripts/scrna/SeuratClusterStats-clustree.R +1 -1
biopipen/scripts/scrna/SeuratClusterStats-features.R +39 -30
biopipen/scripts/scrna/SeuratClusterStats-ngenes.R +56 -65
biopipen/scripts/scrna/SeuratClusterStats-stats.R +4 -4
biopipen/scripts/scrna/SeuratClusterStats.R +9 -6
biopipen/scripts/scrna/SeuratClustering.R +31 -48
biopipen/scripts/scrna/SeuratLoading.R +2 -2
biopipen/scripts/scrna/SeuratMap2Ref.R +66 -367
biopipen/scripts/scrna/SeuratMetadataMutater.R +5 -7
biopipen/scripts/scrna/SeuratPreparing.R +76 -24
biopipen/scripts/scrna/SeuratSubClustering.R +46 -185
biopipen/scripts/scrna/{SlingShot.R → Slingshot.R} +12 -16
biopipen/scripts/scrna/Subset10X.R +2 -2
biopipen/scripts/scrna/TopExpressingGenes.R +141 -184
biopipen/scripts/scrna/celltypist-wrapper.py +6 -4
biopipen/scripts/scrna/seurat_anndata_conversion.py +81 -0
biopipen/scripts/scrna_metabolic_landscape/MetabolicFeatures.R +429 -123
biopipen/scripts/scrna_metabolic_landscape/MetabolicPathwayActivity.R +346 -245
biopipen/scripts/scrna_metabolic_landscape/MetabolicPathwayHeterogeneity.R +182 -173
biopipen/scripts/snp/MatrixEQTL.R +39 -20
biopipen/scripts/snp/PlinkCallRate.R +43 -34
biopipen/scripts/snp/PlinkFreq.R +34 -41
biopipen/scripts/snp/PlinkHWE.R +23 -18
biopipen/scripts/snp/PlinkHet.R +26 -22
biopipen/scripts/snp/PlinkIBD.R +30 -34
biopipen/scripts/stats/ChowTest.R +9 -8
biopipen/scripts/stats/DiffCoexpr.R +13 -11
biopipen/scripts/stats/LiquidAssoc.R +7 -8
biopipen/scripts/stats/Mediation.R +8 -8
biopipen/scripts/stats/MetaPvalue.R +11 -13
biopipen/scripts/stats/MetaPvalue1.R +6 -5
biopipen/scripts/tcr/CDR3AAPhyschem.R +105 -164
biopipen/scripts/tcr/ClonalStats.R +5 -4
biopipen/scripts/tcr/CloneResidency.R +3 -3
biopipen/scripts/tcr/CloneSizeQQPlot.R +2 -2
biopipen/scripts/tcr/Immunarch2VDJtools.R +2 -2
biopipen/scripts/tcr/ImmunarchFilter.R +3 -3
biopipen/scripts/tcr/ImmunarchLoading.R +5 -5
biopipen/scripts/tcr/ScRepCombiningExpression.R +39 -0
biopipen/scripts/tcr/ScRepLoading.R +114 -92
biopipen/scripts/tcr/TCRClusterStats.R +2 -2
biopipen/scripts/tcr/TCRClustering.R +86 -97
biopipen/scripts/tcr/TESSA.R +65 -115
biopipen/scripts/tcr/VJUsage.R +5 -5
biopipen/scripts/vcf/TruvariBenchSummary.R +15 -11
biopipen/utils/common_docstrs.py +66 -63
biopipen/utils/reporter.py +177 -0
{biopipen-0.33.1.dist-info → biopipen-0.34.0.dist-info}/METADATA +2 -1
{biopipen-0.33.1.dist-info → biopipen-0.34.0.dist-info}/RECORD +130 -144
{biopipen-0.33.1.dist-info → biopipen-0.34.0.dist-info}/WHEEL +1 -1
biopipen/reports/scrna/CellCellCommunicationPlots.svelte +0 -14
biopipen/reports/scrna/SeuratClusterStats.svelte +0 -16
biopipen/reports/scrna/SeuratMap2Ref.svelte +0 -37
biopipen/reports/scrna/SeuratPreparing.svelte +0 -15
biopipen/reports/scrna_metabolic_landscape/MetabolicFeaturesIntraSubset.svelte +0 -28
biopipen/reports/utils/gsea.liq +0 -110
biopipen/scripts/scrna/CellTypeAnnotation-common.R +0 -10
biopipen/scripts/scrna/SeuratClustering-common.R +0 -213
biopipen/scripts/scrna_metabolic_landscape/MetabolicFeaturesIntraSubset.R +0 -193
biopipen/utils/caching.R +0 -44
biopipen/utils/gene.R +0 -95
biopipen/utils/gsea.R +0 -329
biopipen/utils/io.R +0 -20
biopipen/utils/misc.R +0 -602
biopipen/utils/mutate_helpers.R +0 -581
biopipen/utils/plot.R +0 -209
biopipen/utils/repr.R +0 -146
biopipen/utils/rnaseq.R +0 -48
biopipen/utils/single_cell.R +0 -207
{biopipen-0.33.1.dist-info → biopipen-0.34.0.dist-info}/entry_points.txt +0 -0

biopipen/scripts/scrna/ScVelo.py CHANGED Viewed

@@ -0,0 +1,605 @@
+from __future__ import annotations
+import os
+import warnings
+from pathlib import Path
+from diot import Diot  # type: ignore[import]
+import scanpy as sc
+import scvelo as scv
+import numpy as np
+import matplotlib.pyplot as plt
+from biopipen.utils.misc import logger
+from biopipen.scripts.scrna.seurat_anndata_conversion import (
+    convert_seurat_to_anndata,
+    convert_anndata_to_seurat,
+)
+def SCVELO(
+    adata,
+    group_by,
+    dirpath,
+    logger,
+    palette=None,
+    linear_reduction=None,
+    nonlinear_reduction=None,
+    basis=None,
+    mode=["deterministic", "stochastic", "dynamical"],
+    fitting_by="stochastic",
+    min_shared_counts=30,
+    n_pcs=30,
+    n_neighbors=30,
+    stream_smooth=None,
+    stream_density=2,
+    arrow_size=5,
+    arrow_length=5,
+    arrow_density=0.5,
+    denoise=False,
+    denoise_topn=3,
+    kinetics=False,
+    kinetics_topn=100,
+    calculate_velocity_genes=False,
+    top_n=6,
+    ncores=1,
+    dpi=100,
+    fileprefix="",
+):
+    warnings.simplefilter("ignore", category=UserWarning)
+    warnings.simplefilter("ignore", category=FutureWarning)
+    warnings.simplefilter("ignore", category=DeprecationWarning)
+    os.chdir(os.path.expanduser(dirpath))
+    if linear_reduction is None:
+        sc.pp.pca(adata, n_comps=n_pcs)
+        linear_reduction = "X_pca"
+    elif linear_reduction not in adata.obsm.keys():
+        logger.warning(
+            f"Linear reduction '{linear_reduction}' not found in adata.obsm. "
+            "Running PCA to generate it."
+        )
+        sc.pp.pca(adata, n_comps=n_pcs)
+        linear_reduction = "X_pca"
+    if basis is None:
+        if nonlinear_reduction is not None:
+            basis = nonlinear_reduction
+        else:
+            basis = "basis"
+            adata.obsm["X_basis"] = adata.obsm[linear_reduction][
+                :, 0:2
+            ]
+    scv.pl.utils.check_basis(adata, basis)
+    if "spliced" not in adata.layers.keys():
+        raise ValueError("'spliced' data must be provided.")
+    if "unspliced" not in adata.layers.keys():
+        raise ValueError("'unspliced' data must be provided.")
+    if type(mode) is str:
+        mode = [mode]
+    mode.append(fitting_by)
+    if kinetics is True or denoise is True:
+        mode.append("dynamical")
+    mode = list(set(mode))
+    if "dynamical" in mode:
+        mode.sort(key="dynamical".__eq__)
+    adata.obs[group_by] = adata.obs[group_by].astype(dtype="category")
+    scv.pl.proportions(adata, groupby=group_by, save=False, show=False)
+    plt.savefig(
+        ".".join(filter(None, [fileprefix, "proportions.png"])), dpi=dpi
+    )
+    logger.info("- Filtering and normalizing data ...")
+    scv.pp.filter_and_normalize(adata, min_shared_counts=min_shared_counts)
+    logger.info("- Running moments ...")
+    # adata.var['highly_variable_genes'].astype(bool)
+    # adata.var['highly_variable_genes'].fillna(False, inplace=True)
+    scv.pp.moments(
+        adata, n_pcs=n_pcs, n_neighbors=n_neighbors, use_rep=linear_reduction
+    )
+    highly_variable_genes = adata.var["highly_variable_genes"].index.tolist()
+    adata.uns["layer_features_RNA"] = highly_variable_genes
+    adata.uns["layer_features_spliced"] = highly_variable_genes
+    adata.uns["layer_features_unspliced"] = highly_variable_genes
+    for m in mode:
+        vkey_list = [m]
+        dk_list = [False]
+        gene_subset_list = [None]
+        autoscale_list = [True]
+        logger.info(f"- mode: {m}")
+        adata.uns["layer_features_" + m] = highly_variable_genes
+        adata.uns["layer_features_variance_" + m] = highly_variable_genes
+        if m == "dynamical":
+            adata2 = adata[:, adata.var[fitting_by + "_genes"]].copy()
+            Ms = adata2.layers["Ms"]
+            Mu = adata2.layers["Mu"]
+            adata2.layers.clear()
+            adata2.layers["Ms"] = Ms
+            adata2.layers["Mu"] = Mu
+            connectivities = adata2.obsp["connectivities"]
+            adata2.obsp.clear()
+            adata2.obsp["connectivities"] = connectivities
+            adata.uns["layer_features_Ms"] = highly_variable_genes
+            adata.uns["layer_features_Mu"] = highly_variable_genes
+            scv.tl.recover_dynamics(
+                adata2,
+                var_names=fitting_by + "_genes",
+                use_raw=False,
+                n_jobs=ncores,
+            )
+            var_add = [
+                i
+                for i in list(adata2.var.columns)
+                if not i in list(adata.var.columns)
+            ]
+            adata.var = adata.var.merge(
+                adata2.var[var_add], how="left", left_index=True, right_index=True
+            )
+            adata.uns["recover_dynamics"] = adata2.uns["recover_dynamics"]
+            adata.varm["loss"] = np.empty(
+                (adata.shape[1], adata2.varm["loss"].shape[1])
+            )
+            adata.varm["loss"][:] = np.nan
+            adata.varm["loss"][adata.var[fitting_by + "_genes"], :] = adata2.varm[
+                "loss"
+            ]
+            empty_layer = np.empty((adata.layers["spliced"].shape))
+            empty_layer[:] = np.nan
+            adata.layers["fit_t"] = adata.layers["fit_tau"] = adata.layers[
+                "fit_tau_"
+            ] = empty_layer
+            adata.layers["fit_t"][:, adata.var[fitting_by + "_genes"]] = (
+                adata2.layers["fit_t"]
+            )
+            adata.layers["fit_tau"][:, adata.var[fitting_by + "_genes"]] = (
+                adata2.layers["fit_tau"]
+            )
+            adata.layers["fit_tau_"][:, adata.var[fitting_by + "_genes"]] = (
+                adata2.layers["fit_tau_"]
+            )
+            adata.uns["layer_features_fit_t"] = highly_variable_genes
+            adata.uns["layer_features_fit_tau"] = highly_variable_genes
+            adata.uns["layer_features_fit_tau_"] = highly_variable_genes
+            if kinetics is True:
+                vkey_list.append("dynamical_kinetics")
+                dk_list.append(True)
+                gene_subset_list.append(None)
+                autoscale_list.append(True)
+                top_genes = (
+                    adata.var["fit_likelihood"]
+                    .sort_values(ascending=False)
+                    .index[:kinetics_topn]
+                )
+                scv.tl.differential_kinetic_test(
+                    adata, var_names=top_genes, groupby=group_by
+                )
+            if denoise is True:
+                vkey_list.append("dynamical_denoise")
+                dk_list.append(False)
+                gene_subset_list.append(
+                    adata.var["fit_likelihood"]
+                    .sort_values(ascending=False)
+                    .index[:denoise_topn]
+                )
+                autoscale_list.append(False)
+                adata.layers["dynamical_denoise"] = adata.layers[m] + np.random.normal(
+                    adata.layers[m], scale=adata.layers["Ms"].std(0)
+                )
+                adata.uns["layer_features_dynamical_denoise"] = highly_variable_genes
+        for i in range(len(vkey_list)):
+            vkey = vkey_list[i]
+            dk = dk_list[i]
+            gene_subset = gene_subset_list[i]
+            autoscale = autoscale_list[i]
+            # Velocity graph
+            scv.tl.velocity(adata, mode=m, vkey=vkey, diff_kinetics=dk)
+            scv.tl.velocity_graph(
+                adata,
+                vkey=vkey,
+                gene_subset=gene_subset,
+                n_neighbors=n_neighbors,
+                n_jobs=ncores,
+            )
+            if m == "dynamical":
+                adata.var["velocity_genes"] = adata.var[m + "_genes"]
+                adata.layers["velocity"] = adata.layers[m]
+                adata.layers["variance_u"] = adata.layers[m + "_u"]
+                adata.uns["layer_features_velocity"] = highly_variable_genes
+                adata.uns["layer_features_variance_u"] = highly_variable_genes
+                adata.uns["layer_features_dynamical_u"] = highly_variable_genes
+            else:
+                adata.var["velocity_gamma"] = adata.var[m + "_gamma"]
+                adata.var["velocity_r2"] = adata.var[m + "_r2"]
+                adata.var["velocity_genes"] = adata.var[m + "_genes"]
+                adata.layers["velocity"] = adata.layers[m]
+                # adata.layers["variance_velocity"] = adata.layers["variance_" + m]
+                adata.uns["layer_features_velocity"] = highly_variable_genes
+            # Velocity embedding
+            scv.tl.velocity_embedding(
+                adata, basis=basis, vkey=vkey, autoscale=autoscale
+            )
+            scv.pl.velocity_embedding_stream(
+                adata,
+                vkey=vkey,
+                basis=basis,
+                title=vkey,
+                color=group_by,
+                palette=palette,
+                smooth=stream_smooth,
+                density=stream_density,
+                legend_loc="none",
+                save=False,
+                show=False,
+            )
+            plt.savefig(
+                ".".join(filter(None, [fileprefix, vkey + "_stream.png"])),
+                dpi=dpi,
+            )
+            scv.pl.velocity_embedding(
+                adata,
+                vkey=vkey,
+                basis=basis,
+                title=vkey,
+                color=group_by,
+                palette=palette,
+                arrow_length=arrow_length,
+                arrow_size=arrow_size,
+                density=arrow_density,
+                linewidth=0.3,
+                save=False,
+                show=False,
+            )
+            plt.savefig(
+                ".".join(filter(None, [fileprefix, vkey + "_arrow.png"])),
+                dpi=dpi,
+            )
+            scv.pl.velocity_embedding_grid(
+                adata,
+                vkey=vkey,
+                basis=basis,
+                title=vkey,
+                color=group_by,
+                palette=palette,
+                arrow_length=arrow_length / 2,
+                arrow_size=arrow_size / 2,
+                density=arrow_density * 2,
+                save=False,
+                show=False,
+            )
+            plt.savefig(
+                ".".join(
+                    filter(None, [fileprefix, vkey + "_embedding_grid.png"])
+                ),
+                dpi=dpi,
+            )
+            # Velocity confidence
+            scv.tl.velocity_confidence(adata, vkey=vkey)
+            scv.pl.scatter(
+                adata,
+                basis=basis,
+                title=vkey + " length",
+                color=vkey + "_length",
+                cmap="coolwarm",
+                save=False,
+                show=False,
+            )
+            plt.savefig(
+                ".".join(filter(None, [fileprefix, vkey + "_length.png"])),
+                dpi=dpi,
+            )
+            scv.pl.scatter(
+                adata,
+                basis=basis,
+                title=vkey + " confidence",
+                color=vkey + "_confidence",
+                cmap="magma",
+                save=False,
+                show=False,
+            )
+            plt.savefig(
+                ".".join(filter(None, [fileprefix, vkey + "_confidence.png"])),
+                dpi=dpi,
+            )
+            # Terminal states
+            for term in [
+                "root_cells",
+                "end_points",
+                vkey + "_root_cells",
+                vkey + "_end_points",
+            ]:
+                if term in adata.obs.columns:
+                    adata.obs.drop(term, axis=1, inplace=True)
+            scv.tl.terminal_states(
+                adata,
+                vkey=vkey,
+            )
+            for term in ["root_cells", "end_points"]:
+                adata.obs[vkey + "_" + term] = adata.obs[term]
+                adata.obs.drop(term, axis=1, inplace=True)
+            # scv.pl.scatter(adata,basis=basis,title=vkey+" terminal_states",color_gradients=[vkey+'_root_cells', vkey+'_end_points'], legend_loc="best", save=False, show=False)
+            # if show_plot is True:
+            #   plt.show()
+            # if save:
+            #   plt.savefig('.'.join(filter(None, [fileprefix, vkey+"_terminal_states.png"])), dpi=dpi)
+            # Pseudotime
+            scv.tl.velocity_pseudotime(
+                adata,
+                vkey=vkey,
+                root_key=vkey + "_root_cells",
+                end_key=vkey + "_end_points",
+            )
+            scv.pl.scatter(
+                adata,
+                basis=basis,
+                title=vkey + " pseudotime",
+                color=vkey + "_pseudotime",
+                cmap="cividis",
+                save=False,
+                show=False,
+            )
+            plt.savefig(
+                ".".join(filter(None, [fileprefix, vkey + "_pseudotime.png"])),
+                dpi=dpi,
+            )
+            # Latent time
+            if m == "dynamical":
+                scv.tl.latent_time(
+                    adata,
+                    vkey=vkey,
+                    root_key=vkey + "_root_cells",
+                    end_key=vkey + "_end_points",
+                )
+                scv.pl.scatter(
+                    adata,
+                    basis=basis,
+                    title=vkey + " latent time",
+                    color="latent_time",
+                    color_map="cividis",
+                    save=False,
+                    show=False,
+                )
+                plt.savefig(
+                    ".".join(
+                        filter(None, [fileprefix, vkey + "_latent_time.png"])
+                    ),
+                    dpi=dpi,
+                )
+            # PAGA
+            adata.uns["neighbors"]["distances"] = adata.obsp["distances"]
+            adata.uns["neighbors"]["connectivities"] = adata.obsp["connectivities"]
+            scv.tl.paga(
+                adata,
+                groups=group_by,
+                vkey=vkey,
+                root_key=vkey + "_root_cells",
+                end_key=vkey + "_end_points",
+            )
+            scv.pl.paga(
+                adata,
+                title=vkey + " PAGA (" + group_by + ")",
+                node_colors=palette,
+                basis=basis,
+                alpha=0.5,
+                min_edge_width=2,
+                node_size_scale=1.5,  # type: ignore
+                legend_loc="none",
+                save=False,
+                show=False,
+            )
+            plt.savefig(
+                ".".join(filter(None, [fileprefix, vkey + "_paga.png"])),
+                dpi=dpi,
+            )
+            # Velocity genes
+            if calculate_velocity_genes is True:
+                if m != "dynamical":
+                    scv.tl.rank_velocity_genes(adata, vkey=vkey, groupby=group_by)
+                    adata.var[vkey + "_score"] = adata.var["spearmans_score"]
+                    df1 = scv.get_df(adata.uns["rank_velocity_genes"]["names"])
+                    adata.uns["rank_" + vkey + "_genenames"] = df1
+                    df2 = scv.get_df(adata.uns["rank_velocity_genes"]["scores"])
+                    adata.uns["rank_" + vkey + "_genescores"] = df2
+                    del adata.uns["rank_velocity_genes"]
+                else:
+                    scv.tl.rank_dynamical_genes(adata, groupby=group_by)
+                    df1 = scv.get_df(adata.uns["rank_dynamical_genes"]["names"])
+                    adata.uns["rank_" + vkey + "_genenames"] = df1
+                    df2 = scv.get_df(adata.uns["rank_dynamical_genes"]["scores"])
+                    adata.uns["rank_" + vkey + "_genescores"] = df2
+                    del adata.uns["rank_dynamical_genes"]
+                for cluster in df1.columns:
+                    # df1[0:1].values.ravel()[:12] ### by row
+                    scv.pl.scatter(
+                        adata,
+                        color=group_by,
+                        palette=palette,
+                        basis=df1[cluster].values[:top_n],
+                        vkey=vkey,
+                        size=10,
+                        linewidth=2,
+                        alpha=1,
+                        ylabel="cluster: " + cluster + "\nunspliced",
+                        add_linfit=True,
+                        add_rug=True,
+                        add_outline=True,
+                        ncols=3,
+                        frameon=True,
+                        save=False,
+                        show=False,
+                    )
+                    plt.savefig(
+                        ".".join(
+                            filter(
+                                None,
+                                [fileprefix, cluster, vkey + "_genes1.png"],
+                            )
+                        ),
+                        dpi=dpi,
+                    )
+                    scv.pl.velocity(
+                        adata,
+                        color=group_by,
+                        var_names=df1[cluster].values[:top_n],
+                        vkey=vkey,
+                        size=10,
+                        linewidth=2,
+                        alpha=1,
+                        ylabel="cluster: " + cluster + "\nunspliced",
+                        add_outline=True,
+                        basis=basis,
+                        color_map=["Blues", "YlOrRd"],
+                        ncols=2,
+                        save=False,
+                        show=False,
+                    )
+                    plt.savefig(
+                        ".".join(
+                            filter(
+                                None,
+                                [fileprefix, cluster, vkey + "_genes2.png"],
+                            )
+                        ),
+                        dpi=dpi,
+                    )
+    try:
+        adata.__dict__["_raw"].__dict__["_var"] = (
+            adata.__dict__["_raw"]
+            .__dict__["_var"]
+            .rename(columns={"_index": "features"})
+        )
+    except:
+        pass
+    return adata
+sobjfile: str = {{in.sobjfile | quote}}  # pyright: ignore  # noqa: E999
+outfile: str = {{out.outfile | quote}}  # pyright: ignore  # noqa: E999
+outdir: str = os.path.dirname(outfile)
+ncores: int = {{envs.ncores | repr}}  # pyright: ignore  # noqa: E999
+group_by: str | None = {{envs.group_by | repr}}  # pyright: ignore  # noqa: E999
+mode: str | list[str] = {{envs.mode | repr}}  # pyright: ignore  # noqa: E999
+fitting_by: str = {{envs.fitting_by | repr}}  # pyright: ignore  # noqa: E999
+min_shared_counts: int = {{envs.min_shared_counts | repr}}  # pyright: ignore  # noqa: E999
+n_pcs: int = {{envs.n_pcs | repr}}  # pyright: ignore  # noqa: E999
+n_neighbors: int = {{envs.n_neighbors | repr}}  # pyright: ignore  # noqa: E999
+denoise: bool = {{envs.denoise | repr}}  # pyright: ignore  # noqa: E999
+denoise_topn: int = {{envs.denoise_topn | repr}}  # pyright: ignore  # noqa: E999
+kinetics: bool = {{envs.kinetics | repr}}  # pyright: ignore  # noqa: E999
+kinetics_topn: int = {{envs.kinetics_topn | repr}}  # pyright: ignore  # noqa: E999
+calculate_velocity_genes: bool = {{envs.calculate_velocity_genes | repr}}  # pyright: ignore  # noqa: E999
+top_n: int = {{envs.top_n | repr}}  # pyright: ignore  # noqa: E999
+rscript: str = {{envs.rscript | repr}}  # pyright: ignore  # noqa: E999
+if group_by is None:
+    raise ValueError("The 'envs.group_by' parameter must be specified.")
+if sobjfile.endswith(".h5ad"):
+    h5ad_file = Path(sobjfile)
+else:
+    h5ad_file = Path(outfile).with_suffix(".input.h5ad")
+    logger.info("Converting Seurat object to AnnData (h5ad) format...")
+    convert_seurat_to_anndata(
+        input_file=sobjfile,
+        output_file=h5ad_file,
+        rscript=rscript,
+    )
+logger.info(f"Reading AnnData (h5ad) file ...")
+adata = sc.read_h5ad(h5ad_file)
+if group_by not in adata.obs.columns:
+    raise ValueError(
+        f"The group_by column envs.group_by = '{group_by}' is not found in the AnnData object."
+    )
+logger.info(f"Running scVelo analysis ...")
+if isinstance(mode, str):
+    mode = [mode]
+if not all([m in ["deterministic","stochastic","dynamical"] for m in mode]):
+    raise ValueError(
+        "The 'envs.mode' parameter must be one or more of 'deterministic', 'stochastic', or 'dynamical'."
+    )
+if not fitting_by in ["deterministic","stochastic"]:
+    raise ValueError(
+        "The 'envs.fitting_by' parameter must be either 'deterministic' or 'stochastic'."
+    )
+adata = SCVELO(
+    adata=adata,
+    group_by=group_by,
+    dirpath=outdir,
+    linear_reduction="X_pca",
+    mode=mode,
+    fitting_by=fitting_by,
+    min_shared_counts=min_shared_counts,
+    n_pcs=n_pcs,
+    n_neighbors=n_neighbors,
+    stream_smooth=None,
+    stream_density=2,
+    arrow_size=5,
+    arrow_length=5,
+    arrow_density=0.5,
+    denoise=denoise,
+    denoise_topn=denoise_topn,
+    kinetics=kinetics,
+    kinetics_topn=kinetics_topn,
+    calculate_velocity_genes=calculate_velocity_genes,
+    top_n=top_n,
+    ncores=ncores,
+    logger=logger,
+)
+if outfile.endswith(".h5ad"):
+    h5ad_file = Path(outfile)
+else:
+    h5ad_file = Path(outfile).with_suffix(".output.h5ad")
+logger.info(f"Writing object to AnnData (h5ad) file ...")
+adata.write_h5ad(h5ad_file)
+if not outfile.endswith(".h5ad"):
+    logger.info(f"Converting AnnData (h5ad) file to Seurat format ...")
+    convert_anndata_to_seurat(
+        input_file=h5ad_file,
+        output_file=outfile,
+        rscript=rscript,
+    )

biopipen/scripts/scrna/Seurat2AnnData.R CHANGED Viewed

@@ -1,8 +1,7 @@
-{{ biopipen_dir | joinpaths: "utils", "misc.R" | source_r }}
-{{ biopipen_dir | joinpaths: "utils", "single_cell.R" | source_r }}
+library(biopipen.utils)
 sobjfile <- {{in.sobjfile | r}}
 outfile <- {{out.outfile | r}}
 assay <- {{envs.assay | r}}
-seurat_to_anndata(sobjfile, outfile, assay, log_info)
+ConvertSeuratToAnnData(sobjfile, outfile = outfile, assay = assay)

biopipen/scripts/scrna/SeuratClusterStats-clustree.R CHANGED Viewed

@@ -55,7 +55,7 @@ if (
             if (save_code) {
                 save_plotcode(p, plot_prefix,
-                    setup = c("library(scplotter)", "load('data.RData')", "invisible(list2env('case'))"),
+                    setup = c("library(scplotter)", "load('data.RData')", "invisible(list2env(case, envir = .GlobalEnv))"),
                     "case",
                     auto_data_setup = FALSE)
             }

biopipen 0.33.1__py3-none-any.whl → 0.34.0__py3-none-any.whl

Potentially problematic release.

biopipen 0.33.1py3-none-any.whl → 0.34.0py3-none-any.whl