PyPI - biopipen - Versions diffs - 0.21.0__py3-none-any.whl → 0.34.26__py3-none-any.whl - Mend

biopipen 0.21.0py3-none-any.whl → 0.34.26py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (290) hide show

biopipen/__init__.py +1 -1
biopipen/core/config.toml +28 -0
biopipen/core/filters.py +79 -4
biopipen/core/proc.py +12 -3
biopipen/core/testing.py +75 -3
biopipen/ns/bam.py +148 -6
biopipen/ns/bed.py +75 -0
biopipen/ns/cellranger.py +186 -0
biopipen/ns/cellranger_pipeline.py +126 -0
biopipen/ns/cnv.py +19 -3
biopipen/ns/cnvkit.py +1 -1
biopipen/ns/cnvkit_pipeline.py +20 -12
biopipen/ns/delim.py +34 -35
biopipen/ns/gene.py +68 -23
biopipen/ns/gsea.py +63 -37
biopipen/ns/misc.py +39 -14
biopipen/ns/plot.py +304 -1
biopipen/ns/protein.py +183 -0
biopipen/ns/regulatory.py +290 -0
biopipen/ns/rnaseq.py +142 -5
biopipen/ns/scrna.py +2053 -473
biopipen/ns/scrna_metabolic_landscape.py +228 -382
biopipen/ns/snp.py +659 -0
biopipen/ns/stats.py +484 -0
biopipen/ns/tcr.py +683 -98
biopipen/ns/vcf.py +236 -2
biopipen/ns/web.py +97 -6
biopipen/reports/bam/CNVpytor.svelte +4 -9
biopipen/reports/cellranger/CellRangerCount.svelte +18 -0
biopipen/reports/cellranger/CellRangerSummary.svelte +16 -0
biopipen/reports/cellranger/CellRangerVdj.svelte +18 -0
biopipen/reports/cnvkit/CNVkitDiagram.svelte +1 -1
biopipen/reports/cnvkit/CNVkitHeatmap.svelte +1 -1
biopipen/reports/cnvkit/CNVkitScatter.svelte +1 -1
biopipen/reports/common.svelte +15 -0
biopipen/reports/protein/ProdigySummary.svelte +16 -0
biopipen/reports/scrna/CellsDistribution.svelte +4 -39
biopipen/reports/scrna/DimPlots.svelte +1 -1
biopipen/reports/scrna/MarkersFinder.svelte +6 -126
biopipen/reports/scrna/MetaMarkers.svelte +3 -75
biopipen/reports/scrna/RadarPlots.svelte +4 -20
biopipen/reports/scrna_metabolic_landscape/MetabolicFeatures.svelte +61 -22
biopipen/reports/scrna_metabolic_landscape/MetabolicPathwayActivity.svelte +88 -82
biopipen/reports/scrna_metabolic_landscape/MetabolicPathwayHeterogeneity.svelte +70 -10
biopipen/reports/snp/PlinkCallRate.svelte +24 -0
biopipen/reports/snp/PlinkFreq.svelte +18 -0
biopipen/reports/snp/PlinkHWE.svelte +18 -0
biopipen/reports/snp/PlinkHet.svelte +18 -0
biopipen/reports/snp/PlinkIBD.svelte +18 -0
biopipen/reports/tcr/CDR3AAPhyschem.svelte +19 -66
biopipen/reports/tcr/ClonalStats.svelte +16 -0
biopipen/reports/tcr/CloneResidency.svelte +3 -93
biopipen/reports/tcr/Immunarch.svelte +4 -155
biopipen/reports/tcr/TCRClusterStats.svelte +3 -45
biopipen/reports/tcr/TESSA.svelte +11 -28
biopipen/reports/utils/misc.liq +22 -7
biopipen/scripts/bam/BamMerge.py +11 -15
biopipen/scripts/bam/BamSampling.py +90 -0
biopipen/scripts/bam/BamSort.py +141 -0
biopipen/scripts/bam/BamSplitChroms.py +10 -10
biopipen/scripts/bam/BamSubsetByBed.py +38 -0
biopipen/scripts/bam/CNAClinic.R +41 -5
biopipen/scripts/bam/CNVpytor.py +153 -54
biopipen/scripts/bam/ControlFREEC.py +13 -14
biopipen/scripts/bam/SamtoolsView.py +33 -0
biopipen/scripts/bed/Bed2Vcf.py +5 -5
biopipen/scripts/bed/BedConsensus.py +5 -5
biopipen/scripts/bed/BedLiftOver.sh +6 -4
biopipen/scripts/bed/BedtoolsIntersect.py +54 -0
biopipen/scripts/bed/BedtoolsMakeWindows.py +47 -0
biopipen/scripts/bed/BedtoolsMerge.py +4 -4
biopipen/scripts/cellranger/CellRangerCount.py +138 -0
biopipen/scripts/cellranger/CellRangerSummary.R +181 -0
biopipen/scripts/cellranger/CellRangerVdj.py +112 -0
biopipen/scripts/cnv/AneuploidyScore.R +55 -20
biopipen/scripts/cnv/AneuploidyScoreSummary.R +221 -163
biopipen/scripts/cnv/TMADScore.R +25 -9
biopipen/scripts/cnv/TMADScoreSummary.R +57 -86
biopipen/scripts/cnvkit/CNVkitAccess.py +7 -6
biopipen/scripts/cnvkit/CNVkitAutobin.py +26 -18
biopipen/scripts/cnvkit/CNVkitBatch.py +6 -6
biopipen/scripts/cnvkit/CNVkitCall.py +3 -3
biopipen/scripts/cnvkit/CNVkitCoverage.py +4 -3
biopipen/scripts/cnvkit/CNVkitDiagram.py +5 -5
biopipen/scripts/cnvkit/CNVkitFix.py +3 -3
biopipen/scripts/cnvkit/CNVkitGuessBaits.py +12 -8
biopipen/scripts/cnvkit/CNVkitHeatmap.py +5 -5
biopipen/scripts/cnvkit/CNVkitReference.py +6 -5
biopipen/scripts/cnvkit/CNVkitScatter.py +5 -5
biopipen/scripts/cnvkit/CNVkitSegment.py +5 -5
biopipen/scripts/cnvkit/guess_baits.py +166 -93
biopipen/scripts/delim/RowsBinder.R +1 -1
biopipen/scripts/delim/SampleInfo.R +116 -118
biopipen/scripts/gene/GeneNameConversion.R +67 -0
biopipen/scripts/gene/GenePromoters.R +61 -0
biopipen/scripts/gsea/Enrichr.R +5 -5
biopipen/scripts/gsea/FGSEA.R +184 -50
biopipen/scripts/gsea/GSEA.R +2 -2
biopipen/scripts/gsea/PreRank.R +5 -5
biopipen/scripts/misc/Config2File.py +2 -2
biopipen/scripts/misc/Plot.R +80 -0
biopipen/scripts/misc/Shell.sh +15 -0
biopipen/scripts/misc/Str2File.py +2 -2
biopipen/scripts/plot/Heatmap.R +3 -3
biopipen/scripts/plot/Manhattan.R +147 -0
biopipen/scripts/plot/QQPlot.R +146 -0
biopipen/scripts/plot/ROC.R +88 -0
biopipen/scripts/plot/Scatter.R +112 -0
biopipen/scripts/plot/VennDiagram.R +5 -9
biopipen/scripts/protein/MMCIF2PDB.py +33 -0
biopipen/scripts/protein/PDB2Fasta.py +60 -0
biopipen/scripts/protein/Prodigy.py +119 -0
biopipen/scripts/protein/ProdigySummary.R +140 -0
biopipen/scripts/protein/RMSD.py +178 -0
biopipen/scripts/regulatory/MotifAffinityTest.R +102 -0
biopipen/scripts/regulatory/MotifAffinityTest_AtSNP.R +127 -0
biopipen/scripts/regulatory/MotifAffinityTest_MotifBreakR.R +104 -0
biopipen/scripts/regulatory/MotifScan.py +159 -0
biopipen/scripts/regulatory/VariantMotifPlot.R +78 -0
biopipen/scripts/regulatory/motifs-common.R +324 -0
biopipen/scripts/rnaseq/Simulation-ESCO.R +180 -0
biopipen/scripts/rnaseq/Simulation-RUVcorr.R +45 -0
biopipen/scripts/rnaseq/Simulation.R +21 -0
biopipen/scripts/rnaseq/UnitConversion.R +325 -54
biopipen/scripts/scrna/AnnData2Seurat.R +40 -0
biopipen/scripts/scrna/CCPlotR-patch.R +161 -0
biopipen/scripts/scrna/CellCellCommunication.py +150 -0
biopipen/scripts/scrna/CellCellCommunicationPlots.R +93 -0
biopipen/scripts/scrna/CellSNPLite.py +30 -0
biopipen/scripts/scrna/CellTypeAnnotation-celltypist.R +185 -0
biopipen/scripts/scrna/CellTypeAnnotation-direct.R +68 -31
biopipen/scripts/scrna/CellTypeAnnotation-hitype.R +27 -22
biopipen/scripts/scrna/CellTypeAnnotation-sccatch.R +28 -20
biopipen/scripts/scrna/CellTypeAnnotation-sctype.R +48 -25
biopipen/scripts/scrna/CellTypeAnnotation.R +37 -1
biopipen/scripts/scrna/CellsDistribution.R +456 -167
biopipen/scripts/scrna/DimPlots.R +1 -1
biopipen/scripts/scrna/ExprImputation-alra.R +109 -0
biopipen/scripts/scrna/ExprImputation-rmagic.R +256 -0
biopipen/scripts/scrna/{ExprImpution-scimpute.R → ExprImputation-scimpute.R} +8 -5
biopipen/scripts/scrna/ExprImputation.R +7 -0
biopipen/scripts/scrna/LoomTo10X.R +51 -0
biopipen/scripts/scrna/MQuad.py +25 -0
biopipen/scripts/scrna/MarkersFinder.R +679 -400
biopipen/scripts/scrna/MetaMarkers.R +265 -161
biopipen/scripts/scrna/ModuleScoreCalculator.R +66 -11
biopipen/scripts/scrna/PseudoBulkDEG.R +678 -0
biopipen/scripts/scrna/RadarPlots.R +355 -134
biopipen/scripts/scrna/ScFGSEA.R +298 -100
biopipen/scripts/scrna/ScSimulation.R +65 -0
biopipen/scripts/scrna/ScVelo.py +617 -0
biopipen/scripts/scrna/Seurat2AnnData.R +7 -0
biopipen/scripts/scrna/SeuratClusterStats-clustree.R +87 -0
biopipen/scripts/scrna/SeuratClusterStats-dimplots.R +36 -30
biopipen/scripts/scrna/SeuratClusterStats-features.R +138 -187
biopipen/scripts/scrna/SeuratClusterStats-ngenes.R +81 -0
biopipen/scripts/scrna/SeuratClusterStats-stats.R +78 -89
biopipen/scripts/scrna/SeuratClusterStats.R +47 -10
biopipen/scripts/scrna/SeuratClustering.R +36 -233
biopipen/scripts/scrna/SeuratLoading.R +2 -2
biopipen/scripts/scrna/SeuratMap2Ref.R +84 -113
biopipen/scripts/scrna/SeuratMetadataMutater.R +16 -6
biopipen/scripts/scrna/SeuratPreparing.R +223 -173
biopipen/scripts/scrna/SeuratSubClustering.R +64 -0
biopipen/scripts/scrna/SeuratTo10X.R +27 -0
biopipen/scripts/scrna/Slingshot.R +65 -0
biopipen/scripts/scrna/Subset10X.R +2 -2
biopipen/scripts/scrna/TopExpressingGenes.R +169 -135
biopipen/scripts/scrna/celltypist-wrapper.py +195 -0
biopipen/scripts/scrna/scvelo_paga.py +313 -0
biopipen/scripts/scrna/seurat_anndata_conversion.py +98 -0
biopipen/scripts/scrna_metabolic_landscape/MetabolicFeatures.R +447 -82
biopipen/scripts/scrna_metabolic_landscape/MetabolicPathwayActivity.R +348 -241
biopipen/scripts/scrna_metabolic_landscape/MetabolicPathwayHeterogeneity.R +188 -166
biopipen/scripts/snp/MatrixEQTL.R +217 -0
biopipen/scripts/snp/Plink2GTMat.py +148 -0
biopipen/scripts/snp/PlinkCallRate.R +199 -0
biopipen/scripts/snp/PlinkFilter.py +100 -0
biopipen/scripts/snp/PlinkFreq.R +291 -0
biopipen/scripts/snp/PlinkFromVcf.py +81 -0
biopipen/scripts/snp/PlinkHWE.R +85 -0
biopipen/scripts/snp/PlinkHet.R +96 -0
biopipen/scripts/snp/PlinkIBD.R +196 -0
biopipen/scripts/snp/PlinkSimulation.py +124 -0
biopipen/scripts/snp/PlinkUpdateName.py +124 -0
biopipen/scripts/stats/ChowTest.R +146 -0
biopipen/scripts/stats/DiffCoexpr.R +152 -0
biopipen/scripts/stats/LiquidAssoc.R +135 -0
biopipen/scripts/stats/Mediation.R +108 -0
biopipen/scripts/stats/MetaPvalue.R +130 -0
biopipen/scripts/stats/MetaPvalue1.R +74 -0
biopipen/scripts/tcgamaf/Maf2Vcf.py +2 -2
biopipen/scripts/tcgamaf/MafAddChr.py +2 -2
biopipen/scripts/tcr/Attach2Seurat.R +3 -2
biopipen/scripts/tcr/CDR3AAPhyschem.R +211 -143
biopipen/scripts/tcr/CDR3Clustering.R +343 -0
biopipen/scripts/tcr/ClonalStats.R +526 -0
biopipen/scripts/tcr/CloneResidency.R +255 -131
biopipen/scripts/tcr/CloneSizeQQPlot.R +4 -4
biopipen/scripts/tcr/GIANA/GIANA.py +1356 -797
biopipen/scripts/tcr/GIANA/GIANA4.py +1362 -789
biopipen/scripts/tcr/GIANA/query.py +164 -162
biopipen/scripts/tcr/Immunarch-basic.R +31 -9
biopipen/scripts/tcr/Immunarch-clonality.R +25 -5
biopipen/scripts/tcr/Immunarch-diversity.R +352 -134
biopipen/scripts/tcr/Immunarch-geneusage.R +45 -5
biopipen/scripts/tcr/Immunarch-kmer.R +68 -8
biopipen/scripts/tcr/Immunarch-overlap.R +84 -4
biopipen/scripts/tcr/Immunarch-spectratyping.R +35 -6
biopipen/scripts/tcr/Immunarch-tracking.R +38 -6
biopipen/scripts/tcr/Immunarch-vjjunc.R +165 -0
biopipen/scripts/tcr/Immunarch.R +63 -11
biopipen/scripts/tcr/Immunarch2VDJtools.R +2 -2
biopipen/scripts/tcr/ImmunarchFilter.R +4 -4
biopipen/scripts/tcr/ImmunarchLoading.R +38 -29
biopipen/scripts/tcr/SampleDiversity.R +1 -1
biopipen/scripts/tcr/ScRepCombiningExpression.R +40 -0
biopipen/scripts/tcr/ScRepLoading.R +166 -0
biopipen/scripts/tcr/TCRClusterStats.R +176 -22
biopipen/scripts/tcr/TCRDock.py +110 -0
biopipen/scripts/tcr/TESSA.R +102 -118
biopipen/scripts/tcr/VJUsage.R +5 -5
biopipen/scripts/tcr/immunarch-patched.R +142 -0
biopipen/scripts/tcr/vdjtools-patch.sh +1 -1
biopipen/scripts/vcf/BcftoolsAnnotate.py +91 -0
biopipen/scripts/vcf/BcftoolsFilter.py +90 -0
biopipen/scripts/vcf/BcftoolsMerge.py +31 -0
biopipen/scripts/vcf/BcftoolsSort.py +113 -0
biopipen/scripts/vcf/BcftoolsView.py +73 -0
biopipen/scripts/vcf/TruvariBench.sh +14 -7
biopipen/scripts/vcf/TruvariBenchSummary.R +16 -13
biopipen/scripts/vcf/TruvariConsistency.R +1 -1
biopipen/scripts/vcf/Vcf2Bed.py +2 -2
biopipen/scripts/vcf/VcfAnno.py +11 -11
biopipen/scripts/vcf/VcfDownSample.sh +22 -10
biopipen/scripts/vcf/VcfFilter.py +5 -5
biopipen/scripts/vcf/VcfFix.py +7 -7
biopipen/scripts/vcf/VcfFix_utils.py +13 -4
biopipen/scripts/vcf/VcfIndex.py +3 -3
biopipen/scripts/vcf/VcfIntersect.py +3 -3
biopipen/scripts/vcf/VcfLiftOver.sh +5 -0
biopipen/scripts/vcf/VcfSplitSamples.py +4 -4
biopipen/scripts/vcf/bcftools_utils.py +52 -0
biopipen/scripts/web/Download.py +8 -4
biopipen/scripts/web/DownloadList.py +5 -5
biopipen/scripts/web/GCloudStorageDownloadBucket.py +82 -0
biopipen/scripts/web/GCloudStorageDownloadFile.py +23 -0
biopipen/scripts/web/gcloud_common.py +49 -0
biopipen/utils/gene.py +108 -60
biopipen/utils/misc.py +146 -20
biopipen/utils/reference.py +64 -20
biopipen/utils/reporter.py +177 -0
biopipen/utils/vcf.py +1 -1
biopipen-0.34.26.dist-info/METADATA +27 -0
biopipen-0.34.26.dist-info/RECORD +292 -0
{biopipen-0.21.0.dist-info → biopipen-0.34.26.dist-info}/WHEEL +1 -1
{biopipen-0.21.0.dist-info → biopipen-0.34.26.dist-info}/entry_points.txt +6 -2
biopipen/ns/bcftools.py +0 -111
biopipen/ns/scrna_basic.py +0 -255
biopipen/reports/delim/SampleInfo.svelte +0 -36
biopipen/reports/scrna/GeneExpressionInvistigation.svelte +0 -32
biopipen/reports/scrna/ScFGSEA.svelte +0 -35
biopipen/reports/scrna/SeuratClusterStats.svelte +0 -82
biopipen/reports/scrna/SeuratMap2Ref.svelte +0 -20
biopipen/reports/scrna/SeuratPreparing.svelte +0 -38
biopipen/reports/scrna/TopExpressingGenes.svelte +0 -55
biopipen/reports/scrna_metabolic_landscape/MetabolicFeaturesIntraSubset.svelte +0 -31
biopipen/reports/utils/gsea.liq +0 -110
biopipen/scripts/bcftools/BcftoolsAnnotate.py +0 -42
biopipen/scripts/bcftools/BcftoolsFilter.py +0 -79
biopipen/scripts/bcftools/BcftoolsSort.py +0 -19
biopipen/scripts/gene/GeneNameConversion.py +0 -66
biopipen/scripts/scrna/ExprImpution-alra.R +0 -32
biopipen/scripts/scrna/ExprImpution-rmagic.R +0 -29
biopipen/scripts/scrna/ExprImpution.R +0 -7
biopipen/scripts/scrna/GeneExpressionInvistigation.R +0 -132
biopipen/scripts/scrna/Write10X.R +0 -11
biopipen/scripts/scrna_metabolic_landscape/MetabolicFeaturesIntraSubset.R +0 -150
biopipen/scripts/tcr/TCRClustering.R +0 -280
biopipen/utils/common_docstrs.py +0 -61
biopipen/utils/gene.R +0 -49
biopipen/utils/gsea.R +0 -193
biopipen/utils/io.R +0 -20
biopipen/utils/misc.R +0 -114
biopipen/utils/mutate_helpers.R +0 -433
biopipen/utils/plot.R +0 -173
biopipen/utils/rnaseq.R +0 -48
biopipen/utils/single_cell.R +0 -115
biopipen-0.21.0.dist-info/METADATA +0 -22
biopipen-0.21.0.dist-info/RECORD +0 -218

biopipen/reports/scrna/TopExpressingGenes.svelte DELETED Viewed

@@ -1,55 +0,0 @@
-{% from "utils/misc.liq" import report_jobs -%}
-{% from "utils/gsea.liq" import enrichr_report -%}
-<script>
-    import { Image, DataTable } from "$libs";
-    import { Tabs, Tab, TabContent, InlineNotification } from "$ccs";
-</script>
-{%- macro report_job(job, h=1) -%}
-    {%- set secdirs = job.out.outdir | glob: "*" -%}
-    {%- if len(secdirs) == 1 -%}
-        {%- set secname = secdirs | first | basename -%}
-        {%- for casedir in secdirs[0] | glob: "*" -%}
-            {%- if secname == "DEFAULT" -%}
-                <h{{h}}>{{casedir | basename | escape}}</h{{h}}>
-            {%- else -%}
-                <h{{h}}>{{secname | escape}} - {{casedir | basename | escape}}</h{{h}}>
-            {%- endif -%}
-            <h{{h+1}}>Markers</h{{h+1}}>
-            <DataTable
-                src={{ casedir | joinpaths: "exprn.txt" | quote }}
-                data={ {{ casedir | joinpaths: "exprn.txt" | datatable: sep="\t", nrows=100 }} }
-                />
-            <h{{h+1}}>Enrichment analysis</h{{h+1}}>
-            {{ enrichr_report(casedir) }}
-        {%- endfor -%}
-    {%- else -%}
-        {%- for secdir in secdirs -%}
-            {%- set sec = secdir | basename -%}
-            <h{{h}}>{{sec | escape}}</h{{h}}>
-            {%- for casedir in secdir | glob: "*" -%}
-                <h{{h+1}}>{{casedir | basename | escape}}</h{{h+1}}>
-                <h{{h+2}}>Markers</h{{h+2}}>
-                <DataTable
-                    src={{ casedir | joinpaths: "exprn.txt" | quote }}
-                    data={ {{ casedir | joinpaths: "exprn.txt" | datatable: sep="\t", nrows=100 }} }
-                    />
-                <h{{h+2}}>Enrichment analysis</h{{h+2}}>
-                {{ enrichr_report(casedir) }}
-            {%- endfor -%}
-        {%- endfor -%}
-    {%- endif -%}
-{%- endmacro -%}
-{%- macro head_job(job) -%}
-  <h1>{{job.in.srtobj | stem0 | escape}}</h1>
-{%- endmacro -%}
-{{ report_jobs(jobs, head_job, report_job) }}

biopipen/reports/scrna_metabolic_landscape/MetabolicFeaturesIntraSubset.svelte DELETED Viewed

@@ -1,31 +0,0 @@
-{% from "utils/misc.liq" import report_jobs, table_of_images -%}
-{% from "utils/gsea.liq" import fgsea_report, gsea_report -%}
-<script>
-  import { Image, DataTable } from "$libs";
-</script>
-{%- macro report_job(job, h=2) -%}
-  {%  for groupdir in job.out.outdir | glob: "*" %}
-    <h{{h}}>{{groupdir | basename}}</h{{h}}>
-    {%- set dsdirs = groupdir | glob: "*" -%}
-    {% for dsdir in groupdir | glob: "*" %}
-        <h{{h+1}}>{{ dsdir | basename }}</h{{h+1}}>
-        {% if envs.fgsea %}
-            {% if dsdir | joinpaths: "fgsea.txt" | isfile %}
-                {{ fgsea_report(dsdir, h+2, envs, envs.top) }}
-            {% else %}
-                <p>Not enough events.</p>
-            {% endif %}
-        {% else %}
-            {{ gsea_report(dsdir, h+2, envs, envs.top) }}
-        {% endif %}
-    {% endfor %}
-  {% endfor %}
-{%- endmacro -%}
-{%- macro head_job(job) -%}
-  <h1>{{job.in.sobjfile | stem | escape}}</h1>
-{%- endmacro -%}
-{{ report_jobs(jobs, head_job, report_job) }}

biopipen/reports/utils/gsea.liq DELETED Viewed

@@ -1,110 +0,0 @@
-{% from "utils/misc.liq" import table_of_images -%}
-{%- macro fgsea_report_script() -%}
-import { Image, DataTable } from "$libs";
-{%- endmacro -%}
-{%- macro fgsea_report(fgsea_dir, h, envs, nrows=100) -%}
-{%- addfilter splitgenes -%}
-def splitgenes(data):
-    for dat in data:
-        dat["leadingEdge"] = dat["leadingEdge"].replace(",", " ")
-    return json_dumps(data)
-{%- endaddfilter -%}
-<h{{h}}>Enrichment table</h{{h}}>
-<Image src={{ fgsea_dir | joinpaths: "gsea_table.png" | quote }} />
-{% set data = fgsea_dir | joinpaths: "fgsea.txt" | datatable: sep="\t", nrows=nrows | json_loads %}
-<h{{h}}>Enrichment pathways</h{{h}}>
-<DataTable src={{ fgsea_dir | joinpaths: "fgsea.txt" | quote }}
-    data={ {{ data | splitgenes: }} }
-    pageSize={10} />
-<h{{h}}>Enrichment plot of pathways</h{{h}}>
-{%- python -%}
-import os
-def fgsea_plots(pathways, fgsea_dir):
-    out = []
-    for pathway in pathways:
-        pathway = pathway.replace("/", "-")
-        pwfig = joinpaths(fgsea_dir, f"fgsea_{pathway}.png")
-        if os.path.exists(pwfig):
-            out.append(pwfig)
-    return out
-{%- endpython -%}
-{{ table_of_images(
-    fgsea_plots(liquid_map(data, "pathway"), fgsea_dir),
-    liquid_map(data, "pathway"),
-    table_width=75
-) }}
-{%- endmacro -%}
-{%- macro gsea_report(gsea_dir, h, envs, nrows=100) -%}
-<h{{h}}>Global view</h{{h}}>
-<embed src={{gsea_dir | joinpaths: "*.global.plots.pdf" | glob | first | quote}}
-    width="100%"
-    height="1000"
-    type="application/pdf" />
-<h{{h}}>Summary</h{{h}}>
-{% for sumfile in gsea_dir | joinpaths: "*.SUMMARY.RESULTS.REPORT.*.txt" | glob %}
-{%   set klass = stem(sumfile).split(".")[-1] %}
-<h{{h+1}}>{{klass}}</h{{h+1}}>
-<DataTable data={ {{sumfile | datatable: sep="\t", nrows=nrows}} } />
-{% endfor %}
-<h{{h}}>Enrichment details</h{{h}}>
-{% set cutoff = envs.get("fdr.q.val.threshold", envs.get("fdr_q_val_threshold", 0.25)) %}
-{% for sumfile in gsea_dir | joinpaths: "*.SUMMARY.RESULTS.REPORT.*.txt" | glob %}
-{%   set klass = stem(sumfile).split(".")[-1] %}
-<h{{h+1}}>{{klass}}</h{{h+1}}>
-{%   set sumdata = sumfile | datatable: sep="\t" | json_loads %}
-{%   set has_signif = [] %}
-{%   for row in sumdata %}
-{%      if row["FDR_q_val"] < cutoff %}
-{%          set _ = has_signif.append(1) %}
-<embed src={{gsea_dir | joinpaths: "*." + row["GS"] + ".plot." + klass + ".*.pdf" | glob | first | quote}}
-    width="100%"
-    height="700"
-    type="application/pdf" />
-{%      endif %}
-{%   endfor %}
-{%   if len(has_signif) == 0 %}
-<Tile>No significantly (FDR_q_val &lt; {{cutoff}}) enriched pathways found.</Tile>
-{%   endif %}
-{% endfor %}
-{%- endmacro -%}
-{%- macro enrichr_report_script() -%}
-import { Image, DataTable } from "$libs";
-import { Tabs, Tab, TabContent, InlineNotification } from "$ccs";
-{%- endmacro -%}
-{%- macro enrichr_report(enrichr_dir) -%}
-<Tabs>
-    {% for enrtxt in enrichr_dir | glob: "Enrichr-*.txt"  %}
-        {% set db = enrtxt | stem | replace: "Enrichr-", "" %}
-        <Tab label="{{db}}" title="{{db}}" />
-    {% endfor %}
-    <div slot="content">
-        {% for enrtxt in enrichr_dir | glob: "Enrichr-*.txt" %}
-            {% set db = enrtxt | stem | replace: "Enrichr-", "" %}
-            <TabContent>
-                <Image src={{enrichr_dir | joinpaths: "Enrichr-" + db + ".png" | quote}} />
-                <DataTable
-                    src={{ enrtxt | quote }}
-                    data={ {{ enrtxt | datatable: sep="\t", nrows=100 }} }
-                    />
-            </TabContent>
-        {% endfor %}
-    </div>
-</Tabs>
-{%- endmacro -%}

biopipen/scripts/bcftools/BcftoolsAnnotate.py DELETED Viewed

@@ -1,42 +0,0 @@
-from os import path
-from biopipen.utils.reference import tabix_index
-from biopipen.utils.misc import dict_to_cli_args, run_command
-infile = {{in.infile | repr}}  # pyright: ignore
-annfile = {{(in.annfile or envs.annfile) | repr}}  # pyright: ignore
-outfile = {{out.outfile | repr}}  # pyright: ignore
-joboutdir = {{job.outdir | repr}}  # pyright: ignore
-bcftools = {{envs.bcftools | repr}}  # pyright: ignore
-tabix = {{envs.tabix | repr}}  # pyright: ignore
-ncores = {{envs.ncores | repr}}  # pyright: ignore
-cols = {{envs.cols | repr}}  # pyright: ignore
-header = {{envs.header | repr}}  # pyright: ignore
-args = {{envs.args | repr}}  # pyright: ignore
-args[""] = bcftools
-args["_"] = tabix_index(infile, "vcf")
-args["o"] = outfile
-args["threads"] = ncores
-if annfile:
-    abname = path.basename(annfile)
-    ext = path.splitext(
-        abname[:-3] if abname.endswith('.gz') else abname
-    )[-1][1:]
-    args["a"] = tabix_index(annfile, ext, tabix)
-if cols and isinstance(cols, list):
-    args["c"] = ",".join(cols)
-if header:
-    if not isinstance(header, list):
-        header = [header]
-    headerfile = path.join(joboutdir, "header.txt")
-    with open(headerfile, "w") as fh:
-        for head in header:
-            fh.write(f"{head}\n")
-    args["h"] = headerfile
-run_command(dict_to_cli_args(args, dashify=True), fg=True)

biopipen/scripts/bcftools/BcftoolsFilter.py DELETED Viewed

@@ -1,79 +0,0 @@
-import shutil
-from pathlib import Path
-from hashlib import md5
-from biopipen.core.filters import dict_to_cli_args, run_command
-infile = {{in.infile | repr}}  # pyright: ignore
-outfile = {{out.outfile | repr}}  # pyright: ignore
-bcftools = {{envs.bcftools | repr}}  # pyright: ignore
-keep = {{envs.keep | repr}}  # pyright: ignore
-args = {{envs.args | repr}}  # pyright: ignore
-ncores = {{envs.ncores | repr}}  # pyright: ignore
-tmpdir = {{envs.tmpdir | repr}}  # pyright: ignore
-includes = {{envs.includes | repr}}  # pyright: ignore
-excludes = {{envs.excludes | repr}}  # pyright: ignore
-args[""] = bcftools
-args["_"] = infile
-args["o"] = outfile
-args["threads"] = ncores
-if "O" not in args and "output-type" not in args:
-    args["O"] = "z" if infile.endswith(".gz") else "v"
-if "m" not in args and "mode" not in args:
-    args["m"] = "+"
-tmpdir = (
-    Path(tmpdir) / f"biopipen-bcftoolsfilter-{md5(infile.encode()).hexdigest()}"
-)
-tmpdir.mkdir(parents=True, exist_ok=True)
-# a.vcf.gz -> a
-# a.vcf -> a
-stem = Path(infile).stem
-if stem.endswith(".vcf"):
-    stem = stem[:-4]
-# .vcf.gz
-# .gz
-ext = Path(infile).name[len(stem):]
-FILTER_INDEX = [1]
-def handle_filter(vcf, fname, filt, flag):
-    print("- Handling filter ", fname, ": ", filt, " ...")
-    arguments = args.copy()
-    arguments[flag] = filt
-    arguments["_"] = vcf
-    arguments["o"] = tmpdir / f"{stem}.{fname}{ext}"
-    if keep:
-        arguments["s"] = fname
-    run_command(dict_to_cli_args(arguments, dashify=True), fg=True)
-    return arguments["o"]
-def normalize_expr(expr, flag):
-    out = {}
-    if not expr:
-        return out
-    if isinstance(expr, list):
-        for ex in expr:
-            out[f"FILTER{FILTER_INDEX[0]}"] = (ex, flag)
-            FILTER_INDEX[0] += 1
-    elif isinstance(expr, dict):
-        for name, ex in expr.items():
-            out[name] = (ex, flag)
-    else: # str
-        out[f"FILTER{FILTER_INDEX[0]}"] = (expr, flag)
-        FILTER_INDEX[0] += 1
-    return out
-includes = normalize_expr(includes, "include")
-excludes = normalize_expr(excludes, "exclude")
-includes.update(excludes)
-# bcftools can be only done once at one filter
-for fname, (filt, flag) in includes.items():
-    infile = handle_filter(infile, fname, filt, flag)
-shutil.copy2(infile, outfile)

biopipen/scripts/bcftools/BcftoolsSort.py DELETED Viewed

@@ -1,19 +0,0 @@
-from biopipen.utils.misc import run_command, dict_to_cli_args
-infile = {{in.infile | quote}}  # pyright: ignore
-outfile = {{out.outfile | quote}}  # pyright: ignore
-bcftools = {{envs.bcftools | quote}}  # pyright: ignore
-gz = {{envs.gz | repr}}  # pyright: ignore
-args = {{envs.args | repr}}  # pyright: ignore
-tmpdir = {{envs.tmpdir | quote}}  # pyright: ignore
-index = {{envs.index | repr}}  # pyright: ignore
-args[""] = bcftools
-args["_"] = infile
-args["o"] = outfile
-args["O"] = "z" if gz or index else "v"
-run_command(dict_to_cli_args(args, dashify=True), fg=True)
-if index:
-    run_command([bcftools, "index", outfile], fg=True)

biopipen/scripts/gene/GeneNameConversion.py DELETED Viewed

@@ -1,66 +0,0 @@
-import pandas
-from datar.all import c, right_join, select, relocate
-from biopipen.utils.gene import gene_name_conversion
-infile = {{in.infile | quote}}  # pyright: ignore
-outfile = {{out.outfile | quote}}  # pyright: ignore
-inopts = {{envs.inopts | repr}}  # pyright: ignore
-outopts = {{envs.outopts | repr}}  # pyright: ignore
-notfound = {{envs.notfound | repr}}  # pyright: ignore
-genecol = {{envs.genecol | repr}}  # pyright: ignore
-output = {{envs.output | repr}}  # pyright: ignore
-infmt = {{envs.infmt | repr}}  # pyright: ignore
-outfmt = {{envs.outfmt | repr}}  # pyright: ignore
-species = {{envs.species | quote}}  # pyright: ignore
-df = pandas.read_csv(infile, **inopts)
-if isinstance(genecol, int):
-    genes = df.iloc[:, genecol]
-else:
-    genes = df.loc[:, genecol]
-colname = genes.name
-genes = genes.tolist()
-#        query  `outfmt`
-#     <object> <object>
-# 0  1255_g_at   GUCA1A
-# 1    1316_at     THRA
-# 2    1320_at   PTPN21
-# 3    1294_at  MIR5193
-converted = gene_name_conversion(
-    genes=genes,
-    species=species,
-    infmt=infmt,
-    outfmt=outfmt,
-    notfound=notfound,
-)
-converted.columns = [colname] + converted.columns[1:].tolist()
-if output == "only":
-    out = converted
-elif output == "keep":
-    out = df >> right_join(converted, by=colname, suffix=["", "_converted"])
-elif output == "drop":
-    out = df >> right_join(
-        converted,
-        by=colname, suffix=["", "_converted"]
-    ) >> select(~c(colname))
-elif output == "replace":
-    out = df >> right_join(
-        converted, by=colname, suffix=["", "_converted"]
-    )
-    converted_cols = out.columns[-len(converted.columns)+1:].tolist()
-    pos = df.columns.get_indexer([colname])[0]
-    out = out >> relocate(
-        converted_cols, _after=pos+1
-    ) >> select(~c(colname))
-else:
-    raise ValueError(f"Unknown output mode: {output}.")
-out.to_csv(outfile, **outopts)

biopipen/scripts/scrna/ExprImpution-alra.R DELETED Viewed

@@ -1,32 +0,0 @@
-source("{{biopipen_dir}}/utils/misc.R")
-library(SeuratWrappers)
-library(Seurat)
-infile = {{in.infile | r}}
-outfile = {{out.outfile | r}}
-envs = {{envs.alra_args | r}}
-print("Loading Seurat object")
-sobj = readRDS(infile)
-DefaultAssay(sobj) <- "RNA"
-print("Imputing expression values, using ALRA")
-envs$object = sobj
-sobj = do_call(RunALRA, envs)
-# sobj = RunALRA(sobj)
-print("Renaming assays")
-sobj = RenameAssays(sobj, RNA = "UNIMPUTED_RNA")
-sobj = RenameAssays(sobj, alra = "RNA")
-DefaultAssay(sobj) <- "RNA"
-attr(sobj, "impute") = "alra"
-print("Saving Seurat object")
-saveRDS(sobj, outfile)
-# choosek_plot_file = file.path(dirname(outfile), "choosek.png")
-# png(choosek_plot_file, width = 1200, height = 1000, res = 100)
-# p = ALRAChooseKPlot(sobj)
-# print(p)
-# dev.off()

biopipen/scripts/scrna/ExprImpution-rmagic.R DELETED Viewed

@@ -1,29 +0,0 @@
-tryCatch({
-    # in order to load Rmagic
-    workdir = {{job.outdir | r}}
-    conda_prefix = Sys.getenv("CONDA_PREFIX")
-    setwd(workdir)
-    file.symlink(conda_prefix, "miniconda3")
-}, error=function(e) {})
-python = {{envs.rmagic_args.python | r}}
-Sys.setenv(RETICULATE_PYTHON = Sys.which(python))
-# reticulate::use_python(python)
-library(Rmagic)
-library(Seurat)
-infile = {{in.infile | r}}
-outfile = {{out.outfile | r}}
-sobj = readRDS(infile)
-DefaultAssay(sobj) <- "RNA"
-sobj = magic(sobj)
-sobj = RenameAssays(sobj, RNA = "UNIMPUTED_RNA", MAGIC_RNA = "RNA")
-DefaultAssay(sobj) <- "RNA"
-attr(sobj, "impute") = "rmagic"
-saveRDS(sobj, outfile)

biopipen/scripts/scrna/ExprImpution.R DELETED Viewed

@@ -1,7 +0,0 @@
-{% if envs.tool == "rmagic" %}
-{% include biopipen_dir + "/scripts/scrna/ExprImpution-rmagic.R" %}
-{% elif envs.tool == "scimpute" %}
-{% include biopipen_dir + "/scripts/scrna/ExprImpution-scimpute.R" %}
-{% elif envs.tool == "alra" %}
-{% include biopipen_dir + "/scripts/scrna/ExprImpution-alra.R" %}
-{% endif %}

biopipen/scripts/scrna/GeneExpressionInvistigation.R DELETED Viewed

@@ -1,132 +0,0 @@
-source("{{biopipen_dir}}/utils/io.R")
-source("{{biopipen_dir}}/utils/misc.R")
-source("{{biopipen_dir}}/utils/plot.R")
-library(Seurat)
-library(dplyr)
-library(tidyr)
-library(tibble)
-library(rlang)
-library(ggplot2)
-library(ggprism)
-library(ComplexHeatmap)
-srtobjfile = {{in.srtobj | quote}}
-genefile = {{in.genefile | r}}
-outdir = {{out.outdir | quote}}
-gopts = {{envs.gopts | r}}
-{% if in.configfile %}
-config = {{in.configfile | toml_load | r}}
-{% set config = in.configfile | toml_load %}
-{% else %}
-config = {{envs.config | r}}
-{% set config = envs.config %}
-{% endif %}
-sobj = readRDS(srtobjfile)
-genes = read.table.opts(genefile, gopts)
-if (ncol(genes) == 1) {
-    genes$.Name = genes[[1]]
-}
-colnames(genes) = c("Gene", "Name")
-if (!is.null(config$mutaters)) {
-    expressions = list()
-    for (key in names(config$mutaters)) {
-        expressions[[key]] = parse_expr(config$mutaters[[key]])
-    }
-    sobj@meta.data = mutate(sobj@meta.data, !!!expressions)
-}
-if (!is.null(config$subset)) {
-    sobj = subset(sobj, subset = {{config.subset}})
-}
-DefaultAssay(sobj) <- "RNA"
-sobj = NormalizeData(sobj)
-exprs = as.data.frame(
-    GetAssayData(sobj, slot = "data", assay = "RNA")
-)[genes$Gene,,drop=F]
-rownames(exprs) = genes$Name
-exprs = rownames_to_column(exprs, "Gene")
-plot_heatmap = function(plotconf, outfile) {
-    plotdata = exprs %>%
-        pivot_longer(
-            names(exprs)[2:ncol(exprs)],
-            names_to = "Barcode",
-            values_to = "Log_Expression"
-        )
-    metadata = sobj@meta.data[plotdata$Barcode,,drop=F]
-    plotdata = cbind(plotdata, metadata)
-    plotdata = plotdata %>%
-        group_by(Gene, !!sym(config$groupby)) %>%
-        summarise(Log_Expression = mean(Log_Expression)) %>%
-        pivot_wider(names_from = config$groupby, values_from = "Log_Expression") %>%
-        column_to_rownames("Gene")
-    given_genes = rownames(plotdata)
-    plotdata = plotdata[complete.cases(plotdata),,drop=FALSE]
-    invalid_genes = setdiff(given_genes, rownames(plotdata))
-    if (length(invalid_genes) > 0) {
-        warning(
-            paste(
-                "The following genes were not found in the data:",
-                invalid_genes
-            )
-        )
-    }
-    devpars = list(res=plotconf$res, width=plotconf$width, height=plotconf$height)
-    plotconf$res = NULL
-    plotconf$width = NULL
-    plotconf$height = NULL
-    for (name in names(plotconf)) {
-        plotconf[[name]] = parse_expr(plotconf[[name]])
-    }
-    plotHeatmap(
-        plotdata,
-        plotconf,
-        devpars = devpars,
-        outfile = outfile
-    )
-}
-plot_boxplot = function(plotconf, outfile) {
-    plotdata = exprs %>%
-        pivot_longer(
-            names(exprs)[2:ncol(exprs)],
-            names_to = "Barcode",
-            values_to = "Log_Expression"
-        )
-    metadata = sobj@meta.data[plotdata$Barcode,,drop=F]
-    plotdata = cbind(plotdata, metadata)
-    cols = if (is.null(plotconf$ncol)) 3 else plotconf$ncol
-    p = ggplot(plotdata) +
-        geom_boxplot(aes_string(x=config$groupby, y="Log_Expression", fill=config$groupby)) +
-        facet_wrap(~Gene, ncol=cols) +
-        theme_prism(axis_text_angle = 90) + theme(legend.position = "none") +
-        xlab("")
-    devpars = list(filename = outfile, res = plotconf$res, width = plotconf$width, height = plotconf$height)
-    do_call(png, devpars)
-    print(p)
-    dev.off()
-}
-for (plottype in names(config$plots)) {
-    plotconf = config$plots[[plottype]]
-    if (plottype == "heatmap") {
-        plotfile = file.path(outdir, "heatmap.png")
-        plot_heatmap(plotconf, plotfile)
-    } else if (plottype == "boxplot") {
-        plotfile = file.path(outdir, "boxplot.png")
-        plot_boxplot(plotconf, plotfile)
-    } else {
-        stop(paste("Unknown plot type:", plottype))
-    }
-}

biopipen/scripts/scrna/Write10X.R DELETED Viewed

@@ -1,11 +0,0 @@
-library(DropletUtils)
-library(Seurat)
-srtobjfile = {{in.srtobj | r}}
-outdir = {{out.outdir | r}}
-version = {{envs.version | r}}
-srtobj = readRDS(srtobjfile)
-counts = GetAssayData(object = srtobj, slot = "counts")
-write10xCounts(outdir, counts, version = version, overwrite = TRUE)

biopipen 0.21.0__py3-none-any.whl → 0.34.26__py3-none-any.whl

biopipen 0.21.0py3-none-any.whl → 0.34.26py3-none-any.whl