PyPI - gwaslab - Versions diffs - 3.6.6__py3-none-any.whl → 3.6.8__py3-none-any.whl - Mend

gwaslab 3.6.6py3-none-any.whl → 3.6.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of gwaslab might be problematic. Click here for more details.

Files changed (110) hide show

gwaslab/{qc_fix_sumstats_polars.py → qc/qc_fix_sumstats_polars.py} RENAMED Viewed

@@ -11,18 +11,22 @@ from gwaslab.g_vchange_status_polars import vchange_statusp
 from gwaslab.g_vchange_status import status_match
 from gwaslab.g_vchange_status import change_status
 from gwaslab.g_Log import Log
-from gwaslab.bd_common_data import get_chr_to_number
-from gwaslab.bd_common_data import get_number_to_chr
-from gwaslab.bd_common_data import get_chr_list
-from gwaslab.qc_check_datatype import check_datatype
-from gwaslab.qc_check_datatype import check_dataframe_shape
-from gwaslab.qc_build import _process_build
-from gwaslab.qc_build import _set_build
 from gwaslab.g_version import _get_version
-from gwaslab.util_in_fill_data import _convert_betase_to_mlog10p
-from gwaslab.util_in_fill_data import _convert_betase_to_p
-from gwaslab.util_in_fill_data import _convert_mlog10p_to_p
-from gwaslab.bd_common_data import get_chain
+from gwaslab.bd.bd_common_data import get_chr_to_number
+from gwaslab.bd.bd_common_data import get_number_to_chr
+from gwaslab.bd.bd_common_data import get_chr_list
+from gwaslab.bd.bd_common_data import get_chain
+from gwaslab.qc.qc_check_datatype import check_datatype
+from gwaslab.qc.qc_check_datatype import check_dataframe_shape
+from gwaslab.qc.qc_build import _process_build
+from gwaslab.qc.qc_build import _set_build
+from gwaslab.util.util_in_fill_data import _convert_betase_to_mlog10p
+from gwaslab.util.util_in_fill_data import _convert_betase_to_p
+from gwaslab.util.util_in_fill_data import _convert_mlog10p_to_p
 import polars as pl
 ###############################################################################################################
 # 20220426

gwaslab/{util_abf_finemapping.py → util/util_abf_finemapping.py} RENAMED Viewed

@@ -1,8 +1,8 @@
 import pandas as pd
 import numpy as np
 from gwaslab.g_Log import Log
-from gwaslab.util_in_filter_value import _get_flanking_by_chrpos
-from gwaslab.util_in_filter_value import _get_flanking_by_id
+from gwaslab.util.util_in_filter_value import _get_flanking_by_chrpos
+from gwaslab.util.util_in_filter_value import _get_flanking_by_id
 # Calculate PIP based on approximate Bayesian factor (ABF)
 # Wakefield, J. A bayesian measure of the probability of false discovery in genetic epidemiology studies. Am J Hum Genet 81, 208–227 (2007).

gwaslab/{util_ex_calculate_ldmatrix.py → util/util_ex_calculate_ldmatrix.py} RENAMED Viewed

@@ -4,14 +4,14 @@ import gc
 import pandas as pd
 import numpy as np
 from gwaslab.g_Log import Log
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
-from gwaslab.util_in_get_sig import getsig
-from gwaslab.util_ex_process_ref import _process_plink_input_files
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
+from gwaslab.util.util_in_get_sig import getsig
+from gwaslab.util.util_ex_process_ref import _process_plink_input_files
+from gwaslab.util.util_in_filter_value import _exclude_hla
 from gwaslab.g_version import _checking_plink_version
-from gwaslab.util_in_filter_value import _exclude_hla
-def tofinemapping(sumstats,
+def tofinemapping(gls,
                   study=None,
                   bfile=None,
                   vcf=None,
@@ -39,6 +39,9 @@ def tofinemapping(sumstats,
     _start_cols =["SNPID","CHR","POS","EA","NEA"]
     _start_function = ".calculate_ld_matrix()"
     _must_args ={}
+    sumstats = gls.data
+    gls.offload()
     is_enough_info = start_to(sumstats=sumstats,
                             log=log,
@@ -114,7 +117,8 @@ def tofinemapping(sumstats,
                                                     locus_sumstats=locus_sumstats,
                                                     ref_bim=ref_bim[0],
                                                     log=log,suffixes=suffixes)
+        del locus_sumstats
+        gc.collect()
         #########################################################################################################
         # create matched snp list
         matched_snp_list_path,matched_sumstats_path=_export_snplist_and_locus_sumstats(matched_sumstats=matched_sumstats,
@@ -144,7 +148,8 @@ def tofinemapping(sumstats,
                                                             extra_plink_option=extra_plink_option,
                                                             ref_allele_path = matched_sumstats_path,
                                                             verbose=verbose)
+        del matched_sumstats
+        gc.collect()
         # print file list
         row_dict={}
@@ -166,7 +171,12 @@ def tofinemapping(sumstats,
         output_file_list_path=None
         log.write(" -No avaialable lead variants.",verbose=verbose)
         log.write(" -Stopped LD matrix calculation.",verbose=verbose)
+    del sumstats
     finished(log=log, verbose=verbose, end_line=_end_line)
+    gls.reload()
     return output_file_list_path, output_file_list, plink_log

gwaslab/{util_ex_calculate_prs.py → util/util_ex_calculate_prs.py} RENAMED Viewed

@@ -4,8 +4,8 @@ import gc
 import pandas as pd
 import numpy as np
 from gwaslab.g_Log import Log
-from gwaslab.util_in_get_sig import getsig
-from gwaslab.util_ex_process_ref import _process_plink_input_files
+from gwaslab.util.util_in_get_sig import getsig
+from gwaslab.util.util_ex_process_ref import _process_plink_input_files
 from gwaslab.g_version import _checking_plink_version
 def _calculate_prs(sumstats,

gwaslab/{util_ex_ldproxyfinder.py → util/util_ex_ldproxyfinder.py} RENAMED Viewed

@@ -17,12 +17,12 @@ from mpl_toolkits.axes_grid1.inset_locator import mark_inset
 from adjustText import adjust_text
 from gtfparse import read_gtf
 from gwaslab.g_Log import Log
-from gwaslab.bd_common_data import get_chr_to_number
-from gwaslab.bd_common_data import get_number_to_chr
-from gwaslab.bd_common_data import get_recombination_rate
-from gwaslab.bd_common_data import get_gtf
-from gwaslab.util_in_filter_value import _get_flanking
-from gwaslab.hm_harmonize_sumstats import auto_check_vcf_chr_dict
+from gwaslab.bd.bd_common_data import get_chr_to_number
+from gwaslab.bd.bd_common_data import get_number_to_chr
+from gwaslab.bd.bd_common_data import get_recombination_rate
+from gwaslab.bd.bd_common_data import get_gtf
+from gwaslab.util.util_in_filter_value import _get_flanking
+from gwaslab.hm.hm_harmonize_sumstats import auto_check_vcf_chr_dict
 # unmatched SNP list 1
 # for each SNP in unmatched SNP list 1:

gwaslab/{util_ex_ldsc.py → util/util_ex_ldsc.py} RENAMED Viewed

@@ -1,17 +1,22 @@
-from gwaslab.ldsc_sumstats import estimate_h2
-from gwaslab.ldsc_sumstats import estimate_rg
-from gwaslab.ldsc_sumstats import cell_type_specific
-from gwaslab.g_Log import Log
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
-from gwaslab.qc_fix_sumstats import skipped
-from gwaslab.io_read_ldsc import parse_ldsc_summary
-from gwaslab.io_read_ldsc import parse_partitioned_ldsc_summary
-from gwaslab.util_in_filter_value import filtervalues
-from gwaslab.util_in_filter_value import _filter_palindromic
-from gwaslab.util_in_filter_value import _exclude_hla
-from gwaslab.util_in_filter_value import _exclude_sexchr
 import copy
+from gwaslab.g_Log import Log
+from gwaslab.extension.ldsc.ldsc_sumstats import estimate_h2
+from gwaslab.extension.ldsc.ldsc_sumstats import estimate_rg
+from gwaslab.extension.ldsc.ldsc_sumstats import cell_type_specific
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
+from gwaslab.qc.qc_fix_sumstats import skipped
+from gwaslab.io.io_read_ldsc import parse_ldsc_summary
+from gwaslab.io.io_read_ldsc import parse_partitioned_ldsc_summary
+from gwaslab.util.util_in_filter_value import filtervalues
+from gwaslab.util.util_in_filter_value import _filter_palindromic
+from gwaslab.util.util_in_filter_value import _exclude_hla
+from gwaslab.util.util_in_filter_value import _exclude_sexchr
 class ARGS():
     def __init__(self, kwargs=None):

gwaslab/{util_ex_match_ldmatrix.py → util/util_ex_match_ldmatrix.py} RENAMED Viewed

@@ -1,7 +1,7 @@
 import scipy.sparse as sparse
 import numpy as np
 import pandas as pd
-from gwaslab.hm_casting import _merge_mold_with_sumstats_by_chrpos
 import subprocess
 import os
 import re
@@ -9,16 +9,17 @@ import gc
 import pandas as pd
 import numpy as np
 from gwaslab.g_Log import Log
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
-from gwaslab.util_in_get_sig import getsig
-from gwaslab.util_ex_process_ref import _process_plink_input_files
 from gwaslab.g_version import _checking_plink_version
-from gwaslab.util_in_filter_value import _exclude_hla
-from gwaslab.util_ex_calculate_ldmatrix import _extract_variants_in_locus
+from gwaslab.hm.hm_casting import _merge_mold_with_sumstats_by_chrpos
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
+from gwaslab.util.util_in_get_sig import getsig
+from gwaslab.util.util_ex_process_ref import _process_plink_input_files
+from gwaslab.util.util_in_filter_value import _exclude_hla
+from gwaslab.util.util_ex_calculate_ldmatrix import _extract_variants_in_locus
 def tofinemapping_m(sumstats,
                     studies=None,

gwaslab/util/util_ex_phewwas.py ADDED Viewed

@@ -0,0 +1,127 @@
+import pandas as pd
+from gwaslab.g_Log import Log
+import pandas as pd
+import numpy as np
+def _extract_associations(sumstats, rsid="rsID", log = Log(), verbose=True):
+    assoc, traits, studies, variants = get_associations_from_gwascatalog(sumstats, rsid=rsid, log=log, verbose=verbose)
+    if len(assoc)==0:
+        # if no associations
+        log.write("No associations!")
+        return None, None
+    assoc = _fix_beta(assoc)
+    traits_agg = traits.groupby("associationId")[["trait","shortForm"]].agg(lambda x: ",".join(x)).reset_index()
+    assoc_traits_agg= pd.merge(assoc, traits_agg, on ="associationId",how="left")
+    assoc_traits_agg= pd.merge(assoc_traits_agg, studies, on ="associationId", how="left")
+    assoc_traits_agg= pd.merge(assoc_traits_agg, variants, on ="associationId",how="left")
+    assoc_traits_agg = assoc_traits_agg.rename(columns={"trait":"GWASCATALOG_TRAIT",
+                                                        "riskFrequency":"RAF",
+                                                        "betaNum":"Beta",
+                                                        "pvalue":"P-value"
+                                                        })
+    summary_columns=['GWASCATALOG_TRAIT','associationId', 'rsID', "geneName",
+                     'RA', 'RAF','Beta', 'P-value','cohort','initialSampleSize','publicationInfo.pubmedId',
+                     "functionalClass","gene.geneName"]
+    assoc_traits_agg_summary = assoc_traits_agg[summary_columns]
+    return assoc_traits_agg, assoc_traits_agg_summary
+def get_associations_from_gwascatalog(sumstats, rsid="rsID", log=Log(), verbose=True):
+    from pandasgwas import get_associations
+    from pandasgwas import get_traits
+    from pandasgwas import get_studies
+    from pandasgwas import get_variants
+    association = pd.DataFrame()
+    strongest_risk_alleles=pd.DataFrame()
+    author_reported_genes = pd.DataFrame()
+    unique_sumstats = sumstats.dropna(subset=[rsid]).drop_duplicates(subset=[rsid])
+    for index,row in unique_sumstats.iterrows():
+        log.write(f"Getting associations from GWAS Catalog for {row[rsid]}...",verbose=verbose)
+        df = get_associations(variant_id = row[rsid])
+        empty=[]
+        if len(df.associations)>0:
+            df.associations[rsid] = row[rsid]
+            association = pd.concat([association, df.associations],ignore_index=True)
+            df.strongest_risk_alleles[rsid] = row[rsid]
+            strongest_risk_alleles = pd.concat([strongest_risk_alleles, df.strongest_risk_alleles],ignore_index=True)
+            try:
+                author_reported_genes = pd.concat([author_reported_genes, df.author_reported_genes],ignore_index=True)
+            except:
+                pass
+            log.write("", show_time=False, verbose=verbose)
+        else:
+            empty.append(row[rsid])
+    log.write(f"No associations: {empty}", verbose=verbose)
+    if len(strongest_risk_alleles)>0:
+        strongest_risk_alleles["RA"] = strongest_risk_alleles["riskAlleleName"].str.split("-").str[-1]
+    if len(association)>0:
+        association = pd.merge(association, strongest_risk_alleles[["associationId","RA"]],on="associationId",how="left")
+        author_reported_genes = author_reported_genes.groupby("associationId")["geneName"].agg(lambda x: ",".join(x))
+        association = pd.merge(association, author_reported_genes,on="associationId",how="left")
+    log.write(f"Retrieved {len(association)} associations from GWAS Catalog...", verbose=verbose)
+    traits = pd.DataFrame()
+    studies = pd.DataFrame()
+    variants = pd.DataFrame()
+    for index,row in association.drop_duplicates(subset=["associationId"]).iterrows():
+        log.write(f'Getting traits/studies/variants from GWAS Catalog for associationId: {row["associationId"]}...',verbose=verbose)
+        df = get_traits(association_id = row["associationId"])
+        df.efo_traits["associationId"] = row["associationId"]
+        traits = pd.concat([traits, df.efo_traits],ignore_index=True)
+        df = get_studies(association_id = row["associationId"])
+        df.studies["associationId"] = row["associationId"]
+        studies = pd.concat([studies, df.studies],ignore_index=True)
+        df = get_variants(association_id = row["associationId"])
+        df.variants["associationId"] = row["associationId"]
+        min_distance = df.genomic_contexts["distance"].min()
+        df.genomic_contexts = df.genomic_contexts.loc[df.genomic_contexts["distance"]==min_distance,:].drop_duplicates("gene.geneName").groupby("rsId")["gene.geneName"].agg(lambda x: ",".join(x))
+        df.variants = pd.merge(df.variants[["rsId","functionalClass","associationId"]],df.genomic_contexts, on="rsId")
+        variants = pd.concat([variants, df.variants[["associationId","functionalClass","gene.geneName"]]],ignore_index=True)
+    return association, traits, studies, variants
+def _fix_beta(association):
+    if "betaNum" not in association:
+        association["betaNum"] = pd.NA
+    if "orPerCopyNum" not in association:
+        association["orPerCopyNum"] = pd.NA
+    if "range" not in association:
+        association["range"] = pd.NA
+    is_or_available = (association["betaNum"].isna()) & (~association["orPerCopyNum"].isna())
+    is_range_available = (association["betaNum"].isna()) & (association["orPerCopyNum"].isna()) & (~association["range"].isna())
+    association.loc[is_or_available ,"betaNum"] = np.log(association.loc[is_or_available,"orPerCopyNum"])
+    association.loc[is_range_available ,"betaNum"] = association.loc[is_range_available,"range"].apply(lambda x: parse_range(x))
+    return association
+def parse_range(x):
+    range_list = x.strip("[|]").split("-")
+    high = np.log(range_list[1])
+    low = np.log(range_list[0])
+    beta = (high + low)/2
+    return beta

gwaslab/{util_ex_process_h5.py → util/util_ex_process_h5.py} RENAMED Viewed

@@ -2,8 +2,8 @@ import pandas as pd
 import os
 import numpy as np
 from gwaslab.g_Log import Log
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
 def process_vcf_to_hfd5(vcf,
                     directory=None,

gwaslab/{util_ex_process_ref.py → util/util_ex_process_ref.py} RENAMED Viewed

@@ -4,8 +4,8 @@ import subprocess
 from gwaslab.g_Log import Log
 import os
 from gwaslab.g_version import _checking_plink_version
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
 def _process_plink_input_files(chrlist,
                                bfile=None,

gwaslab/{util_ex_run_2samplemr.py → util/util_ex_run_2samplemr.py} RENAMED Viewed

@@ -7,13 +7,14 @@ import numpy as np
 from gwaslab.g_Log import Log
 from gwaslab.g_version import _checking_r_version
 from gwaslab.g_version import _check_susie_version
-from gwaslab.util_in_convert_h2 import _get_per_snp_r2
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
+from gwaslab.util.util_in_convert_h2 import _get_per_snp_r2
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
 def _run_two_sample_mr(sumstatspair_object,
                        r,
+                       out="./",
                        clump=False,
                        f_check=10,
                        exposure1="Trait1",
@@ -77,9 +78,15 @@ def _run_two_sample_mr(sumstatspair_object,
     # Clumping
     prefix = "{exposure}_{outcome}_{memory_id}".format(exposure = exposure1, outcome= outcome2, memory_id = id(sumstatspair))
-    temp_sumstats_path = "twosample_mr_{exposure}_{outcome}_{memory_id}.csv.gz".format(exposure = exposure1, outcome= outcome2, memory_id = id(sumstatspair))
-    sumstatspair.to_csv(temp_sumstats_path ,index=None)
+    prefix = "{}{}".format(out.rstrip('/') + "/",prefix)
+    temp_sumstats_path = "{out}twosample_mr_{exposure}_{outcome}_{memory_id}.csv.gz".format(out=out.rstrip('/') + "/",
+                                                                                               exposure = exposure1,
+                                                                                               outcome= outcome2,
+                                                                                               memory_id = id(sumstatspair))
+    if len(sumstatspair)>0:
+        sumstatspair.to_csv(temp_sumstats_path ,index=None)
+    else:
+        return 0
     ###
     calculate_r_script = ""
@@ -173,7 +180,10 @@ def _run_two_sample_mr(sumstatspair_object,
         directionality_test = directionality_test_script
     )
-    temp_r_script_path = "_{}_{}_{}_gwaslab_2smr_temp.R".format(exposure1,outcome2,id(sumstatspair))
+    temp_r_script_path = "{}_{}_{}_{}_gwaslab_2smr_temp.R".format(out.rstrip('/') + "/",
+                                                                  exposure1,
+                                                                  outcome2,
+                                                                  id(sumstatspair))
     with open(temp_r_script_path,"w") as file:
             file.write(rscript)
@@ -200,6 +210,7 @@ def _run_two_sample_mr(sumstatspair_object,
         log.write(rscript)
         log.write(e.output)
         os.remove(temp_r_script_path)
+    log.write(" Finished running MR using twosampleMR from command line.")

gwaslab/{util_ex_run_ccgwas.py → util/util_ex_run_ccgwas.py} RENAMED Viewed

@@ -6,10 +6,10 @@ import numpy as np
 from gwaslab.g_Log import Log
 from gwaslab.g_version import _checking_r_version
 from gwaslab.g_version import _check_susie_version
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
-from gwaslab.util_ex_calculate_ldmatrix import _extract_variants_in_locus
-from gwaslab.util_in_get_sig import getsig
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
+from gwaslab.util.util_ex_calculate_ldmatrix import _extract_variants_in_locus
+from gwaslab.util.util_in_get_sig import getsig
 def _run_ccgwas(    sumstats_pair,
                     r="Rscript",

gwaslab/{util_ex_run_clumping.py → util/util_ex_run_clumping.py} RENAMED Viewed

@@ -3,12 +3,12 @@ import numpy as np
 import os
 import pandas as pd
 from gwaslab.g_Log import Log
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
-from gwaslab.util_ex_process_ref import _process_plink_input_files
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
+from gwaslab.util.util_ex_process_ref import _process_plink_input_files
 from gwaslab.g_version import _checking_plink_version
-def _clump(insumstats, vcf=None, scaled=False, out="clumping_plink2",
+def _clump(gls, vcf=None, scaled=False, out="clumping_plink2",
            p="P",mlog10p="MLOG10P", overwrite=False, study=None, bfile=None, pfile=None,
            n_cores=1, memory=None, chrom=None, clump_p1=5e-8, clump_p2=5e-8, clump_r2=0.01, clump_kb=250,
            log=Log(),verbose=True,plink="plink",plink2="plink2"):
@@ -18,8 +18,16 @@ def _clump(insumstats, vcf=None, scaled=False, out="clumping_plink2",
     _start_cols =["SNPID","CHR","POS"]
     _start_function = ".clump()"
     _must_args ={}
+    if out is None:
+        out = f"./{study}_clumpping".lstrip('/')
+    else:
+        out = out.lstrip('/')
+    sumstats_id = gls.id
+    sumstats = gls.data
+    gls.offload()
-    is_enough_info = start_to(sumstats=insumstats,
+    is_enough_info = start_to(sumstats=sumstats,
                             log=log,
                             verbose=verbose,
                             start_line=_start_line,
@@ -42,11 +50,18 @@ def _clump(insumstats, vcf=None, scaled=False, out="clumping_plink2",
         clump_log10_p2=-np.log10(clump_p2)
         log.write("  -clump_log10_p1 : {}...".format(clump_log10_p1),verbose=verbose)
         log.write("  -clump_log10_p2 : {}...".format(clump_log10_p2),verbose=verbose)
-        sumstats = insumstats.loc[insumstats[mlog10p]>min(clump_log10_p1,clump_log10_p2),:].copy()
+        sumstats = sumstats.loc[sumstats[mlog10p]>min(clump_log10_p1,clump_log10_p2),:].copy()
     # extract lead variants
     else:
         log.write(" -Clumping will be performed using {}".format(p),verbose=verbose)
-        sumstats = insumstats.loc[insumstats[p]<max(clump_p1,clump_p2),:].copy()
+        sumstats = sumstats.loc[sumstats[p]<max(clump_p1,clump_p2),:].copy()
+    if len(sumstats)==0:
+        log.write(" -No significant variants after filtering.")
+        finished(log=log, verbose=verbose, end_line=_end_line)
+        gls.reload()
+        return pd.DataFrame(), pd.DataFrame(), ""
     log.write(" -Significant variants on CHR: ",list(sumstats["CHR"].unique()),verbose=verbose)
     plink_log=""
@@ -88,9 +103,9 @@ def _clump(insumstats, vcf=None, scaled=False, out="clumping_plink2",
             is_avaialable_variant = (sumstats["CHR"]==i) & (is_on_both)
             if scaled == True:
-                sumstats.loc[is_avaialable_variant,["SNPID",mlog10p]].to_csv("_gwaslab_tmp.{}.SNPIDP".format(i),index=False,sep="\t")
+                sumstats.loc[is_avaialable_variant,["SNPID",mlog10p]].to_csv("{}_gwaslab_tmp.{}.{}.SNPIDP".format(out, sumstats_id, i),index=False,sep="\t")
             else:
-                sumstats.loc[is_avaialable_variant,["SNPID",p]].to_csv("_gwaslab_tmp.{}.SNPIDP".format(i),index=False,sep="\t")
+                sumstats.loc[is_avaialable_variant,["SNPID",p]].to_csv("{}_gwaslab_tmp.{}.{}.SNPIDP".format(out, sumstats_id,i),index=False,sep="\t")
         except:
             log.write(" -Not available for: {}...".format(i),verbose=verbose)
@@ -102,7 +117,7 @@ def _clump(insumstats, vcf=None, scaled=False, out="clumping_plink2",
     for i in sumstats["CHR"].unique():
         chrom = i
         # temp file
-        clump = "_gwaslab_tmp.{}.SNPIDP".format(chrom)
+        clump = "{}_gwaslab_tmp.{}.{}.SNPIDP".format(out,sumstats_id,chrom)
         # output prefix
         out_single_chr= out + ".{}".format(chrom)
@@ -173,10 +188,10 @@ def _clump(insumstats, vcf=None, scaled=False, out="clumping_plink2",
         os.remove(clump)
     results = results.sort_values(by=["#CHROM","POS"]).rename(columns={"#CHROM":"CHR","ID":"SNPID"})
-    log.write("Finished clumping.",verbose=verbose)
-    results_sumstats = insumstats.loc[insumstats["SNPID"].isin(results["SNPID"]),:].copy()
+    results_sumstats = sumstats.loc[sumstats["SNPID"].isin(results["SNPID"]),:].copy()
     finished(log=log, verbose=verbose, end_line=_end_line)
+    gls.reload()
     return results_sumstats, results, plink_log

gwaslab/{util_ex_run_coloc.py → util/util_ex_run_coloc.py} RENAMED Viewed

@@ -6,10 +6,12 @@ import numpy as np
 from gwaslab.g_Log import Log
 from gwaslab.g_version import _checking_r_version
 from gwaslab.g_version import _check_susie_version
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
-def _run_coloc_susie(filepath, r="Rscript",
+def _run_coloc_susie(glsp,
+                     filepath,
+                     r="Rscript",
                      types=None, ns=None,
                      fillldna=True, delete=False,
                      coloc_args="",
@@ -17,10 +19,18 @@ def _run_coloc_susie(filepath, r="Rscript",
                      ncols=None,
                      d1_args="",
                      d2_args="",
+                     out=None,
                      log=Log(),
                      verbose=True):
-    log.write(" Start to run coloc.susie from command line:", verbose=verbose)
+    log.write("Start to run coloc.susie from command line:", verbose=verbose)
+    if filepath is None:
+        log.write(" -File path is None.", verbose=verbose)
+        log.write("Finished finemapping using SuSieR.", verbose=verbose)
+        return pd.DataFrame()
+    glsp.offload()
     if types is None:
         types = ("cc","cc")
@@ -31,11 +41,6 @@ def _run_coloc_susie(filepath, r="Rscript",
             ns = ncols
     log.write(" -Ns: {} and {}".format(ns[0],ns[1]), verbose=verbose)
-    if filepath is None:
-        log.write(" -File path is None.", verbose=verbose)
-        log.write("Finished finemapping using SuSieR.", verbose=verbose)
-        return pd.DataFrame()
     filelist = pd.read_csv(filepath,sep="\t")
     r_log=""
     # write R script
@@ -49,7 +54,12 @@ def _run_coloc_susie(filepath, r="Rscript",
         study = row["STUDY"]
         ld_r_matrix = row["LD_R_MATRIX"]
         sumstats = row["LOCUS_SUMSTATS"]
-        output_prefix = sumstats.replace(".sumstats.gz","")
+        if out is None:
+            output_prefix = sumstats.replace(".sumstats.gz","")
+        else:
+            output_prefix = os.path.join(out, os.path.basename(sumstats.replace(".sumstats.gz","")))
         log.write(" -Running for: {} - {}".format(row["SNPID"],row["STUDY"] ), verbose=verbose)
         log.write("  -Locus sumstats:{}".format(sumstats), verbose=verbose)
         log.write("  -LD r matrix:{}".format(ld_r_matrix), verbose=verbose)
@@ -141,5 +151,7 @@ def _run_coloc_susie(filepath, r="Rscript",
         except subprocess.CalledProcessError as e:
             log.write(e.output)
             os.remove("_{}_{}_gwaslab_coloc_susie_temp.R".format(study,row["SNPID"]))
     log.write("Finished clocalization using coloc and SuSiE.", verbose=verbose)
+    glsp.reload()
     return locus_pip_cs

gwaslab/{util_ex_run_hyprcoloc.py → util/util_ex_run_hyprcoloc.py} RENAMED Viewed

@@ -6,10 +6,10 @@ import numpy as np
 from gwaslab.g_Log import Log
 from gwaslab.g_version import _checking_r_version
 from gwaslab.g_version import _check_susie_version
-from gwaslab.qc_fix_sumstats import start_to
-from gwaslab.qc_fix_sumstats import finished
-from gwaslab.util_ex_calculate_ldmatrix import _extract_variants_in_locus
-from gwaslab.util_in_get_sig import getsig
+from gwaslab.qc.qc_fix_sumstats import start_to
+from gwaslab.qc.qc_fix_sumstats import finished
+from gwaslab.util.util_ex_calculate_ldmatrix import _extract_variants_in_locus
+from gwaslab.util.util_in_get_sig import getsig
 def _run_hyprcoloc(  sumstats_multi,
                      r="Rscript",

gwaslab 3.6.6__py3-none-any.whl → 3.6.8__py3-none-any.whl

Potentially problematic release.

gwaslab 3.6.6py3-none-any.whl → 3.6.8py3-none-any.whl