PyPI - geney - Versions diffs - 1.3.63__py2.py3-none-any.whl → 1.3.65__py2.py3-none-any.whl - Mend

geney 1.3.63py2.py3-none-any.whl → 1.3.65py2.py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (8) hide show

geney/SeqMats.py +1 -0
geney/oncosplice.py +1 -1
geney/spliceai_utils.py +1 -1
geney/splicing_utils.py +64 -14
{geney-1.3.63.dist-info → geney-1.3.65.dist-info}/METADATA +1 -1
{geney-1.3.63.dist-info → geney-1.3.65.dist-info}/RECORD +8 -8
{geney-1.3.63.dist-info → geney-1.3.65.dist-info}/WHEEL +0 -0
{geney-1.3.63.dist-info → geney-1.3.65.dist-info}/top_level.txt +0 -0

geney/SeqMats.py CHANGED Viewed

@@ -8,6 +8,7 @@ class SeqMat:
     ROW_INDS = 1
     ROW_SUPERINDS = 2
     ROW_MUTATED = 3
+    ROW_ANNOTATION = 4
     def __init__(self, seqmat, alphabet=None):
         self.seqmat = seqmat

geney/oncosplice.py CHANGED Viewed

@@ -368,7 +368,7 @@ def oncosplice(mut_id, splicing_threshold=0.5, protein_coding=True, cons_require
                 if no_splicing_record and splicing_db is not None:
                     splicing_db.store_mutation_data(engine=splicing_engine, mut_id=mut_id, gene=gene.gene_name, transcript_id=reference_transcript.transcript_id, data=missplicing.missplicing)
-        alternative_splicing_paths = develop_aberrant_splicing(reference_transcript, missplicing.missplicing)
+        alternative_splicing_paths = develop_aberrant_splicing(reference_transcript, missplicing) #.missplicing)
         for i, new_boundaries in enumerate(alternative_splicing_paths):
             print("iterating through new boundaries...")

geney/spliceai_utils.py CHANGED Viewed

@@ -73,4 +73,4 @@ def run_spliceai_seq(seq, indices, threshold=0):
     ref_seq_acceptor_probs, ref_seq_donor_probs = ref_seq_probs_temp[0, :], ref_seq_probs_temp[1, :]
     acceptor_indices = {a: b for a, b in list(zip(indices, ref_seq_acceptor_probs)) if b >= threshold}
     donor_indices = {a: b for a, b in list(zip(indices, ref_seq_donor_probs)) if b >= threshold}
-    return acceptor_indices, donor_indices
+    return donor_indices, acceptor_indices

geney/splicing_utils.py CHANGED Viewed

@@ -1,5 +1,7 @@
 import numpy as np
 import pandas as pd
+from tensorflow.python.framework.test_ops import none_eager_fallback
 from .Gene import Gene
 from .SeqMats import MutSeqMat
 from collections import defaultdict
@@ -119,15 +121,19 @@ def prepare_splice_sites(acceptors, donors, aberrant_splicing):
 def develop_aberrant_splicing(transcript, aberrant_splicing):
-    all_acceptors, all_donors = prepare_splice_sites(transcript.acceptors, transcript.donors, aberrant_splicing)
-    adj_list = generate_adjacency_list(all_acceptors, all_donors, transcript_start=transcript.transcript_start,
-                                       transcript_end=transcript.transcript_end, rev=transcript.rev,
-                                       max_distance=100000)
-    end_node = (transcript.transcript_end, 'transcript_end')
-    start_node = (transcript.transcript_start, 'transcript_start')
-    for path, prob in find_all_paths(adj_list, start_node, end_node):
-        yield {'acceptors': [p[0] for p in path if p[1] == 'acceptor'],
-               'donors': [p[0] for p in path if p[1] == 'donor'], 'path_weight': prob}
+    if not aberrant_splicing:
+        yield {'acceptors': transcript.acceptors, 'donors': transcript.donors, 'path_weight': 1}
+    else:
+        all_acceptors, all_donors = prepare_splice_sites(transcript.acceptors, transcript.donors, aberrant_splicing.missplicing)
+        adj_list = generate_adjacency_list(all_acceptors, all_donors, transcript_start=transcript.transcript_start,
+                                           transcript_end=transcript.transcript_end, rev=transcript.rev,
+                                           max_distance=100000)
+        end_node = (transcript.transcript_end, 'transcript_end')
+        start_node = (transcript.transcript_start, 'transcript_start')
+        for path, prob in find_all_paths(adj_list, start_node, end_node):
+            yield {'acceptors': [p[0] for p in path if p[1] == 'acceptor'],
+                   'donors': [p[0] for p in path if p[1] == 'donor'], 'path_weight': prob}
@@ -193,7 +199,7 @@ def find_transcript_splicing(transcript, engine: str = 'spliceai') -> Tuple[Dict
     # Prepare reference sequence with padding
     ref_indices = transcript.indices
     ref_seq = 'N' * 5000 + transcript.seq + 'N' * 5000
-    ref_seq_acceptor_probs, ref_seq_donor_probs = run_splicing_engine(ref_seq, engine)
+    ref_seq_donor_probs, ref_seq_acceptor_probs = run_splicing_engine(ref_seq, engine)
     # Verify lengths
     assert len(ref_seq_donor_probs) == len(ref_indices), (
@@ -206,10 +212,10 @@ def find_transcript_splicing(transcript, engine: str = 'spliceai') -> Tuple[Dict
     )
     # Create dictionaries and sort them by probability in descending order
-    donor_probs = dict(sorted((i, p) for i, p in zip(ref_indices, ref_seq_donor_probs)),
-                       key=lambda item: item[1], reverse=True)
-    acceptor_probs = dict(sorted((i, p) for i, p in zip(ref_indices, ref_seq_acceptor_probs)),
-                          key=lambda item: item[1], reverse=True)
+    donor_probs = dict(sorted(((i, p) for i, p in zip(ref_indices, ref_seq_donor_probs)),
+                       key=lambda item: item[1], reverse=True))
+    acceptor_probs = dict(sorted(((i, p) for i, p in zip(ref_indices, ref_seq_acceptor_probs)),
+                          key=lambda item: item[1], reverse=True))
     return donor_probs, acceptor_probs
@@ -456,6 +462,50 @@ def process_pairwise_epistasis(mids, engine='pangolin', fprint=False, db=None):
     return pd.concat(results)
+def process_pairwise_epistasis_explicit(mid, engine='spliceai'):
+    donor_probs, acceptor_probs = {}, {}
+    lower_pos, upper_pos = int(mid.split(':')[2]), int(mid.split(':')[6])
+    g = Gene.from_file(mid.split(':')[0]).transcript().generate_pre_mrna()
+    print(g.rev)
+    if g.rev:
+        lower_pos, upper_pos, factor = upper_pos, lower_pos, -1
+    else:
+        factor = 1
+    lb, ub = lower_pos - (factor * 7500), upper_pos + (factor * 7500)
+    for m in ['wild_type'] + mid.split('|') + [mid]:
+        transcript = g.clone().pre_mrna
+        if m != 'wild_type':
+            mutations = [MutSeqMat.from_mutid(cm) for cm in m.split('|')]
+            if g.rev:
+                mutations = [m.reverse_complement() for m in mutations]
+            for mutation in mutations:
+                if mutation in transcript:
+                    transcript.mutate(mutation, inplace=True)
+        donors, acceptors = find_transcript_splicing(transcript[lb:ub], engine=engine)
+        donor_probs[m] = donors
+        acceptor_probs[m] = acceptors
+    acceptors = pd.DataFrame.from_dict(acceptor_probs).T
+    donors = pd.DataFrame.from_dict(donor_probs).T
+    acceptors = acceptors.map(lambda x: 0 if x < 0.01 else round(x, 2) if isinstance(x, (int, float)) else x).round(2)
+    acceptors = acceptors.loc[:, acceptors.nunique() > 1]
+    donors = donors.map(lambda x: 0 if abs(x) < 0.01 else round(x, 2) if isinstance(x, (int, float)) else x).round(2)
+    donors = donors.loc[:, donors.nunique() > 1]
+    donors.loc['residual'] = (donors.iloc[3] - donors.iloc[0]) - (
+                (donors.iloc[1] - donors.iloc[0]) + (donors.iloc[2] - donors.iloc[0]))
+    acceptors.loc['residual'] = (acceptors.iloc[3] - acceptors.iloc[0]) - (
+                (acceptors.iloc[1] - acceptors.iloc[0]) + (acceptors.iloc[2] - acceptors.iloc[0]))
+    donors = donors.loc[:, donors.loc['residual'].abs() > 0.1]
+    acceptors = acceptors.loc[:, acceptors.loc['residual'].abs() > 0.1]
+    return acceptors, donors
 class Missplicing:
     def __init__(self, splicing_dict=None, threshold=0.5):

{geney-1.3.63.dist-info → geney-1.3.65.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: geney
-Version: 1.3.63
+Version: 1.3.65
 Summary: A Python package for gene expression modeling.
 Home-page: https://github.com/nicolaslynn/geney
 Author: Nicolas Lynn

{geney-1.3.63.dist-info → geney-1.3.65.dist-info}/RECORD RENAMED Viewed

@@ -1,6 +1,6 @@
 geney/Fasta_segment.py,sha256=99HxNGNh_MfdVW6hhtlb1vOn7eSmT7oFoEfHDFMxG8w,11275
 geney/Gene.py,sha256=nMWJjoQaiVFm2iRjoiq7ghZqnXtW0tJDcq2S0AyOIvY,6883
-geney/SeqMats.py,sha256=ksS1JW3vDj-CRBpcy-K28UFZSfJaMuc-JNNM26T09us,19259
+geney/SeqMats.py,sha256=9-eJnfU2w3LGc0XvVvFEO_QrBneTkC6xkZKDfTcEw5o,19282
 geney/Transcript.py,sha256=CpfxYkuCwFILozrtLuiWnlr1mRnMKn4o84HVJislgYs,14499
 geney/__init__.py,sha256=eBdDl42N6UhcYeZDjOnv199Z88fI5_8Y6xW8447OKXM,755
 geney/_mutation_utils.py,sha256=dHssUsnii_mf-wuRoMmF13UlD7k3ml_VwQMItTYnXpU,1132
@@ -11,12 +11,12 @@ geney/graphic_utils.py,sha256=oMsBpB9YeEn96gGpKh4MmtagJffWZbk-xPrIwHvkFhA,11016
 geney/gtex_utils.py,sha256=asL2lHyU5KsbWpV096vkf1Ka7hSo_RRfZqw7p5nERmE,1919
 geney/immune_utils.py,sha256=ZRni5ttrhpYBnmNr0d0ZatIbNPYs4nmQuoUO00SpsS4,5271
 geney/mutation_utils.py,sha256=C_kv2MB_L8LlhX3W2ooXjJ3uDoJ8zX1WeDtZKoBZJkI,1547
-geney/oncosplice.py,sha256=5O8oXnh73SEdweuaCQs0gmIja0CDjEj8KNL0aXg5lQQ,24790
+geney/oncosplice.py,sha256=YZvAnbe8gj9fPvs2DldeQpqhhe_QR9xBLe_0tcm9tdg,24793
 geney/pangolin_utils.py,sha256=9jdBXlOcRaUdfi-UpUxHA0AkTMZkUF-Lt7HVZ1nEm3s,2973
 geney/power_utils.py,sha256=MehZFUdkJ2EFUot709yPEDxSkXmH5XevMebX2HD768A,7330
 geney/seqmat_utils.py,sha256=wzb3PX5it5bpIFQvcxyzlxfhoJTbHHbsjg0rzh05iVs,19753
-geney/spliceai_utils.py,sha256=PFIhTK8Ihrj-cv5tgRN0UFPYEmC4uxtqXSP9bBLnZRM,3077
-geney/splicing_utils.py,sha256=GDSuuy8kWBh2_4UDwqjclF9gKnnCoLc_neOEsSrNWQM,38512
+geney/spliceai_utils.py,sha256=tVY0T6F6l3fNoaktpn7Kq0oH5ZM0ThFYt9nPi_lfakw,3077
+geney/splicing_utils.py,sha256=W-N0ENZJv1PdnVlHuaN_2az2-7Zl6cHYe_CYR1G41U4,40766
 geney/survival_utils.py,sha256=KnAzEviMuXh6SnVXId9PgsFLSbgkduTvYoIthxN7FPA,6886
 geney/tcga_utils.py,sha256=D_BNHm-D_K408dlcJm3hzH2c6QNFjQsKvUcOPiQRk7g,17612
 geney/tis_utils.py,sha256=la0CZroaKe5RgAyFd4Bf_DqQncklWgAY2823xVst98o,7813
@@ -25,7 +25,7 @@ geney/translation_initiation/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NM
 geney/translation_initiation/tis_utils.py,sha256=AF3siFjuQH-Rs44EV-80zHdbxRMvN4woLFSHroWIETc,4448
 geney/translation_initiation/resources/kozak_pssm.json,sha256=pcd0Olziutq-6H3mFWDCD9cujQ_AlZO-iiOvBl82hqE,1165
 geney/translation_initiation/resources/tis_regressor_model.joblib,sha256=IXb4DUDhJ5rBDKcqMk9zE3ECTZZcdj7Jixz3KpoZ7OA,2592025
-geney-1.3.63.dist-info/METADATA,sha256=lis1MZ3LovEMzTuqZthCmPxQ26p4XbeXxdhbtb4qgPo,990
-geney-1.3.63.dist-info/WHEEL,sha256=AHX6tWk3qWuce7vKLrj7lnulVHEdWoltgauo8bgCXgU,109
-geney-1.3.63.dist-info/top_level.txt,sha256=O-FuNUMb5fn9dhZ-dYCgF0aZtfi1EslMstnzhc5IIVo,6
-geney-1.3.63.dist-info/RECORD,,
+geney-1.3.65.dist-info/METADATA,sha256=L-doIh0XdJuxs4gg1Dhs5mLoa_1zI8_bboq4cnlfvfA,990
+geney-1.3.65.dist-info/WHEEL,sha256=AHX6tWk3qWuce7vKLrj7lnulVHEdWoltgauo8bgCXgU,109
+geney-1.3.65.dist-info/top_level.txt,sha256=O-FuNUMb5fn9dhZ-dYCgF0aZtfi1EslMstnzhc5IIVo,6
+geney-1.3.65.dist-info/RECORD,,

{geney-1.3.63.dist-info → geney-1.3.65.dist-info}/WHEEL RENAMED Viewed

File without changes

{geney-1.3.63.dist-info → geney-1.3.65.dist-info}/top_level.txt RENAMED Viewed

File without changes

geney 1.3.63__py2.py3-none-any.whl → 1.3.65__py2.py3-none-any.whl

geney 1.3.63py2.py3-none-any.whl → 1.3.65py2.py3-none-any.whl