PyPI - biotite - Versions diffs - 0.41.2__cp310-cp310-macosx_11_0_arm64.whl → 1.0.1__cp310-cp310-macosx_11_0_arm64.whl - Mend

biotite 0.41.2__cp310-cp310-macosx_11_0_arm64.whl → 1.0.1__cp310-cp310-macosx_11_0_arm64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of biotite might be problematic. Click here for more details.

Files changed (205) hide show

biotite/__init__.py +2 -3
biotite/application/__init__.py +1 -1
biotite/application/application.py +20 -10
biotite/application/autodock/__init__.py +1 -1
biotite/application/autodock/app.py +74 -79
biotite/application/blast/__init__.py +1 -1
biotite/application/blast/alignment.py +19 -10
biotite/application/blast/webapp.py +92 -85
biotite/application/clustalo/__init__.py +1 -1
biotite/application/clustalo/app.py +46 -61
biotite/application/dssp/__init__.py +1 -1
biotite/application/dssp/app.py +8 -11
biotite/application/localapp.py +62 -60
biotite/application/mafft/__init__.py +1 -1
biotite/application/mafft/app.py +16 -22
biotite/application/msaapp.py +78 -89
biotite/application/muscle/__init__.py +1 -1
biotite/application/muscle/app3.py +50 -64
biotite/application/muscle/app5.py +23 -31
biotite/application/sra/__init__.py +1 -1
biotite/application/sra/app.py +64 -68
biotite/application/tantan/__init__.py +1 -1
biotite/application/tantan/app.py +22 -45
biotite/application/util.py +7 -9
biotite/application/viennarna/rnaalifold.py +34 -28
biotite/application/viennarna/rnafold.py +24 -39
biotite/application/viennarna/rnaplot.py +36 -21
biotite/application/viennarna/util.py +17 -12
biotite/application/webapp.py +13 -14
biotite/copyable.py +13 -13
biotite/database/__init__.py +1 -1
biotite/database/entrez/__init__.py +1 -1
biotite/database/entrez/check.py +2 -3
biotite/database/entrez/dbnames.py +7 -5
biotite/database/entrez/download.py +55 -49
biotite/database/entrez/key.py +1 -1
biotite/database/entrez/query.py +62 -23
biotite/database/error.py +2 -1
biotite/database/pubchem/__init__.py +1 -1
biotite/database/pubchem/download.py +43 -45
biotite/database/pubchem/error.py +2 -2
biotite/database/pubchem/query.py +34 -31
biotite/database/pubchem/throttle.py +3 -4
biotite/database/rcsb/__init__.py +1 -1
biotite/database/rcsb/download.py +44 -52
biotite/database/rcsb/query.py +85 -80
biotite/database/uniprot/check.py +6 -3
biotite/database/uniprot/download.py +6 -11
biotite/database/uniprot/query.py +115 -31
biotite/file.py +12 -31
biotite/sequence/__init__.py +3 -3
biotite/sequence/align/__init__.py +2 -2
biotite/sequence/align/alignment.py +99 -90
biotite/sequence/align/banded.cpython-310-darwin.so +0 -0
biotite/sequence/align/buckets.py +12 -10
biotite/sequence/align/cigar.py +43 -52
biotite/sequence/align/kmeralphabet.cpython-310-darwin.so +0 -0
biotite/sequence/align/kmeralphabet.pyx +55 -51
biotite/sequence/align/kmersimilarity.cpython-310-darwin.so +0 -0
biotite/sequence/align/kmertable.cpython-310-darwin.so +0 -0
biotite/sequence/align/kmertable.pyx +3 -2
biotite/sequence/align/localgapped.cpython-310-darwin.so +0 -0
biotite/sequence/align/localungapped.cpython-310-darwin.so +0 -0
biotite/sequence/align/matrix.py +81 -82
biotite/sequence/align/multiple.cpython-310-darwin.so +0 -0
biotite/sequence/align/multiple.pyx +1 -1
biotite/sequence/align/pairwise.cpython-310-darwin.so +0 -0
biotite/sequence/align/permutation.cpython-310-darwin.so +0 -0
biotite/sequence/align/permutation.pyx +12 -4
biotite/sequence/align/selector.cpython-310-darwin.so +0 -0
biotite/sequence/align/selector.pyx +52 -54
biotite/sequence/align/statistics.py +32 -33
biotite/sequence/align/tracetable.cpython-310-darwin.so +0 -0
biotite/sequence/alphabet.py +51 -65
biotite/sequence/annotation.py +78 -77
biotite/sequence/codec.cpython-310-darwin.so +0 -0
biotite/sequence/codon.py +90 -79
biotite/sequence/graphics/__init__.py +1 -1
biotite/sequence/graphics/alignment.py +184 -103
biotite/sequence/graphics/colorschemes.py +10 -12
biotite/sequence/graphics/dendrogram.py +79 -34
biotite/sequence/graphics/features.py +133 -99
biotite/sequence/graphics/logo.py +22 -28
biotite/sequence/graphics/plasmid.py +229 -178
biotite/sequence/io/fasta/__init__.py +1 -1
biotite/sequence/io/fasta/convert.py +44 -33
biotite/sequence/io/fasta/file.py +42 -55
biotite/sequence/io/fastq/__init__.py +1 -1
biotite/sequence/io/fastq/convert.py +11 -14
biotite/sequence/io/fastq/file.py +68 -112
biotite/sequence/io/genbank/__init__.py +2 -2
biotite/sequence/io/genbank/annotation.py +12 -20
biotite/sequence/io/genbank/file.py +74 -76
biotite/sequence/io/genbank/metadata.py +74 -62
biotite/sequence/io/genbank/sequence.py +13 -14
biotite/sequence/io/general.py +39 -30
biotite/sequence/io/gff/__init__.py +2 -2
biotite/sequence/io/gff/convert.py +10 -15
biotite/sequence/io/gff/file.py +81 -65
biotite/sequence/phylo/__init__.py +1 -1
biotite/sequence/phylo/nj.cpython-310-darwin.so +0 -0
biotite/sequence/phylo/tree.cpython-310-darwin.so +0 -0
biotite/sequence/phylo/upgma.cpython-310-darwin.so +0 -0
biotite/sequence/profile.py +57 -28
biotite/sequence/search.py +17 -15
biotite/sequence/seqtypes.py +200 -164
biotite/sequence/sequence.py +15 -17
biotite/structure/__init__.py +3 -3
biotite/structure/atoms.py +246 -236
biotite/structure/basepairs.py +260 -271
biotite/structure/bonds.cpython-310-darwin.so +0 -0
biotite/structure/bonds.pyx +29 -32
biotite/structure/box.py +67 -71
biotite/structure/celllist.cpython-310-darwin.so +0 -0
biotite/structure/chains.py +55 -39
biotite/structure/charges.cpython-310-darwin.so +0 -0
biotite/structure/compare.py +32 -32
biotite/structure/density.py +13 -18
biotite/structure/dotbracket.py +20 -22
biotite/structure/error.py +10 -2
biotite/structure/filter.py +83 -78
biotite/structure/geometry.py +130 -119
biotite/structure/graphics/atoms.py +60 -43
biotite/structure/graphics/rna.py +81 -68
biotite/structure/hbond.py +112 -93
biotite/structure/info/__init__.py +0 -2
biotite/structure/info/atoms.py +10 -11
biotite/structure/info/bonds.py +41 -43
biotite/structure/info/ccd.py +4 -5
biotite/structure/info/groups.py +1 -3
biotite/structure/info/masses.py +5 -10
biotite/structure/info/misc.py +1 -1
biotite/structure/info/radii.py +20 -20
biotite/structure/info/standardize.py +15 -26
biotite/structure/integrity.py +18 -71
biotite/structure/io/__init__.py +3 -4
biotite/structure/io/dcd/__init__.py +1 -1
biotite/structure/io/dcd/file.py +22 -20
biotite/structure/io/general.py +47 -61
biotite/structure/io/gro/__init__.py +1 -1
biotite/structure/io/gro/file.py +73 -72
biotite/structure/io/mol/__init__.py +1 -1
biotite/structure/io/mol/convert.py +8 -11
biotite/structure/io/mol/ctab.py +37 -36
biotite/structure/io/mol/header.py +14 -10
biotite/structure/io/mol/mol.py +9 -53
biotite/structure/io/mol/sdf.py +47 -50
biotite/structure/io/netcdf/__init__.py +1 -1
biotite/structure/io/netcdf/file.py +24 -23
biotite/structure/io/pdb/__init__.py +1 -1
biotite/structure/io/pdb/convert.py +32 -20
biotite/structure/io/pdb/file.py +151 -172
biotite/structure/io/pdb/hybrid36.cpython-310-darwin.so +0 -0
biotite/structure/io/pdbqt/__init__.py +1 -1
biotite/structure/io/pdbqt/convert.py +17 -11
biotite/structure/io/pdbqt/file.py +128 -80
biotite/structure/io/pdbx/__init__.py +1 -2
biotite/structure/io/pdbx/bcif.py +36 -44
biotite/structure/io/pdbx/cif.py +140 -110
biotite/structure/io/pdbx/component.py +10 -16
biotite/structure/io/pdbx/convert.py +260 -258
biotite/structure/io/pdbx/encoding.cpython-310-darwin.so +0 -0
biotite/structure/io/trajfile.py +90 -107
biotite/structure/io/trr/__init__.py +1 -1
biotite/structure/io/trr/file.py +12 -15
biotite/structure/io/xtc/__init__.py +1 -1
biotite/structure/io/xtc/file.py +11 -14
biotite/structure/mechanics.py +9 -11
biotite/structure/molecules.py +3 -4
biotite/structure/pseudoknots.py +53 -67
biotite/structure/rdf.py +23 -21
biotite/structure/repair.py +137 -86
biotite/structure/residues.py +26 -16
biotite/structure/sasa.cpython-310-darwin.so +0 -0
biotite/structure/{resutil.py → segments.py} +24 -23
biotite/structure/sequence.py +10 -11
biotite/structure/sse.py +100 -119
biotite/structure/superimpose.py +39 -77
biotite/structure/transform.py +97 -71
biotite/structure/util.py +11 -13
biotite/version.py +2 -2
biotite/visualize.py +69 -55
{biotite-0.41.2.dist-info → biotite-1.0.1.dist-info}/METADATA +6 -5
biotite-1.0.1.dist-info/RECORD +322 -0
biotite/structure/io/ctab.py +0 -72
biotite/structure/io/mmtf/__init__.py +0 -21
biotite/structure/io/mmtf/assembly.py +0 -214
biotite/structure/io/mmtf/convertarray.cpython-310-darwin.so +0 -0
biotite/structure/io/mmtf/convertarray.pyx +0 -341
biotite/structure/io/mmtf/convertfile.cpython-310-darwin.so +0 -0
biotite/structure/io/mmtf/convertfile.pyx +0 -501
biotite/structure/io/mmtf/decode.cpython-310-darwin.so +0 -0
biotite/structure/io/mmtf/decode.pyx +0 -152
biotite/structure/io/mmtf/encode.cpython-310-darwin.so +0 -0
biotite/structure/io/mmtf/encode.pyx +0 -183
biotite/structure/io/mmtf/file.py +0 -233
biotite/structure/io/npz/__init__.py +0 -20
biotite/structure/io/npz/file.py +0 -152
biotite/structure/io/pdbx/legacy.py +0 -267
biotite/structure/io/tng/__init__.py +0 -13
biotite/structure/io/tng/file.py +0 -46
biotite/temp.py +0 -86
biotite-0.41.2.dist-info/RECORD +0 -340
{biotite-0.41.2.dist-info → biotite-1.0.1.dist-info}/WHEEL +0 -0
{biotite-0.41.2.dist-info → biotite-1.0.1.dist-info}/licenses/LICENSE.rst +0 -0

biotite/application/muscle/app5.py CHANGED Viewed

@@ -6,31 +6,22 @@ __name__ = "biotite.application.muscle"
 __author__ = "Patrick Kunzmann"
 __all__ = ["Muscle5App"]
-import numbers
-import warnings
-from tempfile import NamedTemporaryFile
-from ..localapp import cleanup_tempfile
-from ..msaapp import MSAApp
-from ..application import AppState, VersionError, requires_state
-from ...sequence.sequence import Sequence
-from ...sequence.seqtypes import NucleotideSequence, ProteinSequence
-from ...sequence.align.matrix import SubstitutionMatrix
-from ...sequence.align.alignment import Alignment
-from ...sequence.phylo.tree import Tree
-from .app3 import get_version
+from biotite.application.application import AppState, VersionError, requires_state
+from biotite.application.msaapp import MSAApp
+from biotite.application.muscle.app3 import get_version
 class Muscle5App(MSAApp):
     """
     Perform a multiple sequence alignment using MUSCLE version 5.
     Parameters
     ----------
     sequences : list of Sequence
         The sequences to be aligned.
     bin_path : str, optional
         Path of the MUSCLE binary.
     See also
     --------
     MuscleApp
@@ -38,7 +29,7 @@ class Muscle5App(MSAApp):
     Notes
     -----
     Alignment ensemble generation is not supported, yet.
     Examples
     --------
@@ -56,14 +47,14 @@ class Muscle5App(MSAApp):
     BI-SMITE
     -I-QLITE
     """
     def __init__(self, sequences, bin_path="muscle"):
         major_version = get_version(bin_path)[0]
         if major_version < 5:
             raise VersionError(
                 f"At least Muscle 5 is required, got version {major_version}"
             )
         super().__init__(sequences, bin_path)
         self._mode = "align"
         self._consiters = None
@@ -86,7 +77,7 @@ class Muscle5App(MSAApp):
             self._consiters = consistency
         if refinement is not None:
             self._refineiters = refinement
     @requires_state(AppState.CREATED)
     def set_thread_number(self, number):
         """
@@ -110,48 +101,49 @@ class Muscle5App(MSAApp):
         args = [
             f"-{self._mode}",
             self.get_input_file_path(),
-            "-output", self.get_output_file_path(),
+            "-output",
+            self.get_output_file_path(),
         ]
         if self.get_seqtype() == "protein":
             args += ["-amino"]
         else:
             args += ["-nt"]
         if self._n_threads is not None:
-             args += ["-threads", str(self._n_threads)]
+            args += ["-threads", str(self._n_threads)]
         if self._consiters is not None:
-             args += ["-consiters", str(self._consiters)]
+            args += ["-consiters", str(self._consiters)]
         if self._refineiters is not None:
-             args += ["-refineiters", str(self._refineiters)]
+            args += ["-refineiters", str(self._refineiters)]
         self.set_arguments(args)
         super().run()
     def clean_up(self):
         super().clean_up()
     @staticmethod
     def supports_nucleotide():
         return True
     @staticmethod
     def supports_protein():
         return True
     @staticmethod
     def supports_custom_nucleotide_matrix():
         return False
     @staticmethod
     def supports_custom_protein_matrix():
         return False
     @classmethod
     def align(cls, sequences, bin_path="muscle"):
         """
         Perform a multiple sequence alignment.
         This is a convenience function, that wraps the :class:`Muscle5App`
         execution.
         Parameters
         ----------
         sequences : iterable object of Sequence
@@ -159,7 +151,7 @@ class Muscle5App(MSAApp):
         bin_path : str, optional
             Path of the MSA software binary. By default, the default path
             will be used.
         Returns
         -------
         alignment : Alignment

biotite/application/sra/__init__.py CHANGED Viewed

@@ -15,4 +15,4 @@ writes sequence reads into FASTA format.
 __name__ = "biotite.application.sra"
 __author__ = "Patrick Kunzmann"
-from .app import *
+from .app import *

biotite/application/sra/app.py CHANGED Viewed

@@ -7,17 +7,21 @@ __author__ = "Patrick Kunzmann"
 __all__ = ["FastaDumpApp", "FastqDumpApp"]
 import abc
-from os.path import join
-from subprocess import Popen, SubprocessError, PIPE, TimeoutExpired
 import glob
+from os.path import join
+from subprocess import PIPE, Popen, SubprocessError, TimeoutExpired
 from tempfile import TemporaryDirectory
-from ..application import Application, AppState, AppStateError, \
-                          requires_state
-from ...sequence.seqtypes import NucleotideSequence
-from ...sequence.io.fastq.file import FastqFile
-from ...sequence.io.fasta.file import FastaFile
-from ...sequence.io.fastq.convert import get_sequences as get_sequences_and_scores
-from ...sequence.io.fasta.convert import get_sequences
+from biotite.application.application import (
+    Application,
+    AppState,
+    AppStateError,
+    requires_state,
+)
+from biotite.sequence.io.fasta.convert import get_sequences
+from biotite.sequence.io.fasta.file import FastaFile
+from biotite.sequence.io.fastq.convert import get_sequences as get_sequences_and_scores
+from biotite.sequence.io.fastq.file import FastqFile
+from biotite.sequence.seqtypes import NucleotideSequence
 # Do not use LocalApp, as two programs are executed
@@ -48,8 +52,13 @@ class _DumpApp(Application, metaclass=abc.ABCMeta):
         the score format.
     """
-    def __init__(self, uid, output_path_prefix=None,
-                 prefetch_path="prefetch", fasterq_dump_path="fasterq-dump"):
+    def __init__(
+        self,
+        uid,
+        output_path_prefix=None,
+        prefetch_path="prefetch",
+        fasterq_dump_path="fasterq-dump",
+    ):
         super().__init__()
         self._prefetch_path = prefetch_path
         self._fasterq_dump_path = fasterq_dump_path
@@ -62,21 +71,16 @@ class _DumpApp(Application, metaclass=abc.ABCMeta):
         self._prefetch_process = None
         self._fasterq_dump_process = None
     @requires_state(AppState.RUNNING | AppState.FINISHED)
     def join(self, timeout=None):
         # Override method as repetitive calls of 'is_finished()'
         # are not necessary as 'communicate()' already waits for the
         # finished application
         try:
-            _, self._stderr = self._process.communicate(
-                timeout=timeout
-            )
+            _, self._stderr = self._process.communicate(timeout=timeout)
         except TimeoutExpired:
             self.cancel()
-            raise TimeoutError(
-                f"The application expired its timeout ({timeout:.1f} s)"
-            )
+            raise TimeoutError(f"The application expired its timeout ({timeout:.1f} s)")
         self._state = AppState.FINISHED
         try:
@@ -90,7 +94,6 @@ class _DumpApp(Application, metaclass=abc.ABCMeta):
             self._state = AppState.JOINED
         self.clean_up()
     def run(self):
         # Prefetch into a temp directory with file name equaling UID
         # This ensures that the ID in the header is not the temp prefix
@@ -105,16 +108,14 @@ class _DumpApp(Application, metaclass=abc.ABCMeta):
             command, stdout=PIPE, stderr=PIPE, shell=True, encoding="UTF-8"
         )
     def is_finished(self):
         code = self._process.poll()
-        if code == None:
+        if code is None:
             return False
         else:
-            _,  self._stderr = self._process.communicate()
+            _, self._stderr = self._process.communicate()
             return True
     def evaluate(self):
         super().evaluate()
         # Check if applicaion terminated correctly
@@ -128,26 +129,24 @@ class _DumpApp(Application, metaclass=abc.ABCMeta):
         self._file_names = (
             # For entries with one read per spot
-            glob.glob(self._prefix +   ".fastq") +
+            glob.glob(self._prefix + ".fastq")
+            +
             # For entries with multiple reads per spot
             glob.glob(self._prefix + "_*.fastq")
         )
         # Only load FASTQ files into memory when needed
         self._fastq_files = None
     def wait_interval(self):
         # Not used in this implementation of 'join()'
         raise NotImplementedError()
     def clean_up(self):
         if self.get_app_state() == AppState.CANCELLED:
             self._process.kill()
         # Directory with temp files does not need to be deleted,
         # as temp dir is automatically deleted upon object destruction
     @requires_state(AppState.CREATED)
     def get_prefetch_options(self):
         """
@@ -176,7 +175,6 @@ class _DumpApp(Application, metaclass=abc.ABCMeta):
         """
         return ""
     @requires_state(AppState.JOINED)
     def get_file_paths(self):
         """
@@ -189,7 +187,6 @@ class _DumpApp(Application, metaclass=abc.ABCMeta):
         """
         return self._file_names
     @requires_state(AppState.JOINED)
     @abc.abstractmethod
     def get_sequences(self):
@@ -236,15 +233,18 @@ class FastqDumpApp(_DumpApp):
         the score format.
     """
-    def __init__(self, uid, output_path_prefix=None, prefetch_path="prefetch",
-                 fasterq_dump_path="fasterq-dump", offset="Sanger"):
-        super().__init__(
-            uid, output_path_prefix, prefetch_path, fasterq_dump_path
-        )
+    def __init__(
+        self,
+        uid,
+        output_path_prefix=None,
+        prefetch_path="prefetch",
+        fasterq_dump_path="fasterq-dump",
+        offset="Sanger",
+    ):
+        super().__init__(uid, output_path_prefix, prefetch_path, fasterq_dump_path)
         self._offset = offset
         self._fastq_files = None
     @requires_state(AppState.JOINED)
     def get_fastq(self):
         """
@@ -265,20 +265,16 @@ class FastqDumpApp(_DumpApp):
             ]
         return self._fastq_files
     @requires_state(AppState.JOINED)
     def get_sequences(self):
         return [
             {
-                header: NucleotideSequence(
-                    seq_str.replace("U","T").replace("X","N")
-                )
+                header: NucleotideSequence(seq_str.replace("U", "T").replace("X", "N"))
                 for header, (seq_str, _) in fastq_file.items()
             }
             for fastq_file in self.get_fastq()
         ]
     @requires_state(AppState.JOINED)
     def get_sequences_and_scores(self):
         """
@@ -294,15 +290,17 @@ class FastqDumpApp(_DumpApp):
             Each item in the list is a dictionary mapping identifiers to its
             corresponding sequence and score values.
         """
-        return [
-            get_sequences_and_scores(fastq_file)
-            for fastq_file in self.get_fastq()
-        ]
+        return [get_sequences_and_scores(fastq_file) for fastq_file in self.get_fastq()]
     @classmethod
-    def fetch(cls, uid, output_path_prefix=None, prefetch_path="prefetch",
-              fasterq_dump_path="fasterq-dump", offset="Sanger"):
+    def fetch(
+        cls,
+        uid,
+        output_path_prefix=None,
+        prefetch_path="prefetch",
+        fasterq_dump_path="fasterq-dump",
+        offset="Sanger",
+    ):
         """
         Get the sequences belonging to the UID from the
         *NCBI sequence read archive* (SRA).
@@ -338,9 +336,7 @@ class FastqDumpApp(_DumpApp):
             Each item in the list is a dictionary mapping identifiers to its
             corresponding sequence.
         """
-        app = cls(
-            uid, output_path_prefix, prefetch_path, fasterq_dump_path, offset
-        )
+        app = cls(uid, output_path_prefix, prefetch_path, fasterq_dump_path, offset)
         app.start()
         app.join()
         return app.get_sequences()
@@ -368,14 +364,16 @@ class FastaDumpApp(_DumpApp):
         respectively.
     """
-    def __init__(self, uid, output_path_prefix=None, prefetch_path="prefetch",
-                 fasterq_dump_path="fasterq-dump"):
-        super().__init__(
-            uid, output_path_prefix, prefetch_path, fasterq_dump_path
-        )
+    def __init__(
+        self,
+        uid,
+        output_path_prefix=None,
+        prefetch_path="prefetch",
+        fasterq_dump_path="fasterq-dump",
+    ):
+        super().__init__(uid, output_path_prefix, prefetch_path, fasterq_dump_path)
         self._fasta_files = None
     @requires_state(AppState.CREATED)
     def get_prefetch_options(self):
         return
@@ -383,12 +381,10 @@ class FastaDumpApp(_DumpApp):
         # when https://github.com/ncbi/sra-tools/issues/883 is resolved
         # return "--eliminate-quals"
     @requires_state(AppState.CREATED)
     def get_fastq_dump_options(self):
         return "--fasta"
     @requires_state(AppState.JOINED)
     def get_fasta(self):
         """
@@ -404,20 +400,22 @@ class FastaDumpApp(_DumpApp):
         """
         if self._fasta_files is None:
             self._fasta_files = [
-                FastaFile.read(file_name)
-                for file_name in self.get_file_paths()
+                FastaFile.read(file_name) for file_name in self.get_file_paths()
             ]
         return self._fasta_files
     @requires_state(AppState.JOINED)
     def get_sequences(self):
         return [get_sequences(fasta_file) for fasta_file in self.get_fasta()]
     @classmethod
-    def fetch(cls, uid, output_path_prefix=None, prefetch_path="prefetch",
-              fasterq_dump_path="fasterq-dump"):
+    def fetch(
+        cls,
+        uid,
+        output_path_prefix=None,
+        prefetch_path="prefetch",
+        fasterq_dump_path="fasterq-dump",
+    ):
         """
         Get the sequences belonging to the UID from the
         *NCBI sequence read archive* (SRA).
@@ -448,9 +446,7 @@ class FastaDumpApp(_DumpApp):
             Each item in the list is a dictionary mapping identifiers to its
             corresponding sequence.
         """
-        app = cls(
-            uid, output_path_prefix, prefetch_path, fasterq_dump_path
-        )
+        app = cls(uid, output_path_prefix, prefetch_path, fasterq_dump_path)
         app.start()
         app.join()
-        return app.get_sequences()
+        return app.get_sequences()

biotite/application/tantan/__init__.py CHANGED Viewed

@@ -9,4 +9,4 @@ A subpackage for masking sequence regions using the *tantan* software.
 __name__ = "biotite.application.tantan"
 __author__ = "Patrick Kunzmann"
-from .app import *
+from .app import *

biotite/application/tantan/app.py CHANGED Viewed

@@ -6,17 +6,15 @@ __name__ = "biotite.application.tantan"
 __author__ = "Patrick Kunzmann"
 __all__ = ["TantanApp"]
-from collections.abc import Sequence as SequenceABC
 import io
+from collections.abc import Sequence as SequenceABC
 from tempfile import NamedTemporaryFile
 import numpy as np
-from ..localapp import LocalApp, cleanup_tempfile
-from ..application import AppState, requires_state
-from ...sequence.seqtypes import NucleotideSequence, ProteinSequence
-from ...sequence.alphabet import common_alphabet
-from ...sequence.io.fasta.file import FastaFile
-from ..util import map_sequence, map_matrix
+from biotite.application.application import AppState, requires_state
+from biotite.application.localapp import LocalApp, cleanup_tempfile
+from biotite.sequence.alphabet import common_alphabet
+from biotite.sequence.io.fasta.file import FastaFile
+from biotite.sequence.seqtypes import NucleotideSequence, ProteinSequence
 MASKING_LETTER = "!"
@@ -43,7 +41,7 @@ class TantanApp(LocalApp):
     References
     ----------
     .. footbibliography::
     Examples
@@ -59,10 +57,10 @@ class TantanApp(LocalApp):
       True  True  True  True  True  True  True  True False False False False
      False]
     >>> print(sequence, "\n" + "".join(["^" if e else " " for e in repeat_mask]))
-    GGCATCGATATATATATATAGTCAA
-             ^^^^^^^^^^^
+    GGCATCGATATATATATATAGTCAA
+             ^^^^^^^^^^^
     """
     def __init__(self, sequence, matrix=None, bin_path="tantan"):
         super().__init__(bin_path)
@@ -93,59 +91,43 @@ class TantanApp(LocalApp):
                     )
                 self._is_protein = True
             else:
-                raise TypeError(
-                    "A NucleotideSequence or ProteinSequence is required"
-                )
+                raise TypeError("A NucleotideSequence or ProteinSequence is required")
         if matrix is None:
             self._matrix_file = None
         else:
-            common_alph = common_alphabet(
-                (seq.alphabet for seq in self._sequences)
-            )
+            common_alph = common_alphabet((seq.alphabet for seq in self._sequences))
             if common_alph is None:
-                raise ValueError(
-                    "There is no common alphabet within the sequences"
-                )
+                raise ValueError("There is no common alphabet within the sequences")
             if not matrix.get_alphabet1().extends(common_alph):
                 raise ValueError(
                     "The alphabet of the sequence(s) do not fit the matrix"
                 )
             if not matrix.is_symmetric():
                 raise ValueError("A symmetric matrix is required")
-            self._matrix_file = NamedTemporaryFile(
-                "w", suffix=".mat", delete=False
-            )
+            self._matrix_file = NamedTemporaryFile("w", suffix=".mat", delete=False)
         self._matrix = matrix
-        self._in_file = NamedTemporaryFile("w", suffix=".fa", delete=False)
+        self._in_file = NamedTemporaryFile("w", suffix=".fa", delete=False)
     def run(self):
         FastaFile.write_iter(
             self._in_file,
-            (
-                (f"sequence_{i:d}", str(seq))
-                for i, seq in enumerate(self._sequences)
-            )
+            ((f"sequence_{i:d}", str(seq)) for i, seq in enumerate(self._sequences)),
         )
         self._in_file.flush()
         if self._matrix is not None:
             self._matrix_file.write(str(self._matrix))
             self._matrix_file.flush()
         args = []
         if self._matrix is not None:
             args += ["-m", self._matrix_file.name]
         if self._is_protein:
-             args += ["-p"]
-        args += [
-            "-x", MASKING_LETTER,
-            self._in_file.name
-        ]
+            args += ["-p"]
+        args += ["-x", MASKING_LETTER, self._in_file.name]
         self.set_arguments(args)
         super().run()
     def evaluate(self):
         super().evaluate()
@@ -154,18 +136,14 @@ class TantanApp(LocalApp):
         self._masks = []
         encoded_masking_letter = MASKING_LETTER.encode("ASCII")[0]
         for _, masked_seq_string in FastaFile.read_iter(out_file):
-            array = np.frombuffer(
-                masked_seq_string.encode("ASCII"), dtype=np.ubyte
-            )
+            array = np.frombuffer(masked_seq_string.encode("ASCII"), dtype=np.ubyte)
             self._masks.append(array == encoded_masking_letter)
     def clean_up(self):
         super().clean_up()
         cleanup_tempfile(self._in_file)
         if self._matrix_file is not None:
             cleanup_tempfile(self._matrix_file)
     @requires_state(AppState.JOINED)
     def get_mask(self):
@@ -186,7 +164,6 @@ class TantanApp(LocalApp):
         else:
             return self._masks[0]
     @staticmethod
     def mask_repeats(sequence, matrix=None, bin_path="tantan"):
         """
@@ -219,4 +196,4 @@ class TantanApp(LocalApp):
         app = TantanApp(sequence, matrix, bin_path)
         app.start()
         app.join()
-        return app.get_mask()
+        return app.get_mask()

biotite/application/util.py CHANGED Viewed

@@ -8,15 +8,15 @@ __all__ = ["map_sequence", "map_matrix"]
 import numpy as np
-from ..sequence.seqtypes import ProteinSequence
-from ..sequence.align.matrix import SubstitutionMatrix
+from biotite.sequence.align.matrix import SubstitutionMatrix
+from biotite.sequence.seqtypes import ProteinSequence
 def map_sequence(sequence):
     """
     Map a sequence with an arbitrary alphabet into a
     :class:`ProteinSequence`, in order to support arbitrary sequence
-    types in software that can handle protein sequences.
+    types in software that can handle protein sequences.
     """
     if len(sequence.alphabet) > len(ProteinSequence.alphabet):
         # Cannot map into a protein sequence if the alphabet
@@ -39,12 +39,11 @@ def map_matrix(matrix):
     Map a :class:`SubstitutionMatrix` with an arbitrary alphabet into a
     class:`SubstitutionMatrix` for protein sequences, in order to support
     arbitrary sequence types in software that can handle protein
-    sequences.
+    sequences.
     """
     if matrix is None:
         raise TypeError(
-            "A substitution matrix must be provided for custom "
-            "sequence types"
+            "A substitution matrix must be provided for custom " "sequence types"
         )
     # Create a protein substitution matrix with the values taken
     # from the original matrix
@@ -54,6 +53,5 @@ def map_matrix(matrix):
     new_score_matrix = np.zeros((new_length, new_length))
     new_score_matrix[:old_length, :old_length] = matrix.score_matrix()
     return SubstitutionMatrix(
-        ProteinSequence.alphabet, ProteinSequence.alphabet,
-        new_score_matrix
-    )
+        ProteinSequence.alphabet, ProteinSequence.alphabet, new_score_matrix
+    )