PyPI - biotite - Versions diffs - 0.41.2__cp311-cp311-macosx_11_0_arm64.whl → 1.0.0__cp311-cp311-macosx_11_0_arm64.whl - Mend

biotite 0.41.2__cp311-cp311-macosx_11_0_arm64.whl → 1.0.0__cp311-cp311-macosx_11_0_arm64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of biotite might be problematic. Click here for more details.

Files changed (205) hide show

biotite/__init__.py +2 -3
biotite/application/__init__.py +1 -1
biotite/application/application.py +20 -10
biotite/application/autodock/__init__.py +1 -1
biotite/application/autodock/app.py +74 -79
biotite/application/blast/__init__.py +1 -1
biotite/application/blast/alignment.py +19 -10
biotite/application/blast/webapp.py +92 -85
biotite/application/clustalo/__init__.py +1 -1
biotite/application/clustalo/app.py +46 -61
biotite/application/dssp/__init__.py +1 -1
biotite/application/dssp/app.py +8 -11
biotite/application/localapp.py +62 -60
biotite/application/mafft/__init__.py +1 -1
biotite/application/mafft/app.py +16 -22
biotite/application/msaapp.py +78 -89
biotite/application/muscle/__init__.py +1 -1
biotite/application/muscle/app3.py +50 -64
biotite/application/muscle/app5.py +23 -31
biotite/application/sra/__init__.py +1 -1
biotite/application/sra/app.py +64 -68
biotite/application/tantan/__init__.py +1 -1
biotite/application/tantan/app.py +22 -45
biotite/application/util.py +7 -9
biotite/application/viennarna/rnaalifold.py +34 -28
biotite/application/viennarna/rnafold.py +24 -39
biotite/application/viennarna/rnaplot.py +36 -21
biotite/application/viennarna/util.py +17 -12
biotite/application/webapp.py +13 -14
biotite/copyable.py +13 -13
biotite/database/__init__.py +1 -1
biotite/database/entrez/__init__.py +1 -1
biotite/database/entrez/check.py +2 -3
biotite/database/entrez/dbnames.py +7 -5
biotite/database/entrez/download.py +55 -49
biotite/database/entrez/key.py +1 -1
biotite/database/entrez/query.py +62 -23
biotite/database/error.py +2 -1
biotite/database/pubchem/__init__.py +1 -1
biotite/database/pubchem/download.py +43 -45
biotite/database/pubchem/error.py +2 -2
biotite/database/pubchem/query.py +34 -31
biotite/database/pubchem/throttle.py +3 -4
biotite/database/rcsb/__init__.py +1 -1
biotite/database/rcsb/download.py +44 -52
biotite/database/rcsb/query.py +85 -80
biotite/database/uniprot/check.py +6 -3
biotite/database/uniprot/download.py +6 -11
biotite/database/uniprot/query.py +115 -31
biotite/file.py +12 -31
biotite/sequence/__init__.py +3 -3
biotite/sequence/align/__init__.py +2 -2
biotite/sequence/align/alignment.py +99 -90
biotite/sequence/align/banded.cpython-311-darwin.so +0 -0
biotite/sequence/align/buckets.py +12 -10
biotite/sequence/align/cigar.py +43 -52
biotite/sequence/align/kmeralphabet.cpython-311-darwin.so +0 -0
biotite/sequence/align/kmeralphabet.pyx +55 -51
biotite/sequence/align/kmersimilarity.cpython-311-darwin.so +0 -0
biotite/sequence/align/kmertable.cpython-311-darwin.so +0 -0
biotite/sequence/align/kmertable.pyx +3 -2
biotite/sequence/align/localgapped.cpython-311-darwin.so +0 -0
biotite/sequence/align/localungapped.cpython-311-darwin.so +0 -0
biotite/sequence/align/matrix.py +81 -82
biotite/sequence/align/multiple.cpython-311-darwin.so +0 -0
biotite/sequence/align/multiple.pyx +1 -1
biotite/sequence/align/pairwise.cpython-311-darwin.so +0 -0
biotite/sequence/align/permutation.cpython-311-darwin.so +0 -0
biotite/sequence/align/permutation.pyx +12 -4
biotite/sequence/align/selector.cpython-311-darwin.so +0 -0
biotite/sequence/align/selector.pyx +52 -54
biotite/sequence/align/statistics.py +32 -33
biotite/sequence/align/tracetable.cpython-311-darwin.so +0 -0
biotite/sequence/alphabet.py +51 -65
biotite/sequence/annotation.py +78 -77
biotite/sequence/codec.cpython-311-darwin.so +0 -0
biotite/sequence/codon.py +90 -79
biotite/sequence/graphics/__init__.py +1 -1
biotite/sequence/graphics/alignment.py +184 -103
biotite/sequence/graphics/colorschemes.py +10 -12
biotite/sequence/graphics/dendrogram.py +79 -34
biotite/sequence/graphics/features.py +133 -99
biotite/sequence/graphics/logo.py +22 -28
biotite/sequence/graphics/plasmid.py +229 -178
biotite/sequence/io/fasta/__init__.py +1 -1
biotite/sequence/io/fasta/convert.py +44 -33
biotite/sequence/io/fasta/file.py +42 -55
biotite/sequence/io/fastq/__init__.py +1 -1
biotite/sequence/io/fastq/convert.py +11 -14
biotite/sequence/io/fastq/file.py +68 -112
biotite/sequence/io/genbank/__init__.py +2 -2
biotite/sequence/io/genbank/annotation.py +12 -20
biotite/sequence/io/genbank/file.py +74 -76
biotite/sequence/io/genbank/metadata.py +74 -62
biotite/sequence/io/genbank/sequence.py +13 -14
biotite/sequence/io/general.py +39 -30
biotite/sequence/io/gff/__init__.py +2 -2
biotite/sequence/io/gff/convert.py +10 -15
biotite/sequence/io/gff/file.py +81 -65
biotite/sequence/phylo/__init__.py +1 -1
biotite/sequence/phylo/nj.cpython-311-darwin.so +0 -0
biotite/sequence/phylo/tree.cpython-311-darwin.so +0 -0
biotite/sequence/phylo/upgma.cpython-311-darwin.so +0 -0
biotite/sequence/profile.py +57 -28
biotite/sequence/search.py +17 -15
biotite/sequence/seqtypes.py +200 -164
biotite/sequence/sequence.py +15 -17
biotite/structure/__init__.py +3 -3
biotite/structure/atoms.py +221 -235
biotite/structure/basepairs.py +260 -271
biotite/structure/bonds.cpython-311-darwin.so +0 -0
biotite/structure/bonds.pyx +29 -32
biotite/structure/box.py +67 -71
biotite/structure/celllist.cpython-311-darwin.so +0 -0
biotite/structure/chains.py +55 -39
biotite/structure/charges.cpython-311-darwin.so +0 -0
biotite/structure/compare.py +32 -32
biotite/structure/density.py +13 -18
biotite/structure/dotbracket.py +20 -22
biotite/structure/error.py +10 -2
biotite/structure/filter.py +82 -77
biotite/structure/geometry.py +130 -119
biotite/structure/graphics/atoms.py +60 -43
biotite/structure/graphics/rna.py +81 -68
biotite/structure/hbond.py +112 -93
biotite/structure/info/__init__.py +0 -2
biotite/structure/info/atoms.py +10 -11
biotite/structure/info/bonds.py +41 -43
biotite/structure/info/ccd.py +4 -5
biotite/structure/info/groups.py +1 -3
biotite/structure/info/masses.py +5 -10
biotite/structure/info/misc.py +1 -1
biotite/structure/info/radii.py +20 -20
biotite/structure/info/standardize.py +15 -26
biotite/structure/integrity.py +18 -71
biotite/structure/io/__init__.py +3 -4
biotite/structure/io/dcd/__init__.py +1 -1
biotite/structure/io/dcd/file.py +22 -20
biotite/structure/io/general.py +47 -61
biotite/structure/io/gro/__init__.py +1 -1
biotite/structure/io/gro/file.py +73 -72
biotite/structure/io/mol/__init__.py +1 -1
biotite/structure/io/mol/convert.py +8 -11
biotite/structure/io/mol/ctab.py +37 -36
biotite/structure/io/mol/header.py +14 -10
biotite/structure/io/mol/mol.py +9 -53
biotite/structure/io/mol/sdf.py +47 -50
biotite/structure/io/netcdf/__init__.py +1 -1
biotite/structure/io/netcdf/file.py +24 -23
biotite/structure/io/pdb/__init__.py +1 -1
biotite/structure/io/pdb/convert.py +32 -20
biotite/structure/io/pdb/file.py +151 -172
biotite/structure/io/pdb/hybrid36.cpython-311-darwin.so +0 -0
biotite/structure/io/pdbqt/__init__.py +1 -1
biotite/structure/io/pdbqt/convert.py +17 -11
biotite/structure/io/pdbqt/file.py +128 -80
biotite/structure/io/pdbx/__init__.py +1 -2
biotite/structure/io/pdbx/bcif.py +36 -44
biotite/structure/io/pdbx/cif.py +64 -62
biotite/structure/io/pdbx/component.py +10 -16
biotite/structure/io/pdbx/convert.py +235 -246
biotite/structure/io/pdbx/encoding.cpython-311-darwin.so +0 -0
biotite/structure/io/trajfile.py +76 -93
biotite/structure/io/trr/__init__.py +1 -1
biotite/structure/io/trr/file.py +12 -15
biotite/structure/io/xtc/__init__.py +1 -1
biotite/structure/io/xtc/file.py +11 -14
biotite/structure/mechanics.py +9 -11
biotite/structure/molecules.py +3 -4
biotite/structure/pseudoknots.py +53 -67
biotite/structure/rdf.py +23 -21
biotite/structure/repair.py +137 -86
biotite/structure/residues.py +26 -16
biotite/structure/sasa.cpython-311-darwin.so +0 -0
biotite/structure/{resutil.py → segments.py} +24 -23
biotite/structure/sequence.py +10 -11
biotite/structure/sse.py +100 -119
biotite/structure/superimpose.py +39 -77
biotite/structure/transform.py +97 -71
biotite/structure/util.py +11 -13
biotite/version.py +2 -2
biotite/visualize.py +69 -55
{biotite-0.41.2.dist-info → biotite-1.0.0.dist-info}/METADATA +5 -5
biotite-1.0.0.dist-info/RECORD +322 -0
biotite/structure/io/ctab.py +0 -72
biotite/structure/io/mmtf/__init__.py +0 -21
biotite/structure/io/mmtf/assembly.py +0 -214
biotite/structure/io/mmtf/convertarray.cpython-311-darwin.so +0 -0
biotite/structure/io/mmtf/convertarray.pyx +0 -341
biotite/structure/io/mmtf/convertfile.cpython-311-darwin.so +0 -0
biotite/structure/io/mmtf/convertfile.pyx +0 -501
biotite/structure/io/mmtf/decode.cpython-311-darwin.so +0 -0
biotite/structure/io/mmtf/decode.pyx +0 -152
biotite/structure/io/mmtf/encode.cpython-311-darwin.so +0 -0
biotite/structure/io/mmtf/encode.pyx +0 -183
biotite/structure/io/mmtf/file.py +0 -233
biotite/structure/io/npz/__init__.py +0 -20
biotite/structure/io/npz/file.py +0 -152
biotite/structure/io/pdbx/legacy.py +0 -267
biotite/structure/io/tng/__init__.py +0 -13
biotite/structure/io/tng/file.py +0 -46
biotite/temp.py +0 -86
biotite-0.41.2.dist-info/RECORD +0 -340
{biotite-0.41.2.dist-info → biotite-1.0.0.dist-info}/WHEEL +0 -0
{biotite-0.41.2.dist-info → biotite-1.0.0.dist-info}/licenses/LICENSE.rst +0 -0

biotite/database/rcsb/download.py CHANGED Viewed

@@ -6,20 +6,17 @@ __name__ = "biotite.database.rcsb"
 __author__ = "Patrick Kunzmann"
 __all__ = ["fetch"]
-import requests
-from os.path import isdir, isfile, join, getsize
-import os
-import glob
 import io
-from ..error import RequestError
+import os
+from os.path import getsize, isfile, join
+import requests
+from biotite.database.error import RequestError
 _standard_url = "https://files.rcsb.org/download/"
-_mmtf_url = "https://mmtf.rcsb.org/v1.0/full/"
 _bcif_url = "https://models.rcsb.org/"
 _fasta_url = "https://www.rcsb.org/fasta/entry/"
-_binary_formats = ["mmtf", "bcif"]
+_binary_formats = ["bcif"]
 def fetch(pdb_ids, format, target_path=None, overwrite=False, verbose=False):
@@ -34,7 +31,7 @@ def fetch(pdb_ids, format, target_path=None, overwrite=False, verbose=False):
     pdb_ids : str or iterable object of str
         A single PDB ID or a list of PDB IDs of the structure(s)
         to be downloaded.
-    format : {'pdb', 'pdbx', 'cif', 'mmcif', 'bcif', 'mmtf', 'fasta'}
+    format : {'pdb', 'pdbx', 'cif', 'mmcif', 'bcif', 'fasta'}
         The format of the files to be downloaded.
         ``'pdbx'``, ``'cif'`` and ``'mmcif'`` are synonyms for
         the same format.
@@ -94,8 +91,7 @@ def fetch(pdb_ids, format, target_path=None, overwrite=False, verbose=False):
     for i, id in enumerate(pdb_ids):
         # Verbose output
         if verbose:
-            print(f"Fetching file {i+1:d} / {len(pdb_ids):d} ({id})...",
-                  end="\r")
+            print(f"Fetching file {i+1:d} / {len(pdb_ids):d} ({id})...", end="\r")
         # Fetch file from database
         if target_path is not None:
@@ -104,42 +100,35 @@ def fetch(pdb_ids, format, target_path=None, overwrite=False, verbose=False):
             # 'file = None' -> store content in a file-like object
             file = None
-        if file is None \
-           or not isfile(file) \
-           or getsize(file) == 0 \
-           or overwrite:
-                if format == "pdb":
-                    r = requests.get(_standard_url + id + ".pdb")
-                    content = r.text
-                    _assert_valid_file(content, id)
-                elif format in ["cif", "mmcif", "pdbx"]:
-                    r = requests.get(_standard_url + id + ".cif")
-                    content = r.text
-                    _assert_valid_file(content, id)
-                elif format in ["bcif"]:
-                    r = requests.get(_bcif_url + id + ".bcif")
-                    content = r.content
-                    _assert_valid_file(r.text, id)
-                elif format == "mmtf":
-                    r = requests.get(_mmtf_url + id)
-                    content = r.content
-                    _assert_valid_file(r.text, id)
-                elif format == "fasta":
-                    r = requests.get(_fasta_url + id)
-                    content = r.text
-                    _assert_valid_file(content, id)
-                else:
-                    raise ValueError(f"Format '{format}' is not supported")
-                if file is None:
-                    if format in _binary_formats:
-                        file = io.BytesIO(content)
-                    else:
-                        file = io.StringIO(content)
+        if file is None or not isfile(file) or getsize(file) == 0 or overwrite:
+            if format == "pdb":
+                r = requests.get(_standard_url + id + ".pdb")
+                content = r.text
+                _assert_valid_file(content, id)
+            elif format in ["cif", "mmcif", "pdbx"]:
+                r = requests.get(_standard_url + id + ".cif")
+                content = r.text
+                _assert_valid_file(content, id)
+            elif format in ["bcif"]:
+                r = requests.get(_bcif_url + id + ".bcif")
+                content = r.content
+                _assert_valid_file(r.text, id)
+            elif format == "fasta":
+                r = requests.get(_fasta_url + id)
+                content = r.text
+                _assert_valid_file(content, id)
+            else:
+                raise ValueError(f"Format '{format}' is not supported")
+            if file is None:
+                if format in _binary_formats:
+                    file = io.BytesIO(content)
                 else:
-                    mode = "wb+" if format in _binary_formats else "w+"
-                    with open(file, mode) as f:
-                        f.write(content)
+                    file = io.StringIO(content)
+            else:
+                mode = "wb+" if format in _binary_formats else "w+"
+                with open(file, mode) as f:
+                    f.write(content)
         files.append(file)
     if verbose:
@@ -158,10 +147,13 @@ def _assert_valid_file(response_text, pdb_id):
     """
     # Structure file and FASTA file retrieval
     # have different error messages
-    if len(response_text) == 0 or any(err_msg in response_text for err_msg in [
-        "404 Not Found",
-        "<title>RCSB Protein Data Bank Error Page</title>",
-        "No fasta files were found.",
-        "No valid PDB IDs were submitted.",
-    ]):
+    if len(response_text) == 0 or any(
+        err_msg in response_text
+        for err_msg in [
+            "404 Not Found",
+            "<title>RCSB Protein Data Bank Error Page</title>",
+            "No fasta files were found.",
+            "No valid PDB IDs were submitted.",
+        ]
+    ):
         raise RequestError("PDB ID {:} is invalid".format(pdb_id))

biotite/database/rcsb/query.py CHANGED Viewed

@@ -4,28 +4,38 @@
 __name__ = "biotite.database.rcsb"
 __author__ = "Patrick Kunzmann, Maximilian Dombrowsky"
-__all__ = ["Query", "SingleQuery", "CompositeQuery",
-           "BasicQuery", "FieldQuery",
-           "SequenceQuery", "StructureQuery", "MotifQuery",
-           "Sorting",
-           "Grouping", "DepositGrouping", "IdentityGrouping", "UniprotGrouping",
-           "search", "count"]
+__all__ = [
+    "Query",
+    "SingleQuery",
+    "CompositeQuery",
+    "BasicQuery",
+    "FieldQuery",
+    "SequenceQuery",
+    "StructureQuery",
+    "MotifQuery",
+    "Sorting",
+    "Grouping",
+    "DepositGrouping",
+    "IdentityGrouping",
+    "UniprotGrouping",
+    "search",
+    "count",
+]
 import abc
-import json
 import copy
+import json
 from datetime import datetime
 import numpy as np
 import requests
-from ...sequence.seqtypes import NucleotideSequence
-from ..error import RequestError
+from biotite.database.error import RequestError
+from biotite.sequence.seqtypes import NucleotideSequence
 _search_url = "https://search.rcsb.org/rcsbsearch/v2/query"
 _scope_to_target = {
     "protein": "pdb_protein_sequence",
-    "rna":     "pdb_rna_sequence",
-    "dna":     "pdb_dna_sequence"
+    "rna": "pdb_rna_sequence",
+    "dna": "pdb_dna_sequence",
 }
@@ -35,6 +45,7 @@ class Query(metaclass=abc.ABCMeta):
     This is the abstract base class for all queries.
     """
     @abc.abstractmethod
     def get_content(self):
         """
@@ -58,7 +69,6 @@ class Query(metaclass=abc.ABCMeta):
         return CompositeQuery([self, query], "or")
 class SingleQuery(Query, metaclass=abc.ABCMeta):
     """
     A terminal query node for the RCSB search API.
@@ -69,6 +79,7 @@ class SingleQuery(Query, metaclass=abc.ABCMeta):
     This is the abstract base class for all queries that are
     terminal nodes.
     """
     @abc.abstractmethod
     def get_content(self):
         return {"parameters": {}}
@@ -91,12 +102,11 @@ class CompositeQuery(Query):
     operator : {'or', 'and'}
         The type of combination.
     """
     def __init__(self, queries, operator):
         self._queries = queries
         if operator not in ("or", "and"):
-            raise ValueError(
-                f"Operator must be 'or' or 'and', not '{operator}'"
-            )
+            raise ValueError(f"Operator must be 'or' or 'and', not '{operator}'")
         self._operator = operator
     def get_content(self):
@@ -113,12 +123,11 @@ class CompositeQuery(Query):
         content = {
             "type": "group",
             "logical_operator": self._operator,
-            "nodes": [query.get_content() for query in self._queries]
+            "nodes": [query.get_content() for query in self._queries],
         }
         return content
 class BasicQuery(SingleQuery):
     """
     A text query for searching for a given term across all available
@@ -139,8 +148,9 @@ class BasicQuery(SingleQuery):
     >>> query = BasicQuery("tc5b")
     >>> print(sorted(search(query)))
-    ['1L2Y', '8ANG', '8ANH', '8ANI', '8ANM']
+    ['1L2Y', '8ANG', '8ANH', '8ANI', '8ANM', '8QWW']
     """
     def __init__(self, term):
         super().__init__()
         self._term = term
@@ -212,7 +222,10 @@ class FieldQuery(SingleQuery):
     >>> print(sorted(search(query)))
     ['1EJG', '1I0T', '3NIR', '3P4J', '4JLJ', '5D8V', '5NW3', '7ATG', '7R0H']
     """
-    def __init__(self, field, molecular_definition=False, case_sensitive=False, **kwargs):
+    def __init__(
+        self, field, molecular_definition=False, case_sensitive=False, **kwargs
+    ):
         super().__init__()
         self._negation = False
         self._field = field
@@ -231,20 +244,25 @@ class FieldQuery(SingleQuery):
         if self._operator not in [
             "exact_match",
-            "contains_words", "contains_phrase",
-            "greater", "less", "greater_or_equal", "less_or_equal", "equals",
-            "range", "range_closed",
+            "contains_words",
+            "contains_phrase",
+            "greater",
+            "less",
+            "greater_or_equal",
+            "less_or_equal",
+            "equals",
+            "range",
+            "range_closed",
             "is_in",
-            "exists"
+            "exists",
         ]:
             raise TypeError(
-                f"Constructor got an unexpected keyword argument "
-                f"'{self._operator}'"
+                f"Constructor got an unexpected keyword argument " f"'{self._operator}'"
             )
         # Convert dates into ISO 8601
         if isinstance(self._value, datetime):
-             self._value = _to_isoformat(self._value)
+            self._value = _to_isoformat(self._value)
         elif isinstance(self._value, (tuple, list, np.ndarray)):
             self._value = [
                 _to_isoformat(val) if isinstance(val, datetime) else val
@@ -257,14 +275,14 @@ class FieldQuery(SingleQuery):
                 "from": self._value[0],
                 "include_lower": False,
                 "to": self._value[1],
-                "include_upper": False
+                "include_upper": False,
             }
         elif self._operator == "range_closed":
             self._value = {
                 "from": self._value[0],
                 "include_lower": True,
                 "to": self._value[1],
-                "include_upper": True
+                "include_upper": True,
             }
         # Rename operators to names used in API
@@ -332,8 +350,8 @@ class SequenceQuery(SingleQuery):
     >>> print(sorted(search(query)))
     ['1L2Y', '1RIJ', '2JOF', '2LDJ', '2LL5', '2MJ9', '3UC7', '3UC8']
     """
-    def __init__(self, sequence, scope,
-                 min_identity=0.0, max_expect_value=10000000.0):
+    def __init__(self, sequence, scope, min_identity=0.0, max_expect_value=10000000.0):
         super().__init__()
         self._target = _scope_to_target.get(scope.lower())
         if self._target is None:
@@ -381,6 +399,7 @@ class MotifQuery(SingleQuery):
     ...     "protein"
     ... )
     """
     def __init__(self, pattern, pattern_type, scope):
         super().__init__()
         self._pattern = pattern
@@ -424,27 +443,20 @@ class StructureQuery(SingleQuery):
     >>> print(sorted(search(query)))
     ['1L2Y', '1RIJ', '2JOF', '2LDJ', '2M7D', '7MQS']
     """
     def __init__(self, pdb_id, chain=None, assembly=None, strict=True):
         super().__init__()
-        if (chain is None and assembly is None) \
-           or (chain is not None and assembly is not None):
-                raise TypeError(
-                    "Either the chain ID or assembly ID must be set"
-                )
+        if (chain is None and assembly is None) or (
+            chain is not None and assembly is not None
+        ):
+            raise TypeError("Either the chain ID or assembly ID must be set")
         elif chain is None:
-            self._value = {
-                "entry_id": pdb_id,
-                "asssembly_id": assembly
-            }
+            self._value = {"entry_id": pdb_id, "asssembly_id": assembly}
         else:
-            self._value = {
-                "entry_id": pdb_id,
-                "asym_id": chain
-            }
+            self._value = {"entry_id": pdb_id, "asym_id": chain}
-        self._operator = "strict_shape_match" if strict \
-                         else "relaxed_shape_match"
+        self._operator = "strict_shape_match" if strict else "relaxed_shape_match"
     def get_content(self):
         content = super().get_content()
@@ -455,10 +467,7 @@ class StructureQuery(SingleQuery):
         return content
 class Sorting:
     def __init__(self, field, descending=True):
         self._field = field
         self._descending = descending
@@ -487,12 +496,7 @@ class Sorting:
             ``'ranking_criteria_type'`` attributes.
         """
         direction = "desc" if self._descending else "asc"
-        return {
-            "sort_by" : self._field,
-            "direction" : direction
-        }
+        return {"sort_by": self._field, "direction": direction}
 class Grouping(metaclass=abc.ABCMeta):
@@ -539,7 +543,7 @@ class Grouping(metaclass=abc.ABCMeta):
             The content dictionary for the ``'group_by'`` attributes.
         """
         if self._sorting is not None:
-            return {"ranking_criteria_type" : self._sorting.get_content()}
+            return {"ranking_criteria_type": self._sorting.get_content()}
         else:
             return {}
@@ -627,6 +631,7 @@ class IdentityGrouping(Grouping):
         To choose the order a :class:`Sorting` object needs to be
         provided.
     """
     def __init__(self, similarity_cutoff, sort_by=None):
         super().__init__(sort_by)
         if similarity_cutoff not in (100, 95, 90, 70, 50, 30):
@@ -677,11 +682,7 @@ class UniprotGrouping(Grouping):
         return return_type == "polymer_entity"
-def count(query, return_type="entry", group_by=None,
-          content_types=("experimental",)):
+def count(query, return_type="entry", group_by=None, content_types=("experimental",)):
     """
     Count PDB entries that meet the given query requirements,
     via the RCSB search API.
@@ -737,9 +738,7 @@ def count(query, return_type="entry", group_by=None,
     >>> print(sorted(ids))
     ['1EJG', '1I0T', '3NIR', '3P4J', '4JLJ', '5D8V', '5NW3', '7ATG', '7R0H']
     """
-    query_dict = _initialize_query_dict(
-        query, return_type, group_by, content_types
-    )
+    query_dict = _initialize_query_dict(query, return_type, group_by, content_types)
     query_dict["request_options"]["return_counts"] = True
@@ -761,8 +760,15 @@ def count(query, return_type="entry", group_by=None,
             raise RequestError(f"Error {r.status_code}")
-def search(query, return_type="entry", range=None, sort_by=None, group_by=None,
-           return_groups=False, content_types=("experimental",)):
+def search(
+    query,
+    return_type="entry",
+    range=None,
+    sort_by=None,
+    group_by=None,
+    return_groups=False,
+    content_types=("experimental",),
+):
     """
     Get all PDB IDs that meet the given query requirements,
     via the RCSB search API.
@@ -862,19 +868,15 @@ def search(query, return_type="entry", range=None, sort_by=None, group_by=None,
     ...     query, return_type="polymer_entity", return_groups=True,
     ...     group_by=UniprotGrouping(sort_by="rcsb_accession_info.initial_release_date"),
     ... ))
-    {'P24297': ['5NW3_1'], 'P27707': ['4JLJ_1'], 'P80176': ['5D8V_1'], 'O29777': ['7R0H_1'], 'P01542': ['3NIR_1', '1EJG_1']}
+     {'P24297': ['5NW3_1'], 'P27707': ['4JLJ_1'], 'P80176': ['5D8V_1'], 'O29777': ['7R0H_1'], 'P01542': ['1EJG_1', '3NIR_1']}
     """
-    query_dict = _initialize_query_dict(
-        query, return_type, group_by, content_types
-    )
+    query_dict = _initialize_query_dict(query, return_type, group_by, content_types)
     if group_by is not None:
         if return_groups:
-            query_dict["request_options"]["group_by_return_type"] \
-                = "groups"
+            query_dict["request_options"]["group_by_return_type"] = "groups"
         else:
-            query_dict["request_options"]["group_by_return_type"] \
-                = "representatives"
+            query_dict["request_options"]["group_by_return_type"] = "representatives"
     if sort_by is not None:
         if isinstance(sort_by, Sorting):
@@ -890,7 +892,7 @@ def search(query, return_type="entry", range=None, sort_by=None, group_by=None,
     else:
         query_dict["request_options"]["paginate"] = {
             "start": int(range[0]),
-            "rows": int(range[1]) - int(range[0])
+            "rows": int(range[1]) - int(range[0]),
         }
     r = requests.get(_search_url, params={"json": json.dumps(query_dict)})
@@ -900,7 +902,7 @@ def search(query, return_type="entry", range=None, sort_by=None, group_by=None,
             return [result["identifier"] for result in r.json()["result_set"]]
         else:
             return {
-                group["identifier"] : [
+                group["identifier"]: [
                     result["identifier"] for result in group["result_set"]
                 ]
                 for group in r.json()["group_set"]
@@ -922,8 +924,11 @@ def _initialize_query_dict(query, return_type, group_by, content_types):
     `count()` and `search()` have in common.
     """
     if return_type not in [
-        "entry", "polymer_instance", "assembly",
-        "polymer_entity", "non_polymer_entity",
+        "entry",
+        "polymer_instance",
+        "assembly",
+        "polymer_entity",
+        "non_polymer_entity",
     ]:
         raise ValueError(f"'{return_type}' is an invalid return type")
@@ -947,7 +952,7 @@ def _initialize_query_dict(query, return_type, group_by, content_types):
     query_dict = {
         "query": query.get_content(),
         "return_type": return_type,
-        "request_options": request_options
+        "request_options": request_options,
     }
     return query_dict
@@ -956,4 +961,4 @@ def _to_isoformat(object):
     """
     Convert a datetime into the specifc ISO 8601 format required by the RCSB.
     """
-    return object.strftime("%Y-%m-%dT%H:%M:%SZ")
+    return object.strftime("%Y-%m-%dT%H:%M:%SZ")

biotite/database/uniprot/check.py CHANGED Viewed

@@ -6,7 +6,7 @@ __name__ = "biotite.database.uniprot"
 __author__ = "Maximilian Greil"
 __all__ = ["assert_valid_response"]
-from ..error import RequestError
+from biotite.database.error import RequestError
 # Taken from https://www.uniprot.org/help/api_retrieve_entries
@@ -27,6 +27,9 @@ def assert_valid_response(response_status_code):
         raise RequestError("Gone. The resource you requested was removed.")
     elif response_status_code == 500:
         raise RequestError(
-            "Internal server error. Most likely a temporary problem, but if the problem persists please contact UniProt team.")
+            "Internal server error. Most likely a temporary problem, but if the problem persists please contact UniProt team."
+        )
     elif response_status_code == 503:
-        raise RequestError("Service not available. The server is being updated, try again later.")
+        raise RequestError(
+            "Service not available. The server is being updated, try again later."
+        )

biotite/database/uniprot/download.py CHANGED Viewed

@@ -6,11 +6,11 @@ __name__ = "biotite.database.uniprot"
 __author__ = "Maximilian Greil"
 __all__ = ["fetch"]
-from os.path import isdir, isfile, join, getsize
-import os
 import io
+import os
+from os.path import getsize, isdir, isfile, join
 import requests
-from .check import assert_valid_response
+from biotite.database.uniprot.check import assert_valid_response
 _fetch_url = "https://rest.uniprot.org/"
@@ -36,8 +36,7 @@ def _get_database_name(id):
     return "uniprotkb"
-def fetch(ids, format, target_path=None,
-          overwrite=False, verbose=False):
+def fetch(ids, format, target_path=None, overwrite=False, verbose=False):
     """
     Download files from the UniProt in various formats.
@@ -101,18 +100,14 @@ def fetch(ids, format, target_path=None,
         db_name = _get_database_name(id)
         # Verbose output
         if verbose:
-            print(f"Fetching file {i + 1:d} / {len(ids):d} ({id})...",
-                  end="\r")
+            print(f"Fetching file {i + 1:d} / {len(ids):d} ({id})...", end="\r")
         # Fetch file from database
         if target_path is not None:
             file = join(target_path, id + "." + format)
         else:
             # 'file = None' -> store content in a file-like object
             file = None
-        if file is None \
-                or not isfile(file) \
-                or getsize(file) == 0 \
-                or overwrite:
+        if file is None or not isfile(file) or getsize(file) == 0 or overwrite:
             if format in ["fasta", "gff", "txt", "xml", "rdf", "tab"]:
                 r = requests.get(_fetch_url + db_name + "/" + id + "." + format)
                 content = r.text