PyPI - napistu - Versions diffs - 0.3.6__py3-none-any.whl → 0.3.7__py3-none-any.whl - Mend

napistu 0.3.6py3-none-any.whl → 0.3.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

napistu/__main__.py +20 -9
napistu/consensus.py +19 -25
napistu/constants.py +90 -64
napistu/indices.py +3 -1
napistu/ingestion/sbml.py +298 -295
napistu/ingestion/string.py +14 -18
napistu/ingestion/trrust.py +22 -27
napistu/matching/species.py +1 -1
napistu/ontologies/genodexito.py +5 -1
napistu/ontologies/renaming.py +4 -0
napistu/sbml_dfs_core.py +127 -64
napistu/sbml_dfs_utils.py +4 -0
napistu/utils.py +52 -41
{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/METADATA +1 -1
{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/RECORD +27 -27
tests/conftest.py +70 -13
tests/test_consensus.py +74 -5
tests/test_gaps.py +26 -15
tests/test_network_net_create.py +1 -1
tests/test_network_precompute.py +1 -1
tests/test_ontologies_renaming.py +28 -24
tests/test_sbml_dfs_core.py +165 -15
tests/test_utils.py +19 -0
{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/WHEEL +0 -0
{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/entry_points.txt +0 -0
{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/licenses/LICENSE +0 -0
{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/top_level.txt +0 -0

tests/test_sbml_dfs_core.py CHANGED Viewed

@@ -5,6 +5,7 @@ import os
 import numpy as np
 import pandas as pd
 import pytest
+from napistu import identifiers
 from napistu import sbml_dfs_core
 from napistu.source import Source
 from napistu.ingestion import sbml
@@ -25,11 +26,13 @@ from unittest.mock import patch
 def test_data():
     """Create test data for SBML integration tests."""
+    blank_id = identifiers.Identifiers([])
     # Test compartments
     compartments_df = pd.DataFrame(
         [
-            {"c_name": "nucleus", "c_Identifiers": None},
-            {"c_name": "cytoplasm", "c_Identifiers": None},
+            {SBML_DFS.C_NAME: "nucleus", SBML_DFS.C_IDENTIFIERS: blank_id},
+            {SBML_DFS.C_NAME: "cytoplasm", SBML_DFS.C_IDENTIFIERS: blank_id},
         ]
     )
@@ -37,14 +40,18 @@ def test_data():
     species_df = pd.DataFrame(
         [
             {
-                "s_name": "TP53",
-                "s_Identifiers": None,
+                SBML_DFS.S_NAME: "TP53",
+                SBML_DFS.S_IDENTIFIERS: blank_id,
                 "gene_type": "tumor_suppressor",
             },
-            {"s_name": "MDM2", "s_Identifiers": None, "gene_type": "oncogene"},
             {
-                "s_name": "CDKN1A",
-                "s_Identifiers": None,
+                SBML_DFS.S_NAME: "MDM2",
+                SBML_DFS.S_IDENTIFIERS: blank_id,
+                "gene_type": "oncogene",
+            },
+            {
+                SBML_DFS.S_NAME: "CDKN1A",
+                SBML_DFS.S_IDENTIFIERS: blank_id,
                 "gene_type": "cell_cycle",
             },
         ]
@@ -58,10 +65,10 @@ def test_data():
                 "downstream_name": "CDKN1A",
                 "upstream_compartment": "nucleus",
                 "downstream_compartment": "nucleus",
-                "r_name": "TP53_activates_CDKN1A",
-                "sbo_term": "SBO:0000459",
-                "r_Identifiers": None,
-                "r_isreversible": False,
+                SBML_DFS.R_NAME: "TP53_activates_CDKN1A",
+                SBML_DFS.SBO_TERM: "SBO:0000459",
+                SBML_DFS.R_IDENTIFIERS: blank_id,
+                SBML_DFS.R_ISREVERSIBLE: False,
                 "confidence": 0.95,
             },
             {
@@ -69,10 +76,10 @@ def test_data():
                 "downstream_name": "TP53",
                 "upstream_compartment": "cytoplasm",
                 "downstream_compartment": "nucleus",
-                "r_name": "MDM2_inhibits_TP53",
-                "sbo_term": "SBO:0000020",
-                "r_Identifiers": None,
-                "r_isreversible": False,
+                SBML_DFS.R_NAME: "MDM2_inhibits_TP53",
+                SBML_DFS.SBO_TERM: "SBO:0000020",
+                SBML_DFS.R_IDENTIFIERS: blank_id,
+                SBML_DFS.R_ISREVERSIBLE: False,
                 "confidence": 0.87,
             },
         ]
@@ -611,3 +618,146 @@ def test_sbml_custom_stoichiometry(test_data):
     stoichiometries = result.reaction_species["stoichiometry"].unique()
     assert 2 in stoichiometries  # upstream
     assert 3 in stoichiometries  # downstream
+def test_validate_schema_missing(minimal_valid_sbml_dfs):
+    """Test validation fails when schema is missing."""
+    delattr(minimal_valid_sbml_dfs, "schema")
+    with pytest.raises(ValueError, match="No schema found"):
+        minimal_valid_sbml_dfs.validate()
+def test_validate_table(minimal_valid_sbml_dfs):
+    """Test _validate_table fails for various table structure issues."""
+    # Wrong index name
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    sbml_dfs.species.index.name = "wrong_name"
+    with pytest.raises(ValueError, match="the index name for species was not the pk"):
+        sbml_dfs.validate()
+    # Duplicate primary keys
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    duplicate_species = pd.DataFrame(
+        {
+            SBML_DFS.S_NAME: ["ATP", "ADP"],
+            SBML_DFS.S_IDENTIFIERS: [
+                identifiers.Identifiers([]),
+                identifiers.Identifiers([]),
+            ],
+            SBML_DFS.S_SOURCE: [Source(init=True), Source(init=True)],
+        },
+        index=pd.Index(["S00001", "S00001"], name=SBML_DFS.S_ID),
+    )
+    sbml_dfs.species = duplicate_species
+    with pytest.raises(ValueError, match="primary keys were duplicated"):
+        sbml_dfs.validate()
+    # Missing required variables
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    sbml_dfs.species = sbml_dfs.species.drop(columns=[SBML_DFS.S_NAME])
+    with pytest.raises(ValueError, match="Missing .+ required variables for species"):
+        sbml_dfs.validate()
+    # Empty table
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    sbml_dfs.species = pd.DataFrame(
+        {
+            SBML_DFS.S_NAME: [],
+            SBML_DFS.S_IDENTIFIERS: [],
+            SBML_DFS.S_SOURCE: [],
+        },
+        index=pd.Index([], name=SBML_DFS.S_ID),
+    )
+    with pytest.raises(ValueError, match="species contained no entries"):
+        sbml_dfs.validate()
+def test_check_pk_fk_correspondence(minimal_valid_sbml_dfs):
+    """Test _check_pk_fk_correspondence fails for various foreign key issues."""
+    # Missing species reference
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    sbml_dfs.compartmentalized_species[SBML_DFS.S_ID] = ["S99999"]
+    with pytest.raises(
+        ValueError,
+        match="s_id values were found in compartmentalized_species but missing from species",
+    ):
+        sbml_dfs.validate()
+    # Missing compartment reference
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    sbml_dfs.compartmentalized_species[SBML_DFS.C_ID] = ["C99999"]
+    with pytest.raises(
+        ValueError,
+        match="c_id values were found in compartmentalized_species but missing from compartments",
+    ):
+        sbml_dfs.validate()
+    # Null foreign keys
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    sbml_dfs.compartmentalized_species[SBML_DFS.S_ID] = [None]
+    with pytest.raises(
+        ValueError, match="compartmentalized_species included missing s_id values"
+    ):
+        sbml_dfs.validate()
+def test_validate_reaction_species(minimal_valid_sbml_dfs):
+    """Test _validate_reaction_species fails for various reaction species issues."""
+    # Null stoichiometry
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    sbml_dfs.reaction_species[SBML_DFS.STOICHIOMETRY] = [None]
+    with pytest.raises(ValueError, match="All reaction_species.* must be not null"):
+        sbml_dfs.validate()
+    # Null SBO terms
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    sbml_dfs.reaction_species[SBML_DFS.SBO_TERM] = [None]
+    with pytest.raises(
+        ValueError, match="sbo_terms were None; all terms should be defined"
+    ):
+        sbml_dfs.validate()
+    # Invalid SBO terms
+    sbml_dfs = minimal_valid_sbml_dfs.copy()
+    sbml_dfs.reaction_species[SBML_DFS.SBO_TERM] = ["INVALID_SBO_TERM"]
+    with pytest.raises(ValueError, match="sbo_terms were not defined"):
+        sbml_dfs.validate()
+def test_validate_identifiers(minimal_valid_sbml_dfs):
+    """Test _validate_identifiers fails when identifiers are missing."""
+    minimal_valid_sbml_dfs.species[SBML_DFS.S_IDENTIFIERS] = [None]
+    with pytest.raises(ValueError, match="species has .+ missing ids"):
+        minimal_valid_sbml_dfs.validate()
+def test_validate_sources(minimal_valid_sbml_dfs):
+    """Test _validate_sources fails when sources are missing."""
+    minimal_valid_sbml_dfs.species[SBML_DFS.S_SOURCE] = [None]
+    with pytest.raises(ValueError, match="species has .+ missing sources"):
+        minimal_valid_sbml_dfs.validate()
+def test_validate_species_data(minimal_valid_sbml_dfs):
+    """Test _validate_species_data fails when species_data has invalid structure."""
+    invalid_data = pd.DataFrame(
+        {"extra_info": ["test"]}, index=pd.Index(["S99999"], name=SBML_DFS.S_ID)
+    )  # Non-existent species
+    minimal_valid_sbml_dfs.species_data["invalid"] = invalid_data
+    with pytest.raises(ValueError, match="species data invalid was invalid"):
+        minimal_valid_sbml_dfs.validate()
+def test_validate_reactions_data(minimal_valid_sbml_dfs):
+    """Test _validate_reactions_data fails when reactions_data has invalid structure."""
+    invalid_data = pd.DataFrame(
+        {"extra_info": ["test"]}, index=pd.Index(["R99999"], name=SBML_DFS.R_ID)
+    )  # Non-existent reaction
+    minimal_valid_sbml_dfs.reactions_data["invalid"] = invalid_data
+    with pytest.raises(ValueError, match="reactions data invalid was invalid"):
+        minimal_valid_sbml_dfs.validate()
+def test_validate_passes_with_valid_data(minimal_valid_sbml_dfs):
+    """Test that validation passes with completely valid data."""
+    minimal_valid_sbml_dfs.validate()  # Should not raise any exceptions

tests/test_utils.py CHANGED Viewed

@@ -686,3 +686,22 @@ def test_safe_fill():
         "a_very_long\nstringggg",
         "",
     ]
+def test_update_pathological_names():
+    # All numeric
+    s = pd.Series(["1", "2", "3"])
+    out = utils.update_pathological_names(s, "prefix_")
+    assert all(x.startswith("prefix_") for x in out)
+    assert list(out) == ["prefix_1", "prefix_2", "prefix_3"]
+    # Mixed numeric and non-numeric
+    s2 = pd.Series(["1", "foo", "3"])
+    out2 = utils.update_pathological_names(s2, "prefix_")
+    assert list(out2) == ["1", "foo", "3"]
+    # All non-numeric
+    s3 = pd.Series(["foo", "bar", "baz"])
+    out3 = utils.update_pathological_names(s3, "prefix_")
+    assert list(out3) == ["foo", "bar", "baz"]

{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/WHEEL RENAMED Viewed

File without changes

{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{napistu-0.3.6.dist-info → napistu-0.3.7.dist-info}/top_level.txt RENAMED Viewed

File without changes

napistu 0.3.6__py3-none-any.whl → 0.3.7__py3-none-any.whl

napistu 0.3.6py3-none-any.whl → 0.3.7py3-none-any.whl