PyPI - smftools - Versions diffs - 0.2.4__py3-none-any.whl → 0.3.0__py3-none-any.whl - Mend

smftools 0.2.4py3-none-any.whl → 0.3.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (181) hide show

smftools/__init__.py +43 -13
smftools/_settings.py +6 -6
smftools/_version.py +3 -1
smftools/cli/__init__.py +1 -0
smftools/cli/archived/cli_flows.py +2 -0
smftools/cli/helpers.py +9 -1
smftools/cli/hmm_adata.py +905 -242
smftools/cli/load_adata.py +432 -280
smftools/cli/preprocess_adata.py +287 -171
smftools/cli/spatial_adata.py +141 -53
smftools/cli_entry.py +119 -178
smftools/config/__init__.py +3 -1
smftools/config/conversion.yaml +5 -1
smftools/config/deaminase.yaml +1 -1
smftools/config/default.yaml +26 -18
smftools/config/direct.yaml +8 -3
smftools/config/discover_input_files.py +19 -5
smftools/config/experiment_config.py +511 -276
smftools/constants.py +37 -0
smftools/datasets/__init__.py +4 -8
smftools/datasets/datasets.py +32 -18
smftools/hmm/HMM.py +2133 -1428
smftools/hmm/__init__.py +24 -14
smftools/hmm/archived/apply_hmm_batched.py +2 -0
smftools/hmm/archived/calculate_distances.py +2 -0
smftools/hmm/archived/call_hmm_peaks.py +18 -1
smftools/hmm/archived/train_hmm.py +2 -0
smftools/hmm/call_hmm_peaks.py +176 -193
smftools/hmm/display_hmm.py +23 -7
smftools/hmm/hmm_readwrite.py +20 -6
smftools/hmm/nucleosome_hmm_refinement.py +104 -14
smftools/informatics/__init__.py +55 -13
smftools/informatics/archived/bam_conversion.py +2 -0
smftools/informatics/archived/bam_direct.py +2 -0
smftools/informatics/archived/basecall_pod5s.py +2 -0
smftools/informatics/archived/basecalls_to_adata.py +2 -0
smftools/informatics/archived/conversion_smf.py +2 -0
smftools/informatics/archived/deaminase_smf.py +1 -0
smftools/informatics/archived/direct_smf.py +2 -0
smftools/informatics/archived/fast5_to_pod5.py +2 -0
smftools/informatics/archived/helpers/archived/__init__.py +2 -0
smftools/informatics/archived/helpers/archived/align_and_sort_BAM.py +16 -1
smftools/informatics/archived/helpers/archived/aligned_BAM_to_bed.py +2 -0
smftools/informatics/archived/helpers/archived/bam_qc.py +14 -1
smftools/informatics/archived/helpers/archived/bed_to_bigwig.py +2 -0
smftools/informatics/archived/helpers/archived/canoncall.py +2 -0
smftools/informatics/archived/helpers/archived/concatenate_fastqs_to_bam.py +8 -1
smftools/informatics/archived/helpers/archived/converted_BAM_to_adata.py +2 -0
smftools/informatics/archived/helpers/archived/count_aligned_reads.py +2 -0
smftools/informatics/archived/helpers/archived/demux_and_index_BAM.py +2 -0
smftools/informatics/archived/helpers/archived/extract_base_identities.py +2 -0
smftools/informatics/archived/helpers/archived/extract_mods.py +2 -0
smftools/informatics/archived/helpers/archived/extract_read_features_from_bam.py +2 -0
smftools/informatics/archived/helpers/archived/extract_read_lengths_from_bed.py +2 -0
smftools/informatics/archived/helpers/archived/extract_readnames_from_BAM.py +2 -0
smftools/informatics/archived/helpers/archived/find_conversion_sites.py +2 -0
smftools/informatics/archived/helpers/archived/generate_converted_FASTA.py +2 -0
smftools/informatics/archived/helpers/archived/get_chromosome_lengths.py +2 -0
smftools/informatics/archived/helpers/archived/get_native_references.py +2 -0
smftools/informatics/archived/helpers/archived/index_fasta.py +2 -0
smftools/informatics/archived/helpers/archived/informatics.py +2 -0
smftools/informatics/archived/helpers/archived/load_adata.py +5 -3
smftools/informatics/archived/helpers/archived/make_modbed.py +2 -0
smftools/informatics/archived/helpers/archived/modQC.py +2 -0
smftools/informatics/archived/helpers/archived/modcall.py +2 -0
smftools/informatics/archived/helpers/archived/ohe_batching.py +2 -0
smftools/informatics/archived/helpers/archived/ohe_layers_decode.py +2 -0
smftools/informatics/archived/helpers/archived/one_hot_decode.py +2 -0
smftools/informatics/archived/helpers/archived/one_hot_encode.py +2 -0
smftools/informatics/archived/helpers/archived/plot_bed_histograms.py +5 -1
smftools/informatics/archived/helpers/archived/separate_bam_by_bc.py +2 -0
smftools/informatics/archived/helpers/archived/split_and_index_BAM.py +2 -0
smftools/informatics/archived/print_bam_query_seq.py +9 -1
smftools/informatics/archived/subsample_fasta_from_bed.py +2 -0
smftools/informatics/archived/subsample_pod5.py +2 -0
smftools/informatics/bam_functions.py +1059 -269
smftools/informatics/basecalling.py +53 -9
smftools/informatics/bed_functions.py +357 -114
smftools/informatics/binarize_converted_base_identities.py +21 -7
smftools/informatics/complement_base_list.py +9 -6
smftools/informatics/converted_BAM_to_adata.py +324 -137
smftools/informatics/fasta_functions.py +251 -89
smftools/informatics/h5ad_functions.py +202 -30
smftools/informatics/modkit_extract_to_adata.py +623 -274
smftools/informatics/modkit_functions.py +87 -44
smftools/informatics/ohe.py +46 -21
smftools/informatics/pod5_functions.py +114 -74
smftools/informatics/run_multiqc.py +20 -14
smftools/logging_utils.py +51 -0
smftools/machine_learning/__init__.py +23 -12
smftools/machine_learning/data/__init__.py +2 -0
smftools/machine_learning/data/anndata_data_module.py +157 -50
smftools/machine_learning/data/preprocessing.py +4 -1
smftools/machine_learning/evaluation/__init__.py +3 -1
smftools/machine_learning/evaluation/eval_utils.py +13 -14
smftools/machine_learning/evaluation/evaluators.py +52 -34
smftools/machine_learning/inference/__init__.py +3 -1
smftools/machine_learning/inference/inference_utils.py +9 -4
smftools/machine_learning/inference/lightning_inference.py +14 -13
smftools/machine_learning/inference/sklearn_inference.py +8 -8
smftools/machine_learning/inference/sliding_window_inference.py +37 -25
smftools/machine_learning/models/__init__.py +12 -5
smftools/machine_learning/models/base.py +34 -43
smftools/machine_learning/models/cnn.py +22 -13
smftools/machine_learning/models/lightning_base.py +78 -42
smftools/machine_learning/models/mlp.py +18 -5
smftools/machine_learning/models/positional.py +10 -4
smftools/machine_learning/models/rnn.py +8 -3
smftools/machine_learning/models/sklearn_models.py +46 -24
smftools/machine_learning/models/transformer.py +75 -55
smftools/machine_learning/models/wrappers.py +8 -3
smftools/machine_learning/training/__init__.py +4 -2
smftools/machine_learning/training/train_lightning_model.py +42 -23
smftools/machine_learning/training/train_sklearn_model.py +11 -15
smftools/machine_learning/utils/__init__.py +3 -1
smftools/machine_learning/utils/device.py +12 -5
smftools/machine_learning/utils/grl.py +8 -2
smftools/metadata.py +443 -0
smftools/optional_imports.py +31 -0
smftools/plotting/__init__.py +32 -17
smftools/plotting/autocorrelation_plotting.py +153 -48
smftools/plotting/classifiers.py +175 -73
smftools/plotting/general_plotting.py +350 -168
smftools/plotting/hmm_plotting.py +53 -14
smftools/plotting/position_stats.py +155 -87
smftools/plotting/qc_plotting.py +25 -12
smftools/preprocessing/__init__.py +35 -37
smftools/preprocessing/append_base_context.py +105 -79
smftools/preprocessing/append_binary_layer_by_base_context.py +75 -37
smftools/preprocessing/{archives → archived}/add_read_length_and_mapping_qc.py +2 -0
smftools/preprocessing/{archives → archived}/calculate_complexity.py +5 -1
smftools/preprocessing/{archives → archived}/mark_duplicates.py +2 -0
smftools/preprocessing/{archives → archived}/preprocessing.py +10 -6
smftools/preprocessing/{archives → archived}/remove_duplicates.py +2 -0
smftools/preprocessing/binarize.py +21 -4
smftools/preprocessing/binarize_on_Youden.py +127 -31
smftools/preprocessing/binary_layers_to_ohe.py +18 -11
smftools/preprocessing/calculate_complexity_II.py +89 -59
smftools/preprocessing/calculate_consensus.py +28 -19
smftools/preprocessing/calculate_coverage.py +44 -22
smftools/preprocessing/calculate_pairwise_differences.py +4 -1
smftools/preprocessing/calculate_pairwise_hamming_distances.py +7 -3
smftools/preprocessing/calculate_position_Youden.py +110 -55
smftools/preprocessing/calculate_read_length_stats.py +52 -23
smftools/preprocessing/calculate_read_modification_stats.py +91 -57
smftools/preprocessing/clean_NaN.py +38 -28
smftools/preprocessing/filter_adata_by_nan_proportion.py +24 -12
smftools/preprocessing/filter_reads_on_length_quality_mapping.py +72 -37
smftools/preprocessing/filter_reads_on_modification_thresholds.py +183 -73
smftools/preprocessing/flag_duplicate_reads.py +708 -303
smftools/preprocessing/invert_adata.py +26 -11
smftools/preprocessing/load_sample_sheet.py +40 -22
smftools/preprocessing/make_dirs.py +9 -3
smftools/preprocessing/min_non_diagonal.py +4 -1
smftools/preprocessing/recipes.py +58 -23
smftools/preprocessing/reindex_references_adata.py +93 -27
smftools/preprocessing/subsample_adata.py +33 -16
smftools/readwrite.py +264 -109
smftools/schema/__init__.py +11 -0
smftools/schema/anndata_schema_v1.yaml +227 -0
smftools/tools/__init__.py +25 -18
smftools/tools/archived/apply_hmm.py +2 -0
smftools/tools/archived/classifiers.py +165 -0
smftools/tools/archived/classify_methylated_features.py +2 -0
smftools/tools/archived/classify_non_methylated_features.py +2 -0
smftools/tools/archived/subset_adata_v1.py +12 -1
smftools/tools/archived/subset_adata_v2.py +14 -1
smftools/tools/calculate_umap.py +56 -15
smftools/tools/cluster_adata_on_methylation.py +122 -47
smftools/tools/general_tools.py +70 -25
smftools/tools/position_stats.py +220 -99
smftools/tools/read_stats.py +50 -29
smftools/tools/spatial_autocorrelation.py +365 -192
smftools/tools/subset_adata.py +23 -21
smftools-0.3.0.dist-info/METADATA +147 -0
smftools-0.3.0.dist-info/RECORD +182 -0
smftools-0.2.4.dist-info/METADATA +0 -141
smftools-0.2.4.dist-info/RECORD +0 -176
{smftools-0.2.4.dist-info → smftools-0.3.0.dist-info}/WHEEL +0 -0
{smftools-0.2.4.dist-info → smftools-0.3.0.dist-info}/entry_points.txt +0 -0
{smftools-0.2.4.dist-info → smftools-0.3.0.dist-info}/licenses/LICENSE +0 -0

smftools/plotting/classifiers.py CHANGED Viewed

@@ -1,35 +1,53 @@
+from __future__ import annotations
-import numpy as np
-import matplotlib.pyplot as plt
-import torch
 import os
+import numpy as np
+from smftools.optional_imports import require
+plt = require("matplotlib.pyplot", extra="plotting", purpose="model plots")
+torch = require("torch", extra="ml-base", purpose="model saliency plots")
 def plot_model_performance(metrics, save_path=None):
-    import matplotlib.pyplot as plt
+    """Plot ROC and precision-recall curves for model metrics.
+    Args:
+        metrics: Dictionary of model metrics by reference.
+        save_path: Optional path to save plots.
+    """
     import os
     for ref in metrics.keys():
         plt.figure(figsize=(12, 5))
         # ROC Curve
         plt.subplot(1, 2, 1)
         for model_name, vals in metrics[ref].items():
-            model_type = model_name.split('_')[0]
+            model_type = model_name.split("_")[0]
             data_type = model_name.split(f"{model_type}_")[1]
-            plt.plot(vals['fpr'], vals['tpr'], label=f"{model_type.upper()} - AUC: {vals['auc']:.4f}")
-        plt.xlabel('False Positive Rate')
-        plt.ylabel('True Positive Rate')
-        plt.title(f'{data_type} ROC Curve ({ref})')
+            plt.plot(
+                vals["fpr"], vals["tpr"], label=f"{model_type.upper()} - AUC: {vals['auc']:.4f}"
+            )
+        plt.xlabel("False Positive Rate")
+        plt.ylabel("True Positive Rate")
+        plt.title(f"{data_type} ROC Curve ({ref})")
         plt.legend()
         # PR Curve
         plt.subplot(1, 2, 2)
         for model_name, vals in metrics[ref].items():
-            model_type = model_name.split('_')[0]
+            model_type = model_name.split("_")[0]
             data_type = model_name.split(f"{model_type}_")[1]
-            plt.plot(vals['recall'], vals['precision'], label=f"{model_type.upper()} - F1: {vals['f1']:.4f}")
-        plt.xlabel('Recall')
-        plt.ylabel('Precision')
-        plt.title(f'{data_type} Precision-Recall Curve ({ref})')
+            plt.plot(
+                vals["recall"],
+                vals["precision"],
+                label=f"{model_type.upper()} - F1: {vals['f1']:.4f}",
+            )
+        plt.xlabel("Recall")
+        plt.ylabel("Precision")
+        plt.title(f"{data_type} Precision-Recall Curve ({ref})")
         plt.legend()
         plt.tight_layout()
@@ -42,13 +60,14 @@ def plot_model_performance(metrics, save_path=None):
             plt.savefig(out_file, dpi=300)
             print(f"📁 Saved: {out_file}")
         plt.show()
         # Confusion Matrices
         for model_name, vals in metrics[ref].items():
             print(f"Confusion Matrix for {ref} - {model_name.upper()}:")
-            print(vals['confusion_matrix'])
+            print(vals["confusion_matrix"])
             print()
 def plot_feature_importances_or_saliency(
     models,
     positions,
@@ -57,18 +76,31 @@ def plot_feature_importances_or_saliency(
     adata=None,
     layer_name=None,
     save_path=None,
-    shaded_regions=None
+    shaded_regions=None,
 ):
-    import torch
-    import numpy as np
-    import matplotlib.pyplot as plt
+    """Plot feature importances or saliency for trained models.
+    Args:
+        models: Mapping of trained models.
+        positions: Mapping of positions per reference.
+        tensors: Mapping of input tensors per reference.
+        site_config: Site configuration mapping.
+        adata: Optional AnnData object.
+        layer_name: Optional layer name for plotting.
+        save_path: Optional path to save plots.
+        shaded_regions: Optional list of regions to highlight.
+    """
     import os
+    import numpy as np
     # Select device for NN models
     device = (
-        torch.device('cuda') if torch.cuda.is_available() else
-        torch.device('mps') if torch.backends.mps.is_available() else
-        torch.device('cpu')
+        torch.device("cuda")
+        if torch.cuda.is_available()
+        else torch.device("mps")
+        if torch.backends.mps.is_available()
+        else torch.device("cpu")
     )
     for ref, model_dict in models.items():
@@ -90,7 +122,9 @@ def plot_feature_importances_or_saliency(
         other_sites = set()
         if adata is None:
-            print("⚠️ AnnData object is required to classify site types. Skipping site type markers.")
+            print(
+                "⚠️ AnnData object is required to classify site types. Skipping site type markers."
+            )
         else:
             gpc_col = f"{ref}_GpC_site"
             cpg_col = f"{ref}_CpG_site"
@@ -146,20 +180,46 @@ def plot_feature_importances_or_saliency(
             plt.figure(figsize=(12, 4))
             for pos, imp in zip(positions_sorted, importances_sorted):
                 if pos in cpg_sites:
-                    plt.plot(pos, imp, marker='*', color='black', markersize=10, linestyle='None',
-                             label='CpG site' if 'CpG site' not in plt.gca().get_legend_handles_labels()[1] else "")
+                    plt.plot(
+                        pos,
+                        imp,
+                        marker="*",
+                        color="black",
+                        markersize=10,
+                        linestyle="None",
+                        label="CpG site"
+                        if "CpG site" not in plt.gca().get_legend_handles_labels()[1]
+                        else "",
+                    )
                 elif pos in gpc_sites:
-                    plt.plot(pos, imp, marker='o', color='blue', markersize=6, linestyle='None',
-                             label='GpC site' if 'GpC site' not in plt.gca().get_legend_handles_labels()[1] else "")
+                    plt.plot(
+                        pos,
+                        imp,
+                        marker="o",
+                        color="blue",
+                        markersize=6,
+                        linestyle="None",
+                        label="GpC site"
+                        if "GpC site" not in plt.gca().get_legend_handles_labels()[1]
+                        else "",
+                    )
                 else:
-                    plt.plot(pos, imp, marker='.', color='gray', linestyle='None',
-                             label='Other' if 'Other' not in plt.gca().get_legend_handles_labels()[1] else "")
-            plt.plot(positions_sorted, importances_sorted, linestyle='-', alpha=0.5, color='black')
+                    plt.plot(
+                        pos,
+                        imp,
+                        marker=".",
+                        color="gray",
+                        linestyle="None",
+                        label="Other"
+                        if "Other" not in plt.gca().get_legend_handles_labels()[1]
+                        else "",
+                    )
+            plt.plot(positions_sorted, importances_sorted, linestyle="-", alpha=0.5, color="black")
             if shaded_regions:
-                for (start, end) in shaded_regions:
-                    plt.axvspan(start, end, color='gray', alpha=0.3)
+                for start, end in shaded_regions:
+                    plt.axvspan(start, end, color="gray", alpha=0.3)
             plt.xlabel("Genomic Position")
             plt.ylabel(y_label)
@@ -170,31 +230,50 @@ def plot_feature_importances_or_saliency(
             if save_path:
                 os.makedirs(save_path, exist_ok=True)
-                safe_name = plot_title.replace("=", "").replace("__", "_").replace(",", "_").replace(" ", "_")
+                safe_name = (
+                    plot_title.replace("=", "")
+                    .replace("__", "_")
+                    .replace(",", "_")
+                    .replace(" ", "_")
+                )
                 out_file = os.path.join(save_path, f"{safe_name}.png")
                 plt.savefig(out_file, dpi=300)
                 print(f"📁 Saved: {out_file}")
             plt.show()
 def plot_model_curves_from_adata(
-    adata,
-    label_col='activity_status',
-    model_names = ["cnn", "mlp", "rf"],
-    suffix='GpC_site_CpG_site',
-    omit_training=True,
-    save_path=None,
-    ylim_roc=(0.0, 1.05),
-    ylim_pr=(0.0, 1.05)):
-    from sklearn.metrics import precision_recall_curve, roc_curve, auc
-    import matplotlib.pyplot as plt
-    import seaborn as sns
+    adata,
+    label_col="activity_status",
+    model_names=["cnn", "mlp", "rf"],
+    suffix="GpC_site_CpG_site",
+    omit_training=True,
+    save_path=None,
+    ylim_roc=(0.0, 1.05),
+    ylim_pr=(0.0, 1.05),
+):
+    """Plot ROC and PR curves using AnnData model outputs.
+    Args:
+        adata: AnnData containing model outputs.
+        label_col: Ground-truth label column.
+        model_names: Model name prefixes.
+        suffix: Prediction column suffix.
+        omit_training: Whether to omit training rows.
+        save_path: Optional path to save the plot.
+        ylim_roc: Y-axis limits for ROC curve.
+        ylim_pr: Y-axis limits for PR curve.
+    """
+    sklearn_metrics = require("sklearn.metrics", extra="ml-base", purpose="model curves")
+    auc = sklearn_metrics.auc
+    precision_recall_curve = sklearn_metrics.precision_recall_curve
+    roc_curve = sklearn_metrics.roc_curve
     if omit_training:
-        subset = adata[adata.obs['used_for_training'].astype(bool) == False]
+        subset = adata[~adata.obs["used_for_training"].astype(bool)]
-    label = subset.obs[label_col].map({'Active': 1, 'Silent': 0}).values
+    label = subset.obs[label_col].map({"Active": 1, "Silent": 0}).values
     positive_ratio = np.sum(label.astype(int)) / len(label)
@@ -210,7 +289,7 @@ def plot_model_curves_from_adata(
             roc_auc = auc(fpr, tpr)
             plt.plot(fpr, tpr, label=f"{model.upper()} (AUC={roc_auc:.4f})")
-    plt.plot([0, 1], [0, 1], 'k--', alpha=0.5)
+    plt.plot([0, 1], [0, 1], "k--", alpha=0.5)
     plt.xlabel("False Positive Rate")
     plt.ylabel("True Positive Rate")
     plt.title("ROC Curve")
@@ -230,13 +309,13 @@ def plot_model_curves_from_adata(
     plt.xlabel("Recall")
     plt.ylabel("Precision")
     plt.ylim(*ylim_pr)
-    plt.axhline(y=positive_ratio, linestyle='--', color='gray', label='Random Baseline')
+    plt.axhline(y=positive_ratio, linestyle="--", color="gray", label="Random Baseline")
     plt.title("Precision-Recall Curve")
     plt.legend()
     plt.tight_layout()
     if save_path:
-        save_name = f"ROC_PR_curves"
+        save_name = "ROC_PR_curves"
         os.makedirs(save_path, exist_ok=True)
         safe_name = save_name.replace("=", "").replace("__", "_").replace(",", "_")
         out_file = os.path.join(save_path, f"{safe_name}.png")
@@ -244,11 +323,12 @@ def plot_model_curves_from_adata(
         print(f"📁 Saved: {out_file}")
     plt.show()
 def plot_model_curves_from_adata_with_frequency_grid(
     adata,
-    label_col='activity_status',
+    label_col="activity_status",
     model_names=["cnn", "mlp", "rf"],
-    suffix='GpC_site_CpG_site',
+    suffix="GpC_site_CpG_site",
     omit_training=True,
     save_path=None,
     ylim_roc=(0.0, 1.05),
@@ -256,22 +336,42 @@ def plot_model_curves_from_adata_with_frequency_grid(
     pos_sample_count=500,
     pos_freq_list=[0.01, 0.05, 0.1],
     show_f1_iso_curves=False,
-    f1_levels=None):
-    import numpy as np
-    import matplotlib.pyplot as plt
-    import seaborn as sns
+    f1_levels=None,
+):
+    """Plot ROC/PR curves with frequency grid overlays.
+    Args:
+        adata: AnnData containing model outputs.
+        label_col: Ground-truth label column.
+        model_names: Model name prefixes.
+        suffix: Prediction column suffix.
+        omit_training: Whether to omit training rows.
+        save_path: Optional path to save the plot.
+        ylim_roc: Y-axis limits for ROC curve.
+        ylim_pr: Y-axis limits for PR curve.
+        pos_sample_count: Sample count for positive baseline.
+        pos_freq_list: List of positive class frequencies to plot.
+        show_f1_iso_curves: Whether to show F1 iso-curves.
+        f1_levels: F1 levels to plot if enabled.
+    """
     import os
-    from sklearn.metrics import precision_recall_curve, roc_curve, auc
+    import numpy as np
+    sklearn_metrics = require("sklearn.metrics", extra="ml-base", purpose="model curves")
+    auc = sklearn_metrics.auc
+    precision_recall_curve = sklearn_metrics.precision_recall_curve
+    roc_curve = sklearn_metrics.roc_curve
     if f1_levels is None:
         f1_levels = np.linspace(0.2, 0.9, 8)
     if omit_training:
-        subset = adata[adata.obs['used_for_training'].astype(bool) == False]
+        subset = adata[~adata.obs["used_for_training"].astype(bool)]
     else:
         subset = adata
-    label = subset.obs[label_col].map({'Active': 1, 'Silent': 0}).values
+    label = subset.obs[label_col].map({"Active": 1, "Silent": 0}).values
     subset = subset.copy()
     subset.obs["__label__"] = label
@@ -280,7 +380,7 @@ def plot_model_curves_from_adata_with_frequency_grid(
     n_rows = len(pos_freq_list)
     fig, axes = plt.subplots(n_rows, 2, figsize=(12, 5 * n_rows))
-    fig.suptitle(f'{suffix} Performance metrics')
+    fig.suptitle(f"{suffix} Performance metrics")
     for row_idx, pos_freq in enumerate(pos_freq_list):
         desired_total = int(pos_sample_count / pos_freq)
@@ -308,14 +408,14 @@ def plot_model_curves_from_adata_with_frequency_grid(
                 fpr, tpr, _ = roc_curve(y_true, probs)
                 roc_auc = auc(fpr, tpr)
                 ax_roc.plot(fpr, tpr, label=f"{model.upper()} (AUC={roc_auc:.4f})")
-        ax_roc.plot([0, 1], [0, 1], 'k--', alpha=0.5)
+        ax_roc.plot([0, 1], [0, 1], "k--", alpha=0.5)
         ax_roc.set_xlabel("False Positive Rate")
         ax_roc.set_ylabel("True Positive Rate")
         ax_roc.set_ylim(*ylim_roc)
         ax_roc.set_title(f"ROC Curve (Pos Freq: {pos_freq:.2%})")
         ax_roc.legend()
-        ax_roc.spines['top'].set_visible(False)
-        ax_roc.spines['right'].set_visible(False)
+        ax_roc.spines["top"].set_visible(False)
+        ax_roc.spines["right"].set_visible(False)
         # PR Curve
         for model in model_names:
@@ -325,26 +425,28 @@ def plot_model_curves_from_adata_with_frequency_grid(
                 precision, recall, _ = precision_recall_curve(y_true, probs)
                 pr_auc = auc(recall, precision)
                 ax_pr.plot(recall, precision, label=f"{model.upper()} (AUC={pr_auc:.4f})")
-        ax_pr.axhline(y=pos_freq, linestyle='--', color='gray', label='Random Baseline')
+        ax_pr.axhline(y=pos_freq, linestyle="--", color="gray", label="Random Baseline")
         if show_f1_iso_curves:
             recall_vals = np.linspace(0.01, 1, 500)
             for f1 in f1_levels:
                 precision_vals = (f1 * recall_vals) / (2 * recall_vals - f1)
                 precision_vals[precision_vals < 0] = np.nan  # Avoid plotting invalid values
-                ax_pr.plot(recall_vals, precision_vals, color='gray', linestyle=':', linewidth=1, alpha=0.6)
+                ax_pr.plot(
+                    recall_vals, precision_vals, color="gray", linestyle=":", linewidth=1, alpha=0.6
+                )
                 x_val = 0.9
                 y_val = (f1 * x_val) / (2 * x_val - f1)
                 if 0 < y_val < 1:
-                    ax_pr.text(x_val, y_val, f"F1={f1:.1f}", fontsize=8, color='gray')
+                    ax_pr.text(x_val, y_val, f"F1={f1:.1f}", fontsize=8, color="gray")
         ax_pr.set_xlabel("Recall")
         ax_pr.set_ylabel("Precision")
         ax_pr.set_ylim(*ylim_pr)
         ax_pr.set_title(f"PR Curve (Pos Freq: {pos_freq:.2%})")
         ax_pr.legend()
-        ax_pr.spines['top'].set_visible(False)
-        ax_pr.spines['right'].set_visible(False)
+        ax_pr.spines["top"].set_visible(False)
+        ax_pr.spines["right"].set_visible(False)
     plt.tight_layout(rect=[0, 0, 1, 0.97])
     if save_path:
@@ -352,4 +454,4 @@ def plot_model_curves_from_adata_with_frequency_grid(
         out_file = os.path.join(save_path, "ROC_PR_grid.png")
         plt.savefig(out_file, dpi=300)
         print(f"📁 Saved: {out_file}")
-    plt.show()
+    plt.show()

smftools 0.2.4__py3-none-any.whl → 0.3.0__py3-none-any.whl

smftools 0.2.4py3-none-any.whl → 0.3.0py3-none-any.whl