PyPI - pylocuszoom - Versions diffs - 0.5.0__py3-none-any.whl → 0.8.0__py3-none-any.whl - Mend

pylocuszoom 0.5.0py3-none-any.whl → 0.8.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (25) hide show

pylocuszoom/__init__.py +38 -2
pylocuszoom/backends/__init__.py +116 -17
pylocuszoom/backends/base.py +424 -35
pylocuszoom/backends/bokeh_backend.py +192 -34
pylocuszoom/backends/hover.py +198 -0
pylocuszoom/backends/matplotlib_backend.py +332 -3
pylocuszoom/backends/plotly_backend.py +187 -38
pylocuszoom/colors.py +41 -0
pylocuszoom/ensembl.py +476 -0
pylocuszoom/eqtl.py +15 -19
pylocuszoom/finemapping.py +17 -26
pylocuszoom/forest.py +35 -0
pylocuszoom/gene_track.py +161 -135
pylocuszoom/loaders.py +38 -18
pylocuszoom/phewas.py +34 -0
pylocuszoom/plotter.py +370 -190
pylocuszoom/recombination.py +64 -34
pylocuszoom/schemas.py +37 -26
pylocuszoom/utils.py +52 -0
pylocuszoom/validation.py +172 -0
{pylocuszoom-0.5.0.dist-info → pylocuszoom-0.8.0.dist-info}/METADATA +97 -28
pylocuszoom-0.8.0.dist-info/RECORD +29 -0
pylocuszoom-0.5.0.dist-info/RECORD +0 -24
{pylocuszoom-0.5.0.dist-info → pylocuszoom-0.8.0.dist-info}/WHEEL +0 -0
{pylocuszoom-0.5.0.dist-info → pylocuszoom-0.8.0.dist-info}/licenses/LICENSE.md +0 -0

pylocuszoom/plotter.py CHANGED Viewed

@@ -15,12 +15,9 @@ from typing import Any, List, Optional, Tuple
 import matplotlib.pyplot as plt
 import numpy as np
 import pandas as pd
-from matplotlib.axes import Axes
-from matplotlib.figure import Figure
-from matplotlib.lines import Line2D
-from matplotlib.patches import Patch
 from .backends import BackendType, get_backend
+from .backends.hover import HoverConfig, HoverDataBuilder
 from .colors import (
     EQTL_NEGATIVE_BINS,
     EQTL_POSITIVE_BINS,
@@ -31,23 +28,24 @@ from .colors import (
     get_eqtl_color,
     get_ld_bin,
     get_ld_color_palette,
+    get_phewas_category_palette,
 )
+from .ensembl import get_genes_for_region
 from .eqtl import validate_eqtl_df
 from .finemapping import (
     get_credible_sets,
     prepare_finemapping_for_plotting,
 )
+from .forest import validate_forest_df
 from .gene_track import (
     assign_gene_positions,
-    plot_gene_track,
     plot_gene_track_generic,
 )
-from .labels import add_snp_labels
 from .ld import calculate_ld, find_plink
 from .logging import enable_logging, logger
+from .phewas import validate_phewas_df
 from .recombination import (
     RECOMB_COLOR,
-    add_recombination_overlay,
     download_canine_recombination_maps,
     get_default_data_dir,
     get_recombination_rate_for_region,
@@ -116,8 +114,21 @@ class LocusZoomPlotter:
         recomb_data_dir: Optional[str] = None,
         genomewide_threshold: float = DEFAULT_GENOMEWIDE_THRESHOLD,
         log_level: Optional[str] = "INFO",
+        auto_genes: bool = False,
     ):
-        """Initialize the plotter."""
+        """Initialize the plotter.
+        Args:
+            species: Species name ('canine', 'feline', or None for custom).
+            genome_build: Genome build for coordinate system.
+            backend: Plotting backend ('matplotlib', 'plotly', or 'bokeh').
+            plink_path: Path to PLINK executable for LD calculation.
+            recomb_data_dir: Directory containing recombination maps.
+            genomewide_threshold: P-value threshold for significance line.
+            log_level: Logging level.
+            auto_genes: If True, automatically fetch genes from Ensembl when
+                genes_df is not provided. Default False for backward compatibility.
+        """
         # Configure logging
         if log_level is not None:
             enable_logging(log_level)
@@ -126,12 +137,12 @@ class LocusZoomPlotter:
         self.genome_build = (
             genome_build if genome_build else self._default_build(species)
         )
-        self.backend_name = backend
         self._backend = get_backend(backend)
         self.plink_path = plink_path or find_plink()
         self.recomb_data_dir = recomb_data_dir
         self.genomewide_threshold = genomewide_threshold
         self._genomewide_line = -np.log10(genomewide_threshold)
+        self._auto_genes = auto_genes
         # Cache for loaded data
         self._recomb_cache = {}
@@ -245,6 +256,22 @@ class LocusZoomPlotter:
         """
         # Validate inputs
         validate_gwas_df(gwas_df, pos_col=pos_col, p_col=p_col)
+        # Auto-fetch genes if enabled and not provided
+        if genes_df is None and self._auto_genes:
+            logger.debug(
+                f"auto_genes enabled, fetching genes for chr{chrom}:{start}-{end}"
+            )
+            genes_df = get_genes_for_region(
+                species=self.species,
+                chrom=chrom,
+                start=start,
+                end=end,
+            )
+            if genes_df.empty:
+                logger.debug("No genes found in region from Ensembl")
+                genes_df = None
         if genes_df is not None:
             validate_genes_df(genes_df)
@@ -302,10 +329,10 @@ class LocusZoomPlotter:
             zorder=1,
         )
-        # Add SNP labels (matplotlib only - interactive backends use hover tooltips)
+        # Add SNP labels (capability check - interactive backends use hover tooltips)
         if snp_labels and rs_col in df.columns and label_top_n > 0 and not df.empty:
-            if self.backend_name == "matplotlib":
-                add_snp_labels(
+            if self._backend.supports_snp_labels:
+                self._backend.add_snp_labels(
                     ax,
                     df,
                     pos_col=pos_col,
@@ -316,12 +343,10 @@ class LocusZoomPlotter:
                     chrom=chrom,
                 )
-        # Add recombination overlay (all backends)
+        # Add recombination overlay (all backends with secondary axis support)
         if recomb_df is not None and not recomb_df.empty:
-            if self.backend_name == "matplotlib":
-                add_recombination_overlay(ax, recomb_df, start, end)
-            else:
-                self._add_recombination_overlay_generic(ax, recomb_df, start, end)
+            if self._backend.supports_secondary_axis:
+                self._add_recombination_overlay(ax, recomb_df, start, end)
         # Format axes
         self._backend.set_ylabel(ax, r"$-\log_{10}$ P")
@@ -330,19 +355,13 @@ class LocusZoomPlotter:
         # Add LD legend (all backends)
         if ld_col is not None and ld_col in df.columns:
-            if self.backend_name == "matplotlib":
-                self._add_ld_legend(ax)
-            else:
-                self._backend.add_ld_legend(ax, LD_BINS, LEAD_SNP_COLOR)
+            self._backend.add_ld_legend(ax, LD_BINS, LEAD_SNP_COLOR)
-        # Plot gene track (all backends)
+        # Plot gene track (all backends use generic function)
         if genes_df is not None and gene_ax is not None:
-            if self.backend_name == "matplotlib":
-                plot_gene_track(gene_ax, genes_df, chrom, start, end, exons_df)
-            else:
-                plot_gene_track_generic(
-                    gene_ax, self._backend, genes_df, chrom, start, end, exons_df
-                )
+            plot_gene_track_generic(
+                gene_ax, self._backend, genes_df, chrom, start, end, exons_df
+            )
             self._backend.set_xlabel(gene_ax, f"Chromosome {chrom} (Mb)")
             self._backend.hide_spines(gene_ax, ["top", "right", "left"])
         else:
@@ -363,7 +382,7 @@ class LocusZoomPlotter:
         start: int,
         end: int,
         figsize: Tuple[int, int],
-    ) -> Tuple[Figure, Axes, Optional[Axes]]:
+    ) -> Tuple[Any, Any, Optional[Any]]:
         """Create figure with optional gene track."""
         if genes_df is not None:
             # Calculate dynamic height based on gene rows
@@ -407,7 +426,7 @@ class LocusZoomPlotter:
     def _plot_association(
         self,
-        ax: Axes,
+        ax: Any,
         df: pd.DataFrame,
         pos_col: str,
         ld_col: Optional[str],
@@ -416,23 +435,14 @@ class LocusZoomPlotter:
         p_col: Optional[str] = None,
     ) -> None:
         """Plot association scatter with LD coloring."""
-        def _build_hover_data(subset_df: pd.DataFrame) -> Optional[pd.DataFrame]:
-            """Build hover data for interactive backends."""
-            hover_cols = {}
-            # RS ID first (will be bold in hover)
-            if rs_col and rs_col in subset_df.columns:
-                hover_cols["SNP"] = subset_df[rs_col].values
-            # Position
-            if pos_col in subset_df.columns:
-                hover_cols["Position"] = subset_df[pos_col].values
-            # P-value
-            if p_col and p_col in subset_df.columns:
-                hover_cols["P-value"] = subset_df[p_col].values
-            # LD
-            if ld_col and ld_col in subset_df.columns:
-                hover_cols["R²"] = subset_df[ld_col].values
-            return pd.DataFrame(hover_cols) if hover_cols else None
+        # Build hover data using HoverDataBuilder
+        hover_config = HoverConfig(
+            snp_col=rs_col if rs_col and rs_col in df.columns else None,
+            pos_col=pos_col if pos_col in df.columns else None,
+            p_col=p_col if p_col and p_col in df.columns else None,
+            ld_col=ld_col if ld_col and ld_col in df.columns else None,
+        )
+        hover_builder = HoverDataBuilder(hover_config)
         # LD-based coloring
         if ld_col is not None and ld_col in df.columns:
@@ -451,7 +461,7 @@ class LocusZoomPlotter:
                     edgecolor="black",
                     linewidth=0.5,
                     zorder=2,
-                    hover_data=_build_hover_data(bin_data),
+                    hover_data=hover_builder.build_dataframe(bin_data),
                 )
         else:
             # Default: grey points
@@ -464,7 +474,7 @@ class LocusZoomPlotter:
                 edgecolor="black",
                 linewidth=0.5,
                 zorder=2,
-                hover_data=_build_hover_data(df),
+                hover_data=hover_builder.build_dataframe(df),
             )
         # Highlight lead SNP with larger, more prominent marker
@@ -481,57 +491,21 @@ class LocusZoomPlotter:
                     edgecolor="black",
                     linewidth=1.5,
                     zorder=10,
-                    hover_data=_build_hover_data(lead_snp),
+                    hover_data=hover_builder.build_dataframe(lead_snp),
                 )
-    def _add_ld_legend(self, ax: Axes) -> None:
-        """Add LD color legend to plot."""
-        palette = get_ld_color_palette()
-        legend_elements = [
-            Line2D(
-                [0],
-                [0],
-                marker="D",
-                color="w",
-                markerfacecolor=LEAD_SNP_COLOR,
-                markeredgecolor="black",
-                markersize=6,
-                label="Lead SNP",
-            ),
-        ]
-        for threshold, label, _ in LD_BINS:
-            legend_elements.append(
-                Patch(
-                    facecolor=palette[label],
-                    edgecolor="black",
-                    label=label,
-                )
-            )
-        ax.legend(
-            handles=legend_elements,
-            loc="upper right",
-            fontsize=9,
-            frameon=True,
-            framealpha=0.9,
-            title=r"$r^2$",
-            title_fontsize=10,
-            handlelength=1.5,
-            handleheight=1.0,
-            labelspacing=0.4,
-        )
-    def _add_recombination_overlay_generic(
+    def _add_recombination_overlay(
         self,
         ax: Any,
         recomb_df: pd.DataFrame,
         start: int,
         end: int,
     ) -> None:
-        """Add recombination overlay for interactive backends (plotly/bokeh).
+        """Add recombination overlay for all backends.
         Creates a secondary y-axis with recombination rate line and fill.
+        Uses backend-agnostic secondary axis methods that work across
+        matplotlib, plotly, and bokeh.
         """
         # Filter to region
         region_recomb = recomb_df[
@@ -588,7 +562,7 @@ class LocusZoomPlotter:
     def _plot_finemapping(
         self,
-        ax: Axes,
+        ax: Any,
         df: pd.DataFrame,
         pos_col: str = "pos",
         pip_col: str = "pip",
@@ -607,22 +581,15 @@ class LocusZoomPlotter:
             show_credible_sets: Whether to color points by credible set.
             pip_threshold: Minimum PIP to display as scatter point.
         """
-        def _build_finemapping_hover_data(
-            subset_df: pd.DataFrame,
-        ) -> Optional[pd.DataFrame]:
-            """Build hover data for interactive backends."""
-            hover_cols = {}
-            # Position
-            if pos_col in subset_df.columns:
-                hover_cols["Position"] = subset_df[pos_col].values
-            # PIP
-            if pip_col in subset_df.columns:
-                hover_cols["PIP"] = subset_df[pip_col].values
-            # Credible set
-            if cs_col and cs_col in subset_df.columns:
-                hover_cols["Credible Set"] = subset_df[cs_col].values
-            return pd.DataFrame(hover_cols) if hover_cols else None
+        # Build hover data using HoverDataBuilder
+        extra_cols = {pip_col: "PIP"}
+        if cs_col and cs_col in df.columns:
+            extra_cols[cs_col] = "Credible Set"
+        hover_config = HoverConfig(
+            pos_col=pos_col if pos_col in df.columns else None,
+            extra_cols=extra_cols,
+        )
+        hover_builder = HoverDataBuilder(hover_config)
         # Sort by position for line plotting
         df = df.sort_values(pos_col)
@@ -657,7 +624,7 @@ class LocusZoomPlotter:
                     edgecolor="black",
                     linewidth=0.5,
                     zorder=3,
-                    hover_data=_build_finemapping_hover_data(cs_data),
+                    hover_data=hover_builder.build_dataframe(cs_data),
                 )
             # Plot variants not in any credible set
             non_cs_data = df[(df[cs_col].isna()) | (df[cs_col] == 0)]
@@ -674,7 +641,7 @@ class LocusZoomPlotter:
                         edgecolor="black",
                         linewidth=0.3,
                         zorder=2,
-                        hover_data=_build_finemapping_hover_data(non_cs_data),
+                        hover_data=hover_builder.build_dataframe(non_cs_data),
                     )
         else:
             # No credible sets - show all points above threshold
@@ -691,7 +658,7 @@ class LocusZoomPlotter:
                         edgecolor="black",
                         linewidth=0.5,
                         zorder=3,
-                        hover_data=_build_finemapping_hover_data(high_pip),
+                        hover_data=hover_builder.build_dataframe(high_pip),
                     )
     def plot_stacked(
@@ -909,10 +876,10 @@ class LocusZoomPlotter:
                 zorder=1,
             )
-            # Add SNP labels (matplotlib only - interactive backends use hover tooltips)
+            # Add SNP labels (capability check - interactive backends use hover tooltips)
             if snp_labels and rs_col in df.columns and label_top_n > 0 and not df.empty:
-                if self.backend_name == "matplotlib":
-                    add_snp_labels(
+                if self._backend.supports_snp_labels:
+                    self._backend.add_snp_labels(
                         ax,
                         df,
                         pos_col=pos_col,
@@ -925,10 +892,8 @@ class LocusZoomPlotter:
             # Add recombination overlay (only on first panel, all backends)
             if i == 0 and recomb_df is not None and not recomb_df.empty:
-                if self.backend_name == "matplotlib":
-                    add_recombination_overlay(ax, recomb_df, start, end)
-                else:
-                    self._add_recombination_overlay_generic(ax, recomb_df, start, end)
+                if self._backend.supports_secondary_axis:
+                    self._add_recombination_overlay(ax, recomb_df, start, end)
             # Format axes
             self._backend.set_ylabel(ax, r"$-\log_{10}$ P")
@@ -937,50 +902,11 @@ class LocusZoomPlotter:
             # Add panel label
             if panel_labels and i < len(panel_labels):
-                if self.backend_name == "matplotlib":
-                    ax.annotate(
-                        panel_labels[i],
-                        xy=(0.02, 0.95),
-                        xycoords="axes fraction",
-                        fontsize=11,
-                        fontweight="bold",
-                        va="top",
-                        ha="left",
-                    )
-                elif self.backend_name == "plotly":
-                    fig, row = ax
-                    fig.add_annotation(
-                        text=f"<b>{panel_labels[i]}</b>",
-                        xref=f"x{row} domain" if row > 1 else "x domain",
-                        yref=f"y{row} domain" if row > 1 else "y domain",
-                        x=0.02,
-                        y=0.95,
-                        showarrow=False,
-                        font=dict(size=11),
-                        xanchor="left",
-                        yanchor="top",
-                    )
-                elif self.backend_name == "bokeh":
-                    from bokeh.models import Label
-                    # Get y-axis range for positioning
-                    y_max = ax.y_range.end if ax.y_range.end else 10
-                    x_min = ax.x_range.start if ax.x_range.start else start
-                    label = Label(
-                        x=x_min + (end - start) * 0.02,
-                        y=y_max * 0.95,
-                        text=panel_labels[i],
-                        text_font_size="11pt",
-                        text_font_style="bold",
-                    )
-                    ax.add_layout(label)
+                self._backend.add_panel_label(ax, panel_labels[i])
             # Add LD legend (only on first panel, all backends)
             if i == 0 and panel_ld_col is not None and panel_ld_col in df.columns:
-                if self.backend_name == "matplotlib":
-                    self._add_ld_legend(ax)
-                else:
-                    self._backend.add_ld_legend(ax, LD_BINS, LEAD_SNP_COLOR)
+                self._backend.add_ld_legend(ax, LD_BINS, LEAD_SNP_COLOR)
         # Track current panel index
         panel_idx = n_gwas
@@ -1030,35 +956,35 @@ class LocusZoomPlotter:
             if eqtl_gene and "gene" in eqtl_data.columns:
                 eqtl_data = eqtl_data[eqtl_data["gene"] == eqtl_gene]
-            # Filter by region
+            # Filter by region (position and chromosome)
             if "pos" in eqtl_data.columns:
-                eqtl_data = eqtl_data[
-                    (eqtl_data["pos"] >= start) & (eqtl_data["pos"] <= end)
-                ]
+                mask = (eqtl_data["pos"] >= start) & (eqtl_data["pos"] <= end)
+                # Also filter by chromosome if column exists
+                if "chr" in eqtl_data.columns:
+                    chrom_str = str(chrom).replace("chr", "")
+                    eqtl_chrom = (
+                        eqtl_data["chr"].astype(str).str.replace("chr", "", regex=False)
+                    )
+                    mask = mask & (eqtl_chrom == chrom_str)
+                eqtl_data = eqtl_data[mask]
             if not eqtl_data.empty:
                 eqtl_data["neglog10p"] = -np.log10(
                     eqtl_data["p_value"].clip(lower=1e-300)
                 )
-                def _build_eqtl_hover_data(
-                    subset_df: pd.DataFrame,
-                ) -> Optional[pd.DataFrame]:
-                    """Build hover data for eQTL interactive backends."""
-                    hover_cols = {}
-                    # Position
-                    if "pos" in subset_df.columns:
-                        hover_cols["Position"] = subset_df["pos"].values
-                    # P-value
-                    if "p_value" in subset_df.columns:
-                        hover_cols["P-value"] = subset_df["p_value"].values
-                    # Effect size
-                    if "effect_size" in subset_df.columns:
-                        hover_cols["Effect"] = subset_df["effect_size"].values
-                    # Gene
-                    if "gene" in subset_df.columns:
-                        hover_cols["Gene"] = subset_df["gene"].values
-                    return pd.DataFrame(hover_cols) if hover_cols else None
+                # Build hover data using HoverDataBuilder
+                eqtl_extra_cols = {}
+                if "effect_size" in eqtl_data.columns:
+                    eqtl_extra_cols["effect_size"] = "Effect"
+                if "gene" in eqtl_data.columns:
+                    eqtl_extra_cols["gene"] = "Gene"
+                eqtl_hover_config = HoverConfig(
+                    pos_col="pos" if "pos" in eqtl_data.columns else None,
+                    p_col="p_value" if "p_value" in eqtl_data.columns else None,
+                    extra_cols=eqtl_extra_cols,
+                )
+                eqtl_hover_builder = HoverDataBuilder(eqtl_hover_config)
                 # Check if effect_size column exists for directional coloring
                 has_effect = "effect_size" in eqtl_data.columns
@@ -1081,7 +1007,7 @@ class LocusZoomPlotter:
                             edgecolor="black",
                             linewidth=0.5,
                             zorder=2,
-                            hover_data=_build_eqtl_hover_data(row_df),
+                            hover_data=eqtl_hover_builder.build_dataframe(row_df),
                         )
                     # Plot negative effects (down triangles)
                     for _, row in neg_effects.iterrows():
@@ -1096,7 +1022,7 @@ class LocusZoomPlotter:
                             edgecolor="black",
                             linewidth=0.5,
                             zorder=2,
-                            hover_data=_build_eqtl_hover_data(row_df),
+                            hover_data=eqtl_hover_builder.build_dataframe(row_df),
                         )
                     # Add eQTL effect legend (all backends)
                     self._backend.add_eqtl_legend(
@@ -1116,7 +1042,7 @@ class LocusZoomPlotter:
                         linewidth=0.5,
                         zorder=2,
                         label=label,
-                        hover_data=_build_eqtl_hover_data(eqtl_data),
+                        hover_data=eqtl_hover_builder.build_dataframe(eqtl_data),
                     )
                     self._backend.add_simple_legend(ax, label, loc="upper right")
@@ -1132,15 +1058,12 @@ class LocusZoomPlotter:
             self._backend.hide_spines(ax, ["top", "right"])
             panel_idx += 1
-        # Plot gene track (all backends)
+        # Plot gene track (all backends use generic function)
         if genes_df is not None:
             gene_ax = axes[panel_idx]
-            if self.backend_name == "matplotlib":
-                plot_gene_track(gene_ax, genes_df, chrom, start, end, exons_df)
-            else:
-                plot_gene_track_generic(
-                    gene_ax, self._backend, genes_df, chrom, start, end, exons_df
-                )
+            plot_gene_track_generic(
+                gene_ax, self._backend, genes_df, chrom, start, end, exons_df
+            )
             self._backend.set_xlabel(gene_ax, f"Chromosome {chrom} (Mb)")
             self._backend.hide_spines(gene_ax, ["top", "right", "left"])
         else:
@@ -1155,3 +1078,260 @@ class LocusZoomPlotter:
         self._backend.finalize_layout(fig, hspace=0.1)
         return fig
+    def plot_phewas(
+        self,
+        phewas_df: pd.DataFrame,
+        variant_id: str,
+        phenotype_col: str = "phenotype",
+        p_col: str = "p_value",
+        category_col: str = "category",
+        effect_col: Optional[str] = None,
+        significance_threshold: float = 5e-8,
+        figsize: Tuple[float, float] = (10, 8),
+    ) -> Any:
+        """Create a PheWAS (Phenome-Wide Association Study) plot.
+        Shows associations of a single variant across multiple phenotypes,
+        with phenotypes grouped by category and colored accordingly.
+        Args:
+            phewas_df: DataFrame with phenotype associations.
+            variant_id: Variant identifier (e.g., "rs12345") for plot title.
+            phenotype_col: Column name for phenotype names.
+            p_col: Column name for p-values.
+            category_col: Column name for phenotype categories.
+            effect_col: Optional column name for effect direction (beta/OR).
+            significance_threshold: P-value threshold for significance line.
+            figsize: Figure size as (width, height).
+        Returns:
+            Figure object (type depends on backend).
+        Example:
+            >>> fig = plotter.plot_phewas(
+            ...     phewas_df,
+            ...     variant_id="rs12345",
+            ...     category_col="category",
+            ... )
+        """
+        validate_phewas_df(phewas_df, phenotype_col, p_col, category_col)
+        df = phewas_df.copy()
+        df["neglog10p"] = -np.log10(df[p_col].clip(lower=1e-300))
+        # Sort by category then by p-value for consistent ordering
+        if category_col in df.columns:
+            df = df.sort_values([category_col, p_col])
+            categories = df[category_col].unique().tolist()
+            palette = get_phewas_category_palette(categories)
+        else:
+            df = df.sort_values(p_col)
+            categories = []
+            palette = {}
+        # Create figure
+        fig, axes = self._backend.create_figure(
+            n_panels=1,
+            height_ratios=[1.0],
+            figsize=figsize,
+        )
+        ax = axes[0]
+        # Assign y-positions (one per phenotype)
+        df["y_pos"] = range(len(df))
+        # Plot points by category
+        if categories:
+            for cat in categories:
+                cat_data = df[df[category_col] == cat]
+                # Use upward triangles for positive effects, circles otherwise
+                if effect_col and effect_col in cat_data.columns:
+                    for _, row in cat_data.iterrows():
+                        marker = "^" if row[effect_col] >= 0 else "v"
+                        self._backend.scatter(
+                            ax,
+                            pd.Series([row["neglog10p"]]),
+                            pd.Series([row["y_pos"]]),
+                            colors=palette[cat],
+                            sizes=60,
+                            marker=marker,
+                            edgecolor="black",
+                            linewidth=0.5,
+                            zorder=2,
+                        )
+                else:
+                    self._backend.scatter(
+                        ax,
+                        cat_data["neglog10p"],
+                        cat_data["y_pos"],
+                        colors=palette[cat],
+                        sizes=60,
+                        marker="o",
+                        edgecolor="black",
+                        linewidth=0.5,
+                        zorder=2,
+                    )
+        else:
+            self._backend.scatter(
+                ax,
+                df["neglog10p"],
+                df["y_pos"],
+                colors="#4169E1",
+                sizes=60,
+                edgecolor="black",
+                linewidth=0.5,
+                zorder=2,
+            )
+        # Add significance threshold line
+        sig_line = -np.log10(significance_threshold)
+        self._backend.axvline(
+            ax, x=sig_line, color="red", linestyle="--", linewidth=1, alpha=0.7
+        )
+        # Set axis labels and limits
+        self._backend.set_xlabel(ax, r"$-\log_{10}$ P")
+        self._backend.set_ylabel(ax, "Phenotype")
+        self._backend.set_ylim(ax, -0.5, len(df) - 0.5)
+        # Set y-tick labels to phenotype names
+        self._backend.set_yticks(
+            ax,
+            positions=df["y_pos"].tolist(),
+            labels=df[phenotype_col].tolist(),
+            fontsize=8,
+        )
+        self._backend.set_title(ax, f"PheWAS: {variant_id}")
+        self._backend.hide_spines(ax, ["top", "right"])
+        self._backend.finalize_layout(fig)
+        return fig
+    def plot_forest(
+        self,
+        forest_df: pd.DataFrame,
+        variant_id: str,
+        study_col: str = "study",
+        effect_col: str = "effect",
+        ci_lower_col: str = "ci_lower",
+        ci_upper_col: str = "ci_upper",
+        weight_col: Optional[str] = None,
+        null_value: float = 0.0,
+        effect_label: str = "Effect Size",
+        figsize: Tuple[float, float] = (8, 6),
+    ) -> Any:
+        """Create a forest plot showing effect sizes with confidence intervals.
+        Args:
+            forest_df: DataFrame with effect sizes and confidence intervals.
+            variant_id: Variant identifier for plot title.
+            study_col: Column name for study/phenotype names.
+            effect_col: Column name for effect sizes.
+            ci_lower_col: Column name for lower confidence interval.
+            ci_upper_col: Column name for upper confidence interval.
+            weight_col: Optional column for study weights (affects marker size).
+            null_value: Reference value for null effect (0 for beta, 1 for OR).
+            effect_label: X-axis label.
+            figsize: Figure size as (width, height).
+        Returns:
+            Figure object (type depends on backend).
+        Example:
+            >>> fig = plotter.plot_forest(
+            ...     forest_df,
+            ...     variant_id="rs12345",
+            ...     effect_label="Odds Ratio",
+            ...     null_value=1.0,
+            ... )
+        """
+        validate_forest_df(forest_df, study_col, effect_col, ci_lower_col, ci_upper_col)
+        df = forest_df.copy()
+        # Create figure
+        fig, axes = self._backend.create_figure(
+            n_panels=1,
+            height_ratios=[1.0],
+            figsize=figsize,
+        )
+        ax = axes[0]
+        # Assign y-positions (reverse so first study is at top)
+        df["y_pos"] = range(len(df) - 1, -1, -1)
+        # Calculate marker sizes from weights
+        if weight_col and weight_col in df.columns:
+            # Scale weights to marker sizes (min 40, max 200)
+            weights = df[weight_col]
+            min_size, max_size = 40, 200
+            weight_range = weights.max() - weights.min()
+            if weight_range > 0:
+                sizes = min_size + (weights - weights.min()) / weight_range * (
+                    max_size - min_size
+                )
+            else:
+                sizes = (min_size + max_size) / 2
+        else:
+            sizes = 80
+        # Calculate error bar extents
+        xerr_lower = df[effect_col] - df[ci_lower_col]
+        xerr_upper = df[ci_upper_col] - df[effect_col]
+        # Plot error bars (confidence intervals)
+        self._backend.errorbar_h(
+            ax,
+            x=df[effect_col],
+            y=df["y_pos"],
+            xerr_lower=xerr_lower,
+            xerr_upper=xerr_upper,
+            color="black",
+            linewidth=1.5,
+            capsize=3,
+            zorder=2,
+        )
+        # Plot effect size markers
+        self._backend.scatter(
+            ax,
+            df[effect_col],
+            df["y_pos"],
+            colors="#4169E1",
+            sizes=sizes,
+            marker="s",  # square markers typical for forest plots
+            edgecolor="black",
+            linewidth=0.5,
+            zorder=3,
+        )
+        # Add null effect line
+        self._backend.axvline(
+            ax, x=null_value, color="grey", linestyle="--", linewidth=1, alpha=0.7
+        )
+        # Set axis labels and limits
+        self._backend.set_xlabel(ax, effect_label)
+        self._backend.set_ylim(ax, -0.5, len(df) - 0.5)
+        # Ensure x-axis includes the null value with some padding
+        x_min = min(df[ci_lower_col].min(), null_value)
+        x_max = max(df[ci_upper_col].max(), null_value)
+        x_padding = (x_max - x_min) * 0.1
+        self._backend.set_xlim(ax, x_min - x_padding, x_max + x_padding)
+        # Set y-tick labels to study names
+        self._backend.set_yticks(
+            ax,
+            positions=df["y_pos"].tolist(),
+            labels=df[study_col].tolist(),
+            fontsize=10,
+        )
+        self._backend.set_title(ax, f"Forest Plot: {variant_id}")
+        self._backend.hide_spines(ax, ["top", "right"])
+        self._backend.finalize_layout(fig)
+        return fig

pylocuszoom 0.5.0__py3-none-any.whl → 0.8.0__py3-none-any.whl

pylocuszoom 0.5.0py3-none-any.whl → 0.8.0py3-none-any.whl