PyPI - statslibx - Versions diffs - 0.1.3__py3-none-any.whl → 0.1.5__py3-none-any.whl - Mend

statslibx 0.1.3py3-none-any.whl → 0.1.5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

statslibx/__init__.py +2 -2
statslibx/datasets/__init__.py +7 -1
statslibx/datasets/course_completion.csv +100001 -0
statslibx/datasets/titanic.csv +419 -0
statslibx/descriptive.py +39 -0
statslibx/inferential.py +39 -0
statslibx/utils.py +243 -404
{statslibx-0.1.3.dist-info → statslibx-0.1.5.dist-info}/METADATA +11 -11
statslibx-0.1.5.dist-info/RECORD +14 -0
statslibx-0.1.3.dist-info/RECORD +0 -12
{statslibx-0.1.3.dist-info → statslibx-0.1.5.dist-info}/WHEEL +0 -0
{statslibx-0.1.3.dist-info → statslibx-0.1.5.dist-info}/top_level.txt +0 -0

statslibx/utils.py CHANGED Viewed

@@ -6,6 +6,7 @@ import warnings
 import os
 from scipy import stats
 import seaborn as sns
+from pathlib import Path
 class UtilsStats:
@@ -13,11 +14,15 @@ class UtilsStats:
     Clase utilitaria para operaciones estadísticas comunes y visualización
     Esta clase proporciona métodos para validación de datos, análisis estadísticos
-    básicos y visualización de resultados.
+    básicos y visualización de resultados. Ahora con soporte para leer archivos directamente.
     Examples:
     ---------
     >>> utils = UtilsStats()
+    >>> # Desde archivo
+    >>> data = utils.load_data("datos.csv")
+    >>> utils.check_normality(data, column='edad')
+    >>> # Desde array
     >>> data = np.random.normal(0, 1, 100)
     >>> utils.check_normality(data)
     >>> utils.plot_distribution(data)
@@ -47,15 +52,11 @@ class UtilsStats:
         plt.rcParams['lines.linewidth'] = 2
     def set_plot_backend(self, backend: Literal['matplotlib', 'seaborn', 'plotly']):
-        """
-        Establecer el backend de visualización por defecto
-        """
+        """Establecer el backend de visualización por defecto"""
         self._plot_backend = backend
     def set_default_figsize(self, figsize: Tuple[int, int]):
-        """
-        Establecer el tamaño de figura por defecto
-        """
+        """Establecer el tamaño de figura por defecto"""
         self._default_figsize = figsize
         plt.rcParams['figure.figsize'] = [figsize[0], figsize[1]]
@@ -63,18 +64,14 @@ class UtilsStats:
                            fig_format: str = 'png',
                            fig_dpi: int = 300,
                            figures_dir: str = 'figures'):
-        """
-        Configurar opciones para guardar figuras
-        """
+        """Configurar opciones para guardar figuras"""
         self._save_fig = save_fig
         self._fig_format = fig_format
         self._fig_dpi = fig_dpi
         self._figures_dir = figures_dir
     def _save_figure(self, fig, filename: str, **kwargs):
-        """
-        Guardar figura si save_fig está activado
-        """
+        """Guardar figura si save_fig está activado"""
         if self._save_fig:
             try:
                 os.makedirs(self._figures_dir, exist_ok=True)
@@ -93,10 +90,114 @@ class UtilsStats:
             except Exception as e:
                 print(f"✗ Error guardando figura: {e}")
-    # ============= MÉTODOS DE ANÁLISIS ESTADÍSTICO =============
+    # ============= NUEVO: MÉTODOS DE CARGA DE DATOS =============
+    def load_data(self, path: Union[str, Path], **kwargs) -> pd.DataFrame:
+        """
+        Carga datos desde archivo en múltiples formatos
+        Parameters:
+        -----------
+        path : str o Path
+            Ruta al archivo de datos
+        **kwargs : dict
+            Argumentos adicionales para la función de lectura de pandas
+        Returns:
+        --------
+        pd.DataFrame
+            DataFrame con los datos cargados
+        Supported formats:
+        ------------------
+        - CSV (.csv)
+        - Excel (.xlsx, .xls)
+        - Text/TSV (.txt, .tsv)
+        - JSON (.json)
+        - Parquet (.parquet)
+        - Feather (.feather)
+        Examples:
+        ---------
+        >>> utils = UtilsStats()
+        >>> df = utils.load_data("datos.csv")
+        >>> df = utils.load_data("datos.xlsx", sheet_name="Hoja1")
+        >>> df = utils.load_data("datos.json")
+        """
+        path = Path(path)
+        if not path.exists():
+            raise FileNotFoundError(f"El archivo no existe: {path}")
+        ext = path.suffix.lower()
+        try:
+            if ext == ".csv":
+                df = pd.read_csv(path, **kwargs)
+            elif ext in [".xlsx", ".xls"]:
+                df = pd.read_excel(path, **kwargs)
+            elif ext in [".txt", ".tsv"]:
+                df = pd.read_table(path, **kwargs)
+            elif ext == ".json":
+                df = pd.read_json(path, **kwargs)
+            elif ext == ".parquet":
+                df = pd.read_parquet(path, **kwargs)
+            elif ext == ".feather":
+                df = pd.read_feather(path, **kwargs)
+            else:
+                raise ValueError(f"Formato de archivo no soportado: {ext}")
+            print(f"✓ Datos cargados exitosamente desde: {path}")
+            print(f"  Shape: {df.shape}")
+            print(f"  Columnas: {list(df.columns)}")
+            return df
+        except Exception as e:
+            raise Exception(f"Error al cargar el archivo {path}: {str(e)}")
-    def validate_dataframe(self, data: Union[pd.DataFrame, np.ndarray, list]) -> pd.DataFrame:
-        """Valida y convierte datos a DataFrame"""
+    def _resolve_data(self, data: Union[pd.DataFrame, pd.Series, np.ndarray, list, str, Path],
+                     column: Optional[str] = None) -> Tuple[Union[pd.DataFrame, pd.Series, np.ndarray], str]:
+        """
+        Resuelve el input de datos: si es una ruta, carga el archivo; si no, usa los datos directamente
+        Returns:
+        --------
+        Tuple[data, data_source]
+            - data: Los datos procesados
+            - data_source: String indicando la fuente ('file' o 'memory')
+        """
+        # Si es string o Path, intentar cargar como archivo
+        if isinstance(data, (str, Path)):
+            path = Path(data)
+            if path.exists():
+                df = self.load_data(path)
+                if column is not None and column in df.columns:
+                    return df[column], 'file'
+                return df, 'file'
+            else:
+                raise FileNotFoundError(f"El archivo no existe: {path}")
+        # Si ya son datos en memoria, devolverlos tal cual
+        return data, 'memory'
+    # ============= MÉTODOS DE ANÁLISIS ESTADÍSTICO (ACTUALIZADOS) =============
+    def validate_dataframe(self, data: Union[pd.DataFrame, np.ndarray, list, str, Path]) -> pd.DataFrame:
+        """
+        Valida y convierte datos a DataFrame
+        Ahora acepta también rutas de archivos
+        """
+        # Intentar resolver si es un archivo
+        data, source = self._resolve_data(data)
         if isinstance(data, pd.DataFrame):
             return data
         elif isinstance(data, np.ndarray):
@@ -117,8 +218,36 @@ class UtilsStats:
             return f"{num:.{decimals}e}"
         return f"{num:.{decimals}f}"
-    def check_normality(self, data: Union[pd.Series, np.ndarray], alpha: float = 0.05) -> dict:
-        """Verifica si los datos siguen distribución normal usando Shapiro-Wilk"""
+    def check_normality(self,
+                       data: Union[pd.Series, np.ndarray, pd.DataFrame, str, Path],
+                       column: Optional[str] = None,
+                       alpha: float = 0.05) -> dict:
+        """
+        Verifica si los datos siguen distribución normal usando Shapiro-Wilk
+        Parameters:
+        -----------
+        data : Series, ndarray, DataFrame, str o Path
+            Datos a analizar o ruta al archivo
+        column : str, optional
+            Columna a analizar (si data es DataFrame o archivo)
+        alpha : float
+            Nivel de significancia
+        Examples:
+        ---------
+        >>> utils.check_normality("datos.csv", column="edad")
+        >>> utils.check_normality(np.random.normal(0, 1, 100))
+        """
+        # Resolver datos
+        data, source = self._resolve_data(data, column)
+        # Extraer array
+        if isinstance(data, pd.DataFrame):
+            if column is None:
+                raise ValueError("Debe especificar 'column' cuando data es DataFrame")
+            data = data[column]
         if isinstance(data, pd.Series):
             data = data.dropna().values
         else:
@@ -135,16 +264,39 @@ class UtilsStats:
             'interpretation': 'Normal' if shapiro_p > alpha else 'No Normal'
         }
-    def calculate_confidence_intervals(self, data: Union[pd.Series, np.ndarray],
+    def calculate_confidence_intervals(self,
+                                     data: Union[pd.Series, np.ndarray, pd.DataFrame, str, Path],
+                                     column: Optional[str] = None,
                                      confidence_level: float = 0.95,
                                      method: str = 'parametric') -> dict:
         """
         Calcula intervalos de confianza para la media
+        Parameters:
+        -----------
+        data : Series, ndarray, DataFrame, str o Path
+            Datos a analizar o ruta al archivo
+        column : str, optional
+            Columna a analizar
+        confidence_level : float
+            Nivel de confianza (default: 0.95)
+        method : str
+            'parametric' o 'bootstrap'
         """
+        # Resolver datos
+        data, source = self._resolve_data(data, column)
+        # Extraer array
+        if isinstance(data, pd.DataFrame):
+            if column is None:
+                raise ValueError("Debe especificar 'column' cuando data es DataFrame")
+            data = data[column]
         if isinstance(data, pd.Series):
             data_clean = data.dropna().values
         else:
-            data_clean = data[~np.isnan(data)]
+            data_clean = np.array(data)
+            data_clean = data_clean[~np.isnan(data_clean)]
         n = len(data_clean)
         mean = np.mean(data_clean)
@@ -185,7 +337,9 @@ class UtilsStats:
             'method': method
         }
-    def detect_outliers(self, data: Union[pd.Series, np.ndarray],
+    def detect_outliers(self,
+                       data: Union[pd.Series, np.ndarray, pd.DataFrame, str, Path],
+                       column: Optional[str] = None,
                        method: Literal['iqr', 'zscore', 'isolation_forest'] = 'iqr',
                        **kwargs) -> np.ndarray:
         """
@@ -193,8 +347,10 @@ class UtilsStats:
         Parameters:
         -----------
-        data : array-like
-            Datos a analizar
+        data : Series, ndarray, DataFrame, str o Path
+            Datos a analizar o ruta al archivo
+        column : str, optional
+            Columna a analizar
         method : str
             'iqr', 'zscore', o 'isolation_forest'
@@ -203,6 +359,15 @@ class UtilsStats:
         np.ndarray
             Array booleano indicando outliers
         """
+        # Resolver datos
+        data, source = self._resolve_data(data, column)
+        # Extraer array
+        if isinstance(data, pd.DataFrame):
+            if column is None:
+                raise ValueError("Debe especificar 'column' cuando data es DataFrame")
+            data = data[column]
         if isinstance(data, pd.Series):
             data = data.values
@@ -364,7 +529,8 @@ class UtilsStats:
         return fig
-    def plot_distribution(self, data: Union[pd.DataFrame, pd.Series, np.ndarray],
+    def plot_distribution(self,
+                         data: Union[pd.DataFrame, pd.Series, np.ndarray, str, Path],
                          column: Optional[str] = None,
                          plot_type: Literal['hist', 'kde', 'box', 'violin', 'all'] = 'hist',
                          backend: Optional[Literal['matplotlib', 'seaborn', 'plotly']] = "seaborn",
@@ -378,10 +544,10 @@ class UtilsStats:
         Parameters:
         -----------
-        data : DataFrame, Series o ndarray
-            Datos a graficar
+        data : DataFrame, Series, ndarray, str o Path
+            Datos a graficar o ruta al archivo
         column : str, optional
-            Columna a graficar (si data es DataFrame)
+            Columna a graficar (si data es DataFrame o archivo)
         plot_type : str
             Tipo de gráfico
         backend : str, optional
@@ -394,11 +560,19 @@ class UtilsStats:
             Si guardar la figura
         filename : str, optional
             Nombre del archivo
+        Examples:
+        ---------
+        >>> utils.plot_distribution("datos.csv", column="edad")
+        >>> utils.plot_distribution(df, column="salario", plot_type="all")
         """
         backend = backend or self._plot_backend
         figsize = figsize or self._default_figsize
         save_fig = save_fig if save_fig is not None else self._save_fig
+        # Resolver datos
+        data, source = self._resolve_data(data, column)
         # Extraer datos
         if isinstance(data, pd.DataFrame):
             if column is None:
@@ -478,7 +652,8 @@ class UtilsStats:
         return fig
-    def plot_correlation_matrix(self, data: pd.DataFrame,
+    def plot_correlation_matrix(self,
+                               data: Union[pd.DataFrame, str, Path],
                                method: str = 'pearson',
                                backend: Optional[Literal['seaborn', 'plotly']] = None,
                                figsize: Optional[Tuple[int, int]] = None,
@@ -490,8 +665,8 @@ class UtilsStats:
         Parameters:
         -----------
-        data : DataFrame
-            Datos para calcular correlación
+        data : DataFrame, str o Path
+            Datos para calcular correlación o ruta al archivo
         method : str
             'pearson', 'spearman' o 'kendall'
         backend : str, optional
@@ -502,6 +677,12 @@ class UtilsStats:
         save_fig = save_fig if save_fig is not None else self._save_fig
         filename = filename or "matriz_correlacion"
+        # Resolver datos
+        data, source = self._resolve_data(data)
+        if not isinstance(data, pd.DataFrame):
+            raise ValueError("Se requiere un DataFrame para calcular matriz de correlación")
         # Calcular matriz de correlación
         corr_matrix = data.corr(method=method)
@@ -553,7 +734,8 @@ class UtilsStats:
         return fig
-    def plot_scatter_matrix(self, data: pd.DataFrame,
+    def plot_scatter_matrix(self,
+                           data: Union[pd.DataFrame, str, Path],
                            columns: Optional[List[str]] = None,
                            backend: Optional[Literal['seaborn', 'plotly', 'pandas']] = None,
                            figsize: Optional[Tuple[int, int]] = None,
@@ -562,12 +744,23 @@ class UtilsStats:
                            **kwargs):
         """
         Matriz de gráficos de dispersión (pairplot)
+        Parameters:
+        -----------
+        data : DataFrame, str o Path
+            Datos o ruta al archivo
         """
         backend = backend or self._plot_backend
         figsize = figsize or self._default_figsize
         save_fig = save_fig if save_fig is not None else self._save_fig
         filename = filename or "scatter_matrix"
+        # Resolver datos
+        data, source = self._resolve_data(data)
+        if not isinstance(data, pd.DataFrame):
+            raise ValueError("Se requiere un DataFrame para matriz de dispersión")
         if columns:
             data = data[columns]
@@ -603,7 +796,7 @@ class UtilsStats:
     # ============= GRÁFICOS CON INTERVALOS DE CONFIANZA =============
     def plot_distribution_with_ci(self,
-                               data: Union[pd.DataFrame, pd.Series, np.ndarray],
+                               data: Union[pd.DataFrame, pd.Series, np.ndarray, str, Path],
                                column: Optional[str] = None,
                                confidence_level: float = 0.95,
                                ci_method: str = 'parametric',
@@ -612,7 +805,14 @@ class UtilsStats:
                                save_fig: Optional[bool] = None,
                                filename: Optional[str] = None,
                                **kwargs) -> plt.Figure:
+        """
+        Distribución con intervalos de confianza
+        Ahora acepta rutas de archivos
+        """
+        # Resolver datos
+        data, source = self._resolve_data(data, column)
         # ======= PREPARACIÓN =======
         if isinstance(data, pd.DataFrame):
             if column is None:
@@ -630,7 +830,7 @@ class UtilsStats:
         filename = filename or f"distribucion_ci_{data_name.lower().replace(' ', '_')}"
         # Estadísticas
-        ci_result = self.calculate_confidence_intervals(data_array, confidence_level, ci_method)
+        ci_result = self.calculate_confidence_intervals(data_array, confidence_level=confidence_level, method=ci_method)
         normality_result = self.check_normality(data_array)
         # KDE
@@ -739,7 +939,7 @@ class UtilsStats:
                 data_array = data_array[~np.isnan(data_array)]
             # Calcular estadísticas
-            ci_result = self.calculate_confidence_intervals(data_array, confidence_level)
+            ci_result = self.calculate_confidence_intervals(data_array, confidence_level=confidence_level)
             # Gráfica izquierda: Distribución básica
             ax1.hist(data_array, bins=30, alpha=0.7, color=colors[idx],
@@ -779,11 +979,17 @@ class UtilsStats:
     # ============= MÉTODOS UTILITARIOS ADICIONALES =============
-    def get_descriptive_stats(self, data: Union[pd.DataFrame, pd.Series, np.ndarray],
+    def get_descriptive_stats(self,
+                             data: Union[pd.DataFrame, pd.Series, np.ndarray, str, Path],
                              column: Optional[str] = None) -> dict:
         """
         Obtiene estadísticas descriptivas completas
+        Ahora acepta rutas de archivos
         """
+        # Resolver datos
+        data, source = self._resolve_data(data, column)
         if isinstance(data, pd.DataFrame):
             if column is None:
                 raise ValueError("Debe especificar 'column' cuando data es DataFrame")
@@ -810,371 +1016,4 @@ class UtilsStats:
             'skewness': stats.skew(data_clean),
             'kurtosis': stats.kurtosis(data_clean),
             'range': np.max(data_clean) - np.min(data_clean)
-        }
-    def help(self):
-        """
-        Muestra ayuda completa de la clase DescriptiveStats
-        """
-        help_text = """
-╔════════════════════════════════════════════════════════════════════════════╗
-║                    📊 CLASE UtilsStats - AYUDA COMPLETA                    ║
-╚════════════════════════════════════════════════════════════════════════════╝
-📝 DESCRIPCIÓN:
-   Clase para análisis estadístico descriptivo univariado y multivariado.
-   Proporciona herramientas para análisis exploratorio de datos, medidas de
-   tendencia central, dispersión, forma de distribución y regresión lineal.
-━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
-📋 MÉTODOS PRINCIPALES:
-┌────────────────────────────────────────────────────────────────────────────┐
-│ 1. 📊 ANÁLISIS ESTADÍSTICO                                                 │
-└────────────────────────────────────────────────────────────────────────────┘
-  • .check_normality(data, alpha=0.05)
-    Verifica normalidad usando test Shapiro-Wilk
-    Retorna: dict con estadístico, p-value e interpretación
-  • .calculate_confidence_intervals(data, confidence_level=0.95,
-                                   method='parametric')
-    Calcula intervalos de confianza para la media
-    Métodos: 'parametric' o 'bootstrap'
-  • .detect_outliers(data, method='iqr', **kwargs)
-    Detecta valores atípicos
-    Métodos: 'iqr', 'zscore', 'isolation_forest'
-  • .calculate_effect_size(group1, group2, method='cohen')
-    Calcula tamaño del efecto entre grupos
-    Métodos: 'cohen' (Cohen's d) o 'hedges' (Hedges' g)
-  • .get_descriptive_stats(data, column=None)
-    Estadísticas descriptivas completas en un dict
-┌────────────────────────────────────────────────────────────────────────────┐
-│ 2. 🎨 VISUALIZACIÓN DE DISTRIBUCIONES                                      │
-└────────────────────────────────────────────────────────────────────────────┘
-  • .plot_distribution(data, column=None, plot_type='hist',
-                      backend='seaborn', bins=30, figsize=None,
-                      save_fig=None, filename=None)
-    Grafica distribución de una variable
-    plot_type: 'hist', 'kde', 'box', 'violin', 'all'
-    backend: 'matplotlib', 'seaborn', 'plotly'
-  • .plot_distribution_with_ci(data, column=None, confidence_level=0.95,
-                               ci_method='parametric', bins=30, figsize=None,
-                               save_fig=None, filename=None)
-    Distribución con intervalos de confianza visualizados
-  • .plot_multiple_distributions_with_ci(data_dict, confidence_level=0.95)
-    Compara múltiples distribuciones con sus IC
-┌────────────────────────────────────────────────────────────────────────────┐
-│ 3. 🎨 VISUALIZACIÓN MULTIVARIADA                                           │
-└────────────────────────────────────────────────────────────────────────────┘
-  • .plot_correlation_matrix(data, method='pearson', backend='seaborn',
-                            figsize=None, save_fig=None)
-    Matriz de correlación con heatmap
-    Métodos: 'pearson', 'spearman', 'kendall'
-  • .plot_scatter_matrix(data, columns=None, backend='seaborn',
-                        figsize=None, save_fig=None)
-    Matriz de gráficos de dispersión (pairplot)
-    Backends: 'seaborn', 'plotly', 'pandas'
-┌────────────────────────────────────────────────────────────────────────────┐
-│ 4. ⚙️  CONFIGURACIÓN                                                       │
-└────────────────────────────────────────────────────────────────────────────┘
-  • .set_plot_backend(backend)
-    Establece backend por defecto: 'matplotlib', 'seaborn', 'plotly'
-  • .set_default_figsize(figsize)
-    Establece tamaño de figura por defecto: (ancho, alto)
-  • .set_save_fig_options(save_fig=False, fig_format='png',
-                         fig_dpi=300, figures_dir='figures')
-    Configura guardado automático de figuras
-┌────────────────────────────────────────────────────────────────────────────┐
-│ 5. 🛠️  UTILIDADES                                                          │
-└────────────────────────────────────────────────────────────────────────────┘
-  • .validate_dataframe(data)
-    Valida y convierte datos a DataFrame
-  • .format_number(num, decimals=6, scientific=False)
-    Formatea números con precisión específica
-━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
-💡 EJEMPLOS DE USO:
-  ┌─ Ejemplo 1: Configuración Inicial ──────────────────────────────────────┐
-  │ from utils import UtilsStats                                            │
-  │ import pandas as pd                                                      │
-  │ import numpy as np                                                       │
-  │                                                                          │
-  │ # Inicializar                                                            │
-  │ utils = UtilsStats()                                                    │
-  │                                                                          │
-  │ # Configurar visualización                                               │
-  │ utils.set_plot_backend('seaborn')                                       │
-  │ utils.set_default_figsize((12, 6))                                      │
-  │                                                                          │
-  │ # Configurar guardado automático                                         │
-  │ utils.set_save_fig_options(                                             │
-  │     save_fig=True,                                                      │
-  │     fig_format='png',                                                   │
-  │     fig_dpi=300,                                                        │
-  │     figures_dir='mis_graficos'                                          │
-  │ )                                                                        │
-  └──────────────────────────────────────────────────────────────────────────┘
-  ┌─ Ejemplo 2: Análisis de Normalidad ─────────────────────────────────────┐
-  │ # Generar datos                                                          │
-  │ datos_normales = np.random.normal(0, 1, 1000)                           │
-  │ datos_no_normales = np.random.exponential(2, 1000)                      │
-  │                                                                          │
-  │ # Test de normalidad                                                     │
-  │ resultado1 = utils.check_normality(datos_normales)                      │
-  │ print(f"Normales: {resultado1['interpretation']}")                      │
-  │ print(f"p-value: {resultado1['shapiro_pvalue']:.4f}")                   │
-  │                                                                          │
-  │ resultado2 = utils.check_normality(datos_no_normales)                   │
-  │ print(f"No normales: {resultado2['interpretation']}")                   │
-  └──────────────────────────────────────────────────────────────────────────┘
-  ┌─ Ejemplo 3: Intervalos de Confianza ────────────────────────────────────┐
-  │ # Método paramétrico                                                     │
-  │ ci_param = utils.calculate_confidence_intervals(                        │
-  │     datos_normales,                                                     │
-  │     confidence_level=0.95,                                              │
-  │     method='parametric'                                                 │
-  │ )                                                                        │
-  │                                                                          │
-  │ print(f"Media: {ci_param['mean']:.3f}")                                 │
-  │ print(f"IC 95%: [{ci_param['ci_lower']:.3f}, "                          │
-  │       f"{ci_param['ci_upper']:.3f}]")                                   │
-  │                                                                          │
-  │ # Método bootstrap (para datos no normales)                              │
-  │ ci_boot = utils.calculate_confidence_intervals(                         │
-  │     datos_no_normales,                                                  │
-  │     confidence_level=0.95,                                              │
-  │     method='bootstrap'                                                  │
-  │ )                                                                        │
-  └──────────────────────────────────────────────────────────────────────────┘
-  ┌─ Ejemplo 4: Detección de Outliers ──────────────────────────────────────┐
-  │ # Método IQR (rango intercuartílico)                                     │
-  │ datos = np.random.normal(100, 15, 1000)                                 │
-  │ datos = np.append(datos, [200, 210, -50])  # Agregar outliers           │
-  │                                                                          │
-  │ outliers_iqr = utils.detect_outliers(datos, method='iqr')               │
-  │ print(f"Outliers IQR: {outliers_iqr.sum()}")                            │
-  │                                                                          │
-  │ # Método Z-score                                                         │
-  │ outliers_z = utils.detect_outliers(                                     │
-  │     datos,                                                              │
-  │     method='zscore',                                                    │
-  │     threshold=3                                                         │
-  │ )                                                                        │
-  │ print(f"Outliers Z-score: {outliers_z.sum()}")                          │
-  │                                                                          │
-  │ # Isolation Forest (machine learning)                                    │
-  │ outliers_if = utils.detect_outliers(                                    │
-  │     datos,                                                              │
-  │     method='isolation_forest',                                          │
-  │     contamination=0.05                                                  │
-  │ )                                                                        │
-  └──────────────────────────────────────────────────────────────────────────┘
-  ┌─ Ejemplo 5: Tamaño del Efecto ──────────────────────────────────────────┐
-  │ # Comparar dos grupos                                                    │
-  │ grupo_control = np.random.normal(100, 15, 100)                          │
-  │ grupo_tratamiento = np.random.normal(110, 15, 100)                      │
-  │                                                                          │
-  │ efecto = utils.calculate_effect_size(                                   │
-  │     grupo_control,                                                      │
-  │     grupo_tratamiento,                                                  │
-  │     method='cohen'                                                      │
-  │ )                                                                        │
-  │                                                                          │
-  │ print(f"Cohen's d: {efecto['effect_size']:.3f}")                        │
-  │ print(f"Interpretación: {efecto['interpretation']}")                    │
-  │ print(f"Diferencia de medias: {efecto['mean_diff']:.2f}")               │
-  └──────────────────────────────────────────────────────────────────────────┘
-  ┌─ Ejemplo 6: Gráficos de Distribución ───────────────────────────────────┐
-  │ df = pd.DataFrame({                                                      │
-  │     'edad': np.random.normal(35, 10, 500),                              │
-  │     'salario': np.random.lognormal(10.5, 0.5, 500)                      │
-  │ })                                                                       │
-  │                                                                          │
-  │ # Histograma simple                                                      │
-  │ fig1 = utils.plot_distribution(                                         │
-  │     df,                                                                 │
-  │     column='edad',                                                      │
-  │     plot_type='hist',                                                   │
-  │     bins=30                                                             │
-  │ )                                                                        │
-  │                                                                          │
-  │ # Panel completo (histograma, box, violin, Q-Q)                          │
-  │ fig2 = utils.plot_distribution(                                         │
-  │     df,                                                                 │
-  │     column='salario',                                                   │
-  │     plot_type='all',                                                    │
-  │     backend='seaborn'                                                   │
-  │ )                                                                        │
-  │                                                                          │
-  │ # Con Plotly (interactivo)                                               │
-  │ fig3 = utils.plot_distribution(                                         │
-  │     df,                                                                 │
-  │     column='edad',                                                      │
-  │     plot_type='violin',                                                 │
-  │     backend='plotly'                                                    │
-  │ )                                                                        │
-  └──────────────────────────────────────────────────────────────────────────┘
-  ┌─ Ejemplo 7: Distribución con Intervalos de Confianza ───────────────────┐
-  │ # Visualizar distribución con IC                                         │
-  │ fig = utils.plot_distribution_with_ci(                                  │
-  │     df,                                                                 │
-  │     column='edad',                                                      │
-  │     confidence_level=0.95,                                              │
-  │     ci_method='parametric',                                             │
-  │     bins=30,                                                            │
-  │     save_fig=True,                                                      │
-  │     filename='edad_con_ic'                                              │
-  │ )                                                                        │
-  │                                                                          │
-  │ # Comparar múltiples distribuciones                                      │
-  │ data_dict = {                                                            │
-  │     'Grupo A': df['edad'][:200],                                        │
-  │     'Grupo B': df['edad'][200:400],                                     │
-  │     'Grupo C': df['edad'][400:]                                         │
-  │ }                                                                        │
-  │                                                                          │
-  │ fig = utils.plot_multiple_distributions_with_ci(                        │
-  │     data_dict,                                                          │
-  │     confidence_level=0.95                                               │
-  │ )                                                                        │
-  └──────────────────────────────────────────────────────────────────────────┘
-  ┌─ Ejemplo 8: Matriz de Correlación ──────────────────────────────────────┐
-  │ # Crear datos correlacionados                                            │
-  │ df = pd.DataFrame({                                                      │
-  │     'A': np.random.normal(0, 1, 100),                                   │
-  │     'B': np.random.normal(0, 1, 100),                                   │
-  │     'C': np.random.normal(0, 1, 100)                                    │
-  │ })                                                                       │
-  │ df['D'] = df['A'] * 0.8 + np.random.normal(0, 0.2, 100)                │
-  │                                                                          │
-  │ # Matriz de correlación con seaborn                                      │
-  │ fig = utils.plot_correlation_matrix(                                    │
-  │     df,                                                                 │
-  │     method='pearson',                                                   │
-  │     backend='seaborn',                                                  │
-  │     figsize=(10, 8)                                                     │
-  │ )                                                                        │
-  │                                                                          │
-  │ # Con Plotly (interactiva)                                               │
-  │ fig = utils.plot_correlation_matrix(                                    │
-  │     df,                                                                 │
-  │     method='spearman',                                                  │
-  │     backend='plotly'                                                    │
-  │ )                                                                        │
-  └──────────────────────────────────────────────────────────────────────────┘
-  ┌─ Ejemplo 9: Matriz de Dispersión ───────────────────────────────────────┐
-  │ # Pairplot completo                                                      │
-  │ fig = utils.plot_scatter_matrix(                                        │
-  │     df,                                                                 │
-  │     columns=['A', 'B', 'C', 'D'],                                       │
-  │     backend='seaborn'                                                   │
-  │ )                                                                        │
-  │                                                                          │
-  │ # Con Plotly                                                             │
-  │ fig = utils.plot_scatter_matrix(                                        │
-  │     df,                                                                 │
-  │     backend='plotly'                                                    │
-  │ )                                                                        │
-  └──────────────────────────────────────────────────────────────────────────┘
-  ┌─ Ejemplo 10: Estadísticas Descriptivas Completas ───────────────────────┐
-  │ # Obtener todas las estadísticas                                         │
-  │ stats = utils.get_descriptive_stats(df, column='edad')                  │
-  │                                                                          │
-  │ print(f"Media: {stats['mean']:.2f}")                                    │
-  │ print(f"Mediana: {stats['median']:.2f}")                                │
-  │ print(f"Desv. Est.: {stats['std']:.2f}")                                │
-  │ print(f"IQR: {stats['iqr']:.2f}")                                       │
-  │ print(f"Asimetría: {stats['skewness']:.3f}")                            │
-  │ print(f"Curtosis: {stats['kurtosis']:.3f}")                             │
-  └──────────────────────────────────────────────────────────────────────────┘
-━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
-🎯 CARACTERÍSTICAS CLAVE:
-  ✓ Múltiples backends de visualización (matplotlib, seaborn, plotly)
-  ✓ Guardado automático de figuras en alta resolución
-  ✓ Análisis estadísticos robustos
-  ✓ Detección de outliers con 3 métodos
-  ✓ Intervalos de confianza paramétricos y bootstrap
-  ✓ Visualizaciones profesionales listas para publicación
-  ✓ Manejo automático de valores faltantes
-  ✓ Integración perfecta con pandas y numpy
-  ✓ Gráficos interactivos con Plotly
-━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
-📊 BACKENDS DE VISUALIZACIÓN:
-  🔹 Matplotlib:
-     • Rápido y ligero
-     • Ideal para gráficos simples
-     • Mejor para exportar a archivos
-  🔹 Seaborn:
-     • Gráficos estadísticos elegantes
-     • Temas predefinidos atractivos
-     • Mejor para análisis exploratorio
-  🔹 Plotly:
-     • Gráficos interactivos
-     • Zoom, pan, hover tooltips
-     • Ideal para presentaciones y dashboards
-━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
-💡 CONSEJOS Y MEJORES PRÁCTICAS:
-  1. Siempre verificar normalidad antes de usar métodos paramétricos
-  2. Usar bootstrap para IC cuando los datos no son normales
-  3. Detectar outliers antes de calcular estadísticas
-  4. Guardar figuras en alta resolución (300 DPI) para publicaciones
-  5. Usar Plotly para presentaciones interactivas
-  6. Usar seaborn para análisis exploratorio rápido
-━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
-📚 DOCUMENTACIÓN ADICIONAL:
-   Para más información sobre métodos específicos, use:
-   help(UtilsStats.nombre_metodo)
-╚════════════════════════════════════════════════════════════════════════════╝
-    """
-        print(help_text)
+        }

statslibx 0.1.3__py3-none-any.whl → 0.1.5__py3-none-any.whl

statslibx 0.1.3py3-none-any.whl → 0.1.5py3-none-any.whl