PyPI - statslibx - Versions diffs - 0.1.0__tar.gz → 0.1.1__tar.gz - Mend

statslibx 0.1.0tar.gz → 0.1.1tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (15) hide show

{statslibx-0.1.0 → statslibx-0.1.1}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: statslibx
-Version: 0.1.0
+Version: 0.1.1
 Summary: Librería de estadística descriptiva e inferencial para Python
 Home-page: https://github.com/Immanuel3008/StatsLibrary
 Author: Emmanuel Ascendra Perez

{statslibx-0.1.0 → statslibx-0.1.1}/setup.py RENAMED Viewed

@@ -9,7 +9,7 @@ except FileNotFoundError:
 setup(
     name="statslibx",
-    version="0.1.0",
+    version="0.1.1",
     author="Emmanuel Ascendra Perez",
     author_email="ascendraemmanuel@gmail.com",
     description="Librería de estadística descriptiva e inferencial para Python",

{statslibx-0.1.0/statslib → statslibx-0.1.1/statslibx}/__init__.py RENAMED Viewed

@@ -4,7 +4,7 @@ Autor: Emmanuel Ascendra
 Versión: 0.1.0
 """
-__version__ = "0.1.0"
+__version__ = "0.1.1"
 __author__ = "Emmanuel Ascendra"
 # Importar las clases principales
@@ -26,10 +26,11 @@ __all__ = [
 # Mensaje de bienvenida (opcional)
 def welcome():
     """Muestra información sobre la librería"""
-    print(f"StatsLib v{__version__}")
+    print(f"StatsLibx v{__version__}")
     print(f"Librería de estadística descriptiva e inferencial")
     print(f"Autor: {__author__}")
     print(f"\nClases disponibles:")
     print(f"  - DescriptiveStats: Estadística descriptiva")
     print(f"  - InferentialStats: Estadística inferencial")
-    print(f"\nPara más información: help(statslib)")
+    print(f"  - UtilsStats: Utilidades Extras")
+    print(f"\nPara más información: help(statslibx)")

{statslibx-0.1.0/statslib → statslibx-0.1.1/statslibx}/descriptive.py RENAMED Viewed

@@ -311,47 +311,198 @@ class DescriptiveStats:
         Muestra ayuda completa de la clase DescriptiveStats
         """
         help_text = """
-            📈 CLASE DescriptiveStats - AYUDA COMPLETA
+╔════════════════════════════════════════════════════════════════════════════╗
+║                    📊 CLASE DescriptiveStats - AYUDA COMPLETA              ║
+╚════════════════════════════════════════════════════════════════════════════╝
-            Clase para análisis estadístico descriptivo univariado y multivariado
+📝 DESCRIPCIÓN:
+   Clase para análisis estadístico descriptivo univariado y multivariado.
+   Proporciona herramientas para análisis exploratorio de datos, medidas de
+   tendencia central, dispersión, forma de distribución y regresión lineal.
-            🔧 MÉTODOS PRINCIPALES:
+━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
-            1. 📊 ESTADÍSTICAS UNIVARIADAS:
-            • .mean(), .median(), .mode()        # Tendencia central
-            • .std(), .variance()                # Dispersión
-            • .skewness(), .kurtosis()           # Forma de distribución
-            • .quantile(0.25)                    # Cuantiles
-            • .outliers('columna')               # Detección de outliers
+📋 MÉTODOS PRINCIPALES:
-            2. 🔗 ESTADÍSTICAS MULTIVARIADAS:
-            • .correlation()                     # Matriz de correlación
-            • .covariance()                      # Matriz de covarianza
+┌────────────────────────────────────────────────────────────────────────────┐
+│ 1. 📊 ESTADÍSTICAS UNIVARIADAS                                             │
+└────────────────────────────────────────────────────────────────────────────┘
-            3. 📋 RESUMEN COMPLETO:
-            • .summary()                         # Resumen descriptivo completo
-            • .summary(show_plot=True)           # Con visualizaciones
+  🔹 Medidas de Tendencia Central:
+     • .mean(column=None)              → Media aritmética
+     • .median(column=None)            → Mediana (valor central)
+     • .mode(column=None)              → Moda (valor más frecuente)
-            4. 📈 REGRESIÓN LINEAL:
-            • .linear_regression(y, X)           # Regresión simple/múltiple
+  🔹 Medidas de Dispersión:
+     • .std(column=None)               → Desviación estándar
+     • .variance(column=None)          → Varianza
+     • .quantile(q, column=None)       → Cuantiles/Percentiles
-            💡 EJEMPLOS DE USO:
+  🔹 Medidas de Forma:
+     • .skewness(column=None)          → Asimetría (sesgo)
+     • .kurtosis(column=None)          → Curtosis (apuntamiento)
-            # Inicializar
-            estadisticas = DescriptiveStats(mi_dataframe)
+  🔹 Detección de Valores Atípicos:
+     • .outliers(column, method='iqr', threshold=1.5)
+       Métodos: 'iqr' (rango intercuartílico) o 'zscore' (puntuación z)
-            # Análisis univariado
-            media = estadisticas.mean('edad')
-            resumen = estadisticas.summary()
+┌────────────────────────────────────────────────────────────────────────────┐
+│ 2. 🔗 ESTADÍSTICAS MULTIVARIADAS                                           │
+└────────────────────────────────────────────────────────────────────────────┘
-            # Regresión
-            modelo = estadisticas.linear_regression(
-                y='ventas',
-                X=['publicidad', 'precio'],
-                show_plot=True
-            )
-            print(modelo.summary())
-            """
+  • .correlation(method='pearson', columns=None)
+    Matriz de correlación entre variables
+    Métodos: 'pearson', 'spearman', 'kendall'
+  • .covariance(columns=None)
+    Matriz de covarianza entre variables
+┌────────────────────────────────────────────────────────────────────────────┐
+│ 3. 📋 RESUMEN COMPLETO                                                     │
+└────────────────────────────────────────────────────────────────────────────┘
+  • .summary(columns=None, show_plot=False, plot_backend='seaborn')
+    Resumen descriptivo completo con todas las estadísticas
+    Incluye: conteo, media, mediana, moda, desv. est., varianza,
+            mínimo, Q1, Q3, máximo, IQR, asimetría, curtosis
+┌────────────────────────────────────────────────────────────────────────────┐
+│ 4. 📈 REGRESIÓN LINEAL                                                     │
+└────────────────────────────────────────────────────────────────────────────┘
+  • .linear_regression(y, X, engine='statsmodels',
+                      fit_intercept=True, show_plot=False,
+                      plot_backend='seaborn', handle_missing='drop')
+    Regresión lineal simple o múltiple con análisis completo
+    Parámetros:
+      y               : Variable dependiente (str)
+      X               : Variable(s) independiente(s) (str o list)
+      engine          : 'statsmodels' o 'scikit-learn'
+      fit_intercept   : Incluir intercepto (bool)
+      show_plot       : Mostrar gráficos diagnósticos (bool)
+      handle_missing  : 'drop', 'error', 'warn'
+━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
+💡 EJEMPLOS DE USO:
+  ┌─ Ejemplo 1: Inicialización ─────────────────────────────────────────────┐
+  │ import pandas as pd                                                      │
+  │ from descriptive import DescriptiveStats                                │
+  │                                                                          │
+  │ # Con DataFrame                                                          │
+  │ df = pd.read_csv('datos.csv')                                           │
+  │ stats = DescriptiveStats(df)                                            │
+  │                                                                          │
+  │ # Con array numpy                                                        │
+  │ import numpy as np                                                       │
+  │ datos = np.random.normal(0, 1, 1000)                                    │
+  │ stats = DescriptiveStats(datos)                                         │
+  └──────────────────────────────────────────────────────────────────────────┘
+  ┌─ Ejemplo 2: Análisis Univariado ────────────────────────────────────────┐
+  │ # Estadísticas de una columna                                           │
+  │ media = stats.mean('edad')                                              │
+  │ mediana = stats.median('edad')                                          │
+  │ desv_est = stats.std('edad')                                            │
+  │                                                                          │
+  │ # Cuartiles                                                              │
+  │ q25 = stats.quantile(0.25, 'edad')                                      │
+  │ q75 = stats.quantile(0.75, 'edad')                                      │
+  │                                                                          │
+  │ # Detectar outliers                                                      │
+  │ outliers_mask = stats.outliers('edad', method='iqr', threshold=1.5)    │
+  │ print(f"Outliers detectados: {outliers_mask.sum()}")                    │
+  └──────────────────────────────────────────────────────────────────────────┘
+  ┌─ Ejemplo 3: Resumen Completo ───────────────────────────────────────────┐
+  │ # Resumen de todas las variables numéricas                              │
+  │ resumen = stats.summary()                                               │
+  │ print(resumen)                                                           │
+  │                                                                          │
+  │ # Resumen de columnas específicas con visualización                     │
+  │ resumen = stats.summary(                                                │
+  │     columns=['edad', 'salario', 'experiencia'],                         │
+  │     show_plot=True,                                                     │
+  │     plot_backend='seaborn'                                              │
+  │ )                                                                        │
+  └──────────────────────────────────────────────────────────────────────────┘
+  ┌─ Ejemplo 4: Análisis Multivariado ──────────────────────────────────────┐
+  │ # Matriz de correlación                                                  │
+  │ corr_pearson = stats.correlation(method='pearson')                      │
+  │ corr_spearman = stats.correlation(method='spearman')                    │
+  │                                                                          │
+  │ # Matriz de covarianza                                                   │
+  │ cov_matrix = stats.covariance()                                         │
+  │                                                                          │
+  │ # Correlación entre variables específicas                               │
+  │ corr_subset = stats.correlation(                                        │
+  │     method='pearson',                                                   │
+  │     columns=['edad', 'salario', 'experiencia']                          │
+  │ )                                                                        │
+  └──────────────────────────────────────────────────────────────────────────┘
+  ┌─ Ejemplo 5: Regresión Lineal Simple ────────────────────────────────────┐
+  │ # Regresión simple: salario ~ experiencia                               │
+  │ modelo = stats.linear_regression(                                       │
+  │     y='salario',                                                        │
+  │     X='experiencia',                                                    │
+  │     engine='statsmodels',                                               │
+  │     show_plot=True                                                      │
+  │ )                                                                        │
+  │                                                                          │
+  │ # Ver resultados                                                         │
+  │ print(modelo.summary())                                                  │
+  │                                                                          │
+  │ # Acceder a coeficientes                                                 │
+  │ print(f"Intercepto: {modelo.intercept_}")                               │
+  │ print(f"Pendiente: {modelo.coef_[0]}")                                  │
+  │ print(f"R²: {modelo.r_squared}")                                        │
+  └──────────────────────────────────────────────────────────────────────────┘
+  ┌─ Ejemplo 6: Regresión Lineal Múltiple ──────────────────────────────────┐
+  │ # Regresión múltiple: salario ~ experiencia + edad + educacion          │
+  │ modelo = stats.linear_regression(                                       │
+  │     y='salario',                                                        │
+  │     X=['experiencia', 'edad', 'educacion'],                             │
+  │     engine='statsmodels',                                               │
+  │     fit_intercept=True,                                                 │
+  │     handle_missing='drop'                                               │
+  │ )                                                                        │
+  │                                                                          │
+  │ print(modelo.summary())                                                  │
+  │                                                                          │
+  │ # Hacer predicciones                                                     │
+  │ import numpy as np                                                       │
+  │ X_nuevo = np.array([[5, 30, 16], [10, 35, 18]])  # experiencia, edad   │
+  │ predicciones = modelo.predict(X_nuevo)                                  │
+  └──────────────────────────────────────────────────────────────────────────┘
+━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
+🎯 CARACTERÍSTICAS CLAVE:
+  ✓ Análisis univariado completo
+  ✓ Análisis multivariado (correlación, covarianza)
+  ✓ Detección de outliers con múltiples métodos
+  ✓ Regresión lineal con statsmodels o scikit-learn
+  ✓ Manejo automático de valores faltantes
+  ✓ Soporte para pandas DataFrame y numpy arrays
+  ✓ Salidas formateadas profesionales
+  ✓ Visualizaciones opcionales
+━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
+📚 DOCUMENTACIÓN ADICIONAL:
+   Para más información sobre métodos específicos, use:
+   help(DescriptiveStats.nombre_metodo)
+╚════════════════════════════════════════════════════════════════════════════╝
+    """
         print(help_text)
 class DescriptiveSummary:

statslibx 0.1.0__tar.gz → 0.1.1__tar.gz

statslibx 0.1.0tar.gz → 0.1.1tar.gz