InsideForest 0.2.2__tar.gz → 0.2.3__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -104,7 +104,8 @@ def replace_with_dict(df, columns, var_rename):
104
104
 
105
105
 
106
106
 
107
- def get_descripciones_valiosas(df_datos_descript,df_datos_clusterizados, TARGETS, var_rename):
107
+ def get_descripciones_valiosas(df_datos_descript,df_datos_clusterizados, TARGETS, var_rename,
108
+ inflex_pond_sup = .4, inflex_pond_inf=.5):
108
109
 
109
110
  df_datos_descript = df_datos_descript.sort_values('cluster_ponderador', ascending=False)
110
111
  # descrip_generales = [x for x in df_datos_descript['cluster_descripcion'].unique().tolist() if type('')==type(x)]
@@ -132,10 +133,16 @@ def get_descripciones_valiosas(df_datos_descript,df_datos_clusterizados, TARGETS
132
133
  punto = primer_punto_inflexion_decreciente(los_custers_valiosos_original[0], bins=20, window_length=5, polyorder=2)
133
134
  punto_1 = primer_punto_inflexion_decreciente(los_custers_valiosos_original[1], bins=20, window_length=5, polyorder=2)
134
135
 
135
- los_custers_valiosos_original_cond = los_custers_valiosos_original[0]>punto*.4
136
- los_custers_valiosos_original_cond_1 = los_custers_valiosos_original[0]>punto_1
136
+ los_custers_valiosos_original_cond = los_custers_valiosos_original[0]>punto*inflex_pond_sup
137
137
 
138
- los_custers_valiosos_original = los_custers_valiosos_original[los_custers_valiosos_original_cond|los_custers_valiosos_original_cond_1]
138
+ los_custers_valiosos_original_cond_1 = los_custers_valiosos_original[1]>punto_1
139
+
140
+ los_custers_valiosos_original_cond_2 = los_custers_valiosos_original[0]<inflex_pond_inf
141
+
142
+
143
+ los_custers_valiosos_original = los_custers_valiosos_original[los_custers_valiosos_original_cond\
144
+ |los_custers_valiosos_original_cond_1\
145
+ |los_custers_valiosos_original_cond_2]
139
146
 
140
147
  df_datos_descript_valiosas = df_datos_descript[df_datos_descript['cluster'].isin(los_custers_valiosos_original.index.tolist())]
141
148
 
@@ -143,6 +150,7 @@ def get_descripciones_valiosas(df_datos_descript,df_datos_clusterizados, TARGETS
143
150
  df_datos_descript_valiosas = df_datos_descript_valiosas.merge(proprcin_.reset_index(), on='cluster', how='left')
144
151
  df_datos_descript_valiosas = df_datos_descript_valiosas.merge(los_custers.reset_index(), on='cluster', how='left')
145
152
  df_datos_descript_valiosas = df_datos_descript_valiosas.rename(columns={'1_x':'Probabilidad','1_y':'N_probabilidad',0:'Soporte'})
153
+
146
154
  return df_datos_descript_valiosas.drop(columns=['cluster_ponderador']), stacked_data
147
155
 
148
156
 
@@ -792,9 +792,7 @@ class regions:
792
792
  return df_clusterizado_add.drop(columns='clusters_key')
793
793
 
794
794
 
795
-
796
-
797
- def labels(self, df, df_reres, include_desc=False):
795
+ def labels(self, df, df_reres, include_desc=False, include_summary_cluster=True):
798
796
  lista_reglas = copy.deepcopy(df_reres)
799
797
 
800
798
  # Asignar IDs únicos a las reglas
@@ -809,12 +807,15 @@ class regions:
809
807
  # Asignar clusters a los datos utilizando las reglas importantes
810
808
  df_datos_clusterizados, df_clusters_descripcion = self.asignar_clusters_a_datos(df, df_reglas_importantes)
811
809
 
812
- df_datos_clusterizados = self.get_clusters_importantes(df_datos_clusterizados)
810
+ if include_summary_cluster:
811
+ df_datos_clusterizados = self.get_clusters_importantes(df_datos_clusterizados)
813
812
 
814
813
  if include_desc:
815
814
  df_datos_clusterizados = df_datos_clusterizados.merge(df_clusters_descripcion, on='cluster', how='left')
816
815
 
817
- df_datos_clusterizados = df_datos_clusterizados.rename(columns={'cluster_descripcion':'best_cluster_descripcion','cluster_ponderador':'best_cluster_ponderador','cluster':'best_cluster'})
816
+ df_datos_clusterizados = df_datos_clusterizados.rename(columns={'cluster_descripcion':'best_cluster_descripcion',
817
+ 'cluster_ponderador':'best_cluster_ponderador',
818
+ 'cluster':'best_cluster'})
818
819
 
819
820
  return df_datos_clusterizados
820
821
 
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.2
2
2
  Name: InsideForest
3
- Version: 0.2.2
3
+ Version: 0.2.3
4
4
  Summary: A comprehensive library for describing and analyzing data insights via AI
5
5
  Home-page: https://github.com/jcval94/InsideForest.git
6
6
  Author: [('Jose Carlos Del Valle', 'jcval94@gmail.com'), ('ChatGPT', 'chat.openai.com/chat')]
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.2
2
2
  Name: InsideForest
3
- Version: 0.2.2
3
+ Version: 0.2.3
4
4
  Summary: A comprehensive library for describing and analyzing data insights via AI
5
5
  Home-page: https://github.com/jcval94/InsideForest.git
6
6
  Author: [('Jose Carlos Del Valle', 'jcval94@gmail.com'), ('ChatGPT', 'chat.openai.com/chat')]
@@ -2,7 +2,7 @@ from setuptools import setup, find_packages
2
2
 
3
3
  setup(
4
4
  name='InsideForest',
5
- version='0.2.2',
5
+ version='0.2.3',
6
6
  packages=find_packages(),
7
7
  license='MIT',
8
8
  author=[('Jose Carlos Del Valle', 'jcval94@gmail.com'),
File without changes
File without changes