PyPI - edb-noumea - Versions diffs - 0.2.11__tar.gz → 0.2.13__tar.gz - Mend

edb-noumea 0.2.11tar.gz → 0.2.13tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

{edb_noumea-0.2.11 → edb_noumea-0.2.13}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: edb-noumea
-Version: 0.2.11
+Version: 0.2.13
 Summary: Un scraper pour la qualité des eaux de baignade à Nouméa.
 Project-URL: Homepage, https://github.com/adriens/edb-noumea
 Project-URL: Repository, https://github.com/adriens/edb-noumea

{edb_noumea-0.2.11 → edb_noumea-0.2.13}/edb_noumea/details.py RENAMED Viewed

@@ -96,8 +96,19 @@ def get_detailed_results():
     print("\nColonnes:", list(df.columns))
     print("Shape:", df.shape)
-    # Sélectionne les colonnes par position et applique le mapping fixe
-    expected_columns = [
+    # Sélection dynamique des colonnes bactéries par nom
+    # Recherche des colonnes contenant les mots-clés
+    e_coli_col = next((col for col in df.columns if "Escherichia" in str(col) or "coli" in str(col)), None)
+    entero_col = next((col for col in df.columns if "Entérocoques" in str(col)), None)
+    if e_coli_col is None or entero_col is None:
+        print(f"❌ Colonnes bactéries non trouvées dans le tableau extrait. Colonnes disponibles : {list(df.columns)}")
+        return None
+    # Sélectionne les 4 premières colonnes + colonnes bactéries trouvées
+    selected_cols = [df.columns[0], df.columns[1], df.columns[2], df.columns[4], e_coli_col, entero_col]
+    cleaned_df = df.loc[:, selected_cols].copy()
+    cleaned_df.columns = [
         "site",
         "point_de_prelevement",
         "date",
@@ -105,8 +116,6 @@ def get_detailed_results():
         "e_coli_npp_100ml",
         "enterocoques_npp_100ml"
     ]
-    cleaned_df = df.iloc[:, :6].copy()
-    cleaned_df.columns = expected_columns
     # Ajoute deux colonnes issues du split de 'point_de_prelevement'
     split_points = cleaned_df["point_de_prelevement"].str.split(",", n=1, expand=True)
@@ -117,11 +126,19 @@ def get_detailed_results():
     if "heure" in cleaned_df.columns:
         cleaned_df["heure"] = cleaned_df["heure"].astype(str)
     # Nettoyer et convertir les colonnes e_coli_npp_100ml et enterocoques_npp_100ml
-    for col in ["e_coli_npp_100ml", "enterocoques_npp_100ml"]:
-        if col in cleaned_df.columns:
-            cleaned_df[col] = cleaned_df[col].astype(str).str.replace(r"<\s*10", "10", regex=True)
-            cleaned_df[col] = pd.to_numeric(cleaned_df[col], errors="coerce").astype('Int64')
+    if "e_coli_npp_100ml" in cleaned_df.columns:
+        cleaned_df["e_coli_npp_100ml"] = cleaned_df["e_coli_npp_100ml"].astype(str).str.replace(r"<\s*10", "10", regex=True)
+        cleaned_df["e_coli_npp_100ml"] = pd.to_numeric(cleaned_df["e_coli_npp_100ml"], errors="coerce").astype('Int64')
+    if "enterocoques_npp_100ml" in cleaned_df.columns:
+        cleaned_df["enterocoques_npp_100ml"] = cleaned_df["enterocoques_npp_100ml"].astype(str).str.replace(r"<\s*10", "10", regex=True)
+        cleaned_df["enterocoques_npp_100ml"] = pd.to_numeric(cleaned_df["enterocoques_npp_100ml"], errors="coerce").astype('Int64')
+    # Convertir la colonne 'date' en datetime (format jour/mois/année)
+    if "date" in cleaned_df.columns:
+        cleaned_df["date"] = pd.to_datetime(cleaned_df["date"], format="%d/%m/%Y", errors="coerce")
     return cleaned_df
@@ -129,9 +146,12 @@ if __name__ == "__main__":
     # Obtenir le DataFrame des résultats détaillés
     detailed_df = get_detailed_results()
-    # Afficher le DataFrame s'il a été créé avec succès
+    # Afficher seulement les colonnes demandées
     if detailed_df is not None:
-        print("\n📋 Voici les détails des derniers relevés (toutes colonnes) :")
-        print(detailed_df)
-        print("\nColonnes du DataFrame :")
-        print(list(detailed_df.columns))
+        print("\n📋 Détails synthétiques :")
+        print(detailed_df[[
+            "point_de_prelevement",
+            "date",
+            "e_coli_npp_100ml",
+            "enterocoques_npp_100ml"
+        ]])

{edb_noumea-0.2.11 → edb_noumea-0.2.13}/edb_noumea.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: edb-noumea
-Version: 0.2.11
+Version: 0.2.13
 Summary: Un scraper pour la qualité des eaux de baignade à Nouméa.
 Project-URL: Homepage, https://github.com/adriens/edb-noumea
 Project-URL: Repository, https://github.com/adriens/edb-noumea

{edb_noumea-0.2.11 → edb_noumea-0.2.13}/pyproject.toml RENAMED Viewed

@@ -1,6 +1,6 @@
 [project]
 name = "edb-noumea"
-version = "0.2.11"
+version = "0.2.13"
 description = "Un scraper pour la qualité des eaux de baignade à Nouméa."
 dependencies = [
     "requests",