PyPI - edb-noumea - Versions diffs - 0.2.6__tar.gz → 0.2.14__tar.gz - Mend

edb-noumea 0.2.6tar.gz → 0.2.14tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (16) hide show

edb_noumea-0.2.14/PKG-INFO ADDED Viewed

@@ -0,0 +1,203 @@
+Metadata-Version: 2.4
+Name: edb-noumea
+Version: 0.2.14
+Summary: Un scraper pour la qualité des eaux de baignade à Nouméa.
+Author: Adrien SALES
+License: MIT
+Project-URL: Homepage, https://github.com/adriens/edb-noumea
+Project-URL: Repository, https://github.com/adriens/edb-noumea
+Classifier: Development Status :: 4 - Beta
+Classifier: Programming Language :: Python :: 3
+Classifier: License :: OSI Approved :: MIT License
+Classifier: Operating System :: OS Independent
+Classifier: Topic :: Utilities
+Description-Content-Type: text/markdown
+Requires-Dist: requests
+Requires-Dist: beautifulsoup4
+Requires-Dist: pandas
+Requires-Dist: lxml
+Requires-Dist: tabula-py
+Requires-Dist: matplotlib
+Provides-Extra: dev
+Requires-Dist: pytest; extra == "dev"
+Requires-Dist: ruff; extra == "dev"
+![Built with uv](https://img.shields.io/badge/Built%20with-uv-blueviolet?logo=python&logoColor=white)
+[![PyPI - Downloads](https://img.shields.io/pypi/dm/edb-noumea)](https://pypistats.org/packages/edb-noumea)
+# Qualité des Eaux de Baignade à Nouméa
+Ce projet Python fournit un outil simple pour scraper les données sur la qualité des eaux de baignade à Nouméa depuis le site officiel de la ville (`noumea.nc`). Il extrait les informations et les présente sous forme de tableau dans le terminal.
+Il se base sur les données de https://www.noumea.nc/noumea-pratique/salubrite-publique/qualite-eaux-baignade
+## Prérequis
+Avant de commencer, assurez-vous d'avoir installé `uv`, le gestionnaire de paquets et d'environnements virtuels Python.
+## Installation
+Suivez ces étapes pour configurer l'environnement et installer les dépendances.
+1.  **Accédez au répertoire du projet :**
+    ```bash
+    cd edb-noumea
+    ```
+2.  **Créez un environnement virtuel avec `uv` :**
+    ```bash
+    uv venv
+    ```
+3.  **Activez l'environnement virtuel :**
+    ```bash
+    source .venv/bin/activate
+    ```
+    *(Sur Windows, utilisez `.venv\Scripts\activate`)*
+4.  **Installez les dépendances du projet :**
+    ```bash
+    uv pip install -e .
+    ```
+    *(L'option `-e .` installe le projet en mode "éditable", ce qui vous permet de modifier le code sans avoir à le réinstaller.)*
+## Utilisation
+Ce package peut être utilisé de deux manières : soit pour obtenir un résumé de l'état des plages, soit pour obtenir les résultats détaillés des derniers prélèvements.
+### Obtenir le résumé de l'état sanitaire
+Pour obtenir le tableau de résumé simple depuis la page web principale, exécutez :
+```bash
+python -m edb_noumea.main
+```
+### Obtenir les résultats détaillés (depuis PDF)
+Pour obtenir le tableau détaillé des derniers relevés (extrait automatiquement du dernier fichier PDF disponible), exécutez :
+```bash
+python -m edb_noumea.details
+```
+## Générer des graphiques PNG des analyses détaillées
+Vous pouvez générer automatiquement deux graphiques au format PNG (niveaux d'E. coli et d'Entérocoques par point de prélèvement) à partir des derniers résultats d'analyses, grâce au script fourni.
+### Étapes
+1. Assurez-vous que l'environnement virtuel est activé et que les dépendances sont installées.
+2. Exécutez le script suivant depuis le répertoire du projet :
+```bash
+source .venv/bin/activate
+/home/adriens/Github/edb-noumea/noumea_water_quality/.venv/bin/python generer_graphique_analyses.py
+```
+Deux fichiers PNG seront générés dans le dossier courant :
+Vous pouvez ouvrir ces fichiers pour visualiser les résultats détaillés des analyses.
+## Utilisation en tant que Bibliothèque
+Vous pouvez également importer les fonctions dans vos propres scripts Python pour une intégration plus poussée.
+Installer
+### Obtenir le résumé
+```python
+# exemple_resume.py
+from edb_noumea.main import get_water_quality
+df_resume = get_water_quality()
+if df_resume is not None:
+    print("Résumé de l'état des plages :")
+    print(df_resume.to_string())
+```
+### Obtenir les résultats détaillés
+```python
+# exemple_details.py
+from edb_noumea.details import get_detailed_results
+df_details = get_detailed_results()
+if df_details is not None:
+    print("Détails des derniers relevés :")
+    print(df_details.to_string())
+```
+### Exemple de Visualisation
+Voici un exemple montrant comment récupérer les données détaillées et créer un graphique simple avec `matplotlib` pour visualiser les niveaux d'E. coli par point de prélèvement.
+```python
+# exemple_visualisation.py
+import pandas as pd
+import matplotlib.pyplot as plt
+from edb_noumea.details import get_detailed_results
+# Obtenir les données détaillées
+df = get_detailed_results()
+if df is not None and not df.empty:
+    print("Création du graphique...")
+    # S'assurer que les données sont triées pour une meilleure lisibilité
+    df_sorted = df.sort_values(by='e_coli_npp_100ml', ascending=False)
+    # Créer le graphique à barres horizontales
+    plt.figure(figsize=(12, 8))
+    plt.barh(df_sorted['point_de_prelevement'], df_sorted['e_coli_npp_100ml'], color='skyblue')
+    # Ajouter les titres et les étiquettes
+    plt.xlabel('E. coli (NPP/100ml)')
+    plt.ylabel('Point de prélèvement')
+    plt.title("Niveaux d'E. coli par Point de Prélèvement")
+    plt.gca().invert_yaxis() # Afficher le plus élevé en haut
+    plt.tight_layout() # Ajuster le layout pour que tout soit visible
+    # Sauvegarder le graphique dans un fichier
+    plt.savefig('ecoli_levels.png')
+    print("Graphique sauvegardé sous 'ecoli_levels.png'")
+    # Afficher le graphique
+    plt.show()
+else:
+    print("Aucune donnée à afficher.")
+```
+*Assurez-vous que votre script est exécuté dans le même environnement virtuel où le package `edb-noumea` a été installé.*
+## Sortie Attendue
+### Résumé de l'état sanitaire (`main`)
+```
+📊 État sanitaire des eaux de baignade à Nouméa 📊
+                                  Plage      État sanitaire
+0          Plage de la baie des Citrons  Baignade autorisée
+1  Plage de la promenade Pierre-Vernier  Baignade autorisée
+...
+```
+### Détails des relevés (`details`)
+```
+📋 Voici les détails des derniers relevés :
+                                   Site                       Point de prélèvement        Date  Heure E. coli (NPP/100ml) Entérocoques (NPP/100ml)
+0          PLAGE DE LA BAIE DES CITRONS               P18049, Face The Beach House  04/09/2025  07:29                    10                         20
+1          PLAGE DE LA BAIE DES CITRONS   P18050, Face allée centrale Mirage plaza  04/09/2025  07:33                    62                         75
+...
+```

{edb_noumea-0.2.6 → edb_noumea-0.2.14}/README.md RENAMED Viewed

@@ -1,4 +1,8 @@
 ![Built with uv](https://img.shields.io/badge/Built%20with-uv-blueviolet?logo=python&logoColor=white)
+[![PyPI - Downloads](https://img.shields.io/pypi/dm/edb-noumea)](https://pypistats.org/packages/edb-noumea)
 # Qualité des Eaux de Baignade à Nouméa

edb_noumea-0.2.14/edb_noumea/details.py ADDED Viewed

@@ -0,0 +1,178 @@
+import pandas as pd
+@staticmethod
+def get_sites():
+    """
+    Retourne un DataFrame avec le mapping site/plage/gmaps_url.
+    """
+    data = [
+        {"site": "PLAGE DE LA BAIE DES CITRONS", "plage": "Plage de la baie des Citrons", "gmaps_url": "https://maps.app.goo.gl/P2SP3oWuQbxd1sCH9"},
+        {"site": "PLAGE DE L'ANSE VATA", "plage": "Plage de l'Anse-Vata", "gmaps_url": "https://maps.app.goo.gl/xAUdky47DqEjSF4R8"},
+        {"site": "PLAGE DE LA POINTE MAGNIN", "plage": "Plage de la pointe Magnin", "gmaps_url": "https://maps.app.goo.gl/Wf69LoGgc894MtQy6"},
+        {"site": "PLAGE DE LA PROMENADE PIERRE VERNIER", "plage": "Plage de la promenade Pierre-Vernier", "gmaps_url": "https://maps.app.goo.gl/bNocZKVVMYk3HFYs9"},
+        {"site": "PLAGE DE MAGENTA", "plage": "Plage de Magenta", "gmaps_url": "https://maps.app.goo.gl/yFwgG2BCV1sEtPWP6"},
+        {"site": "PLAGE DU KUENDU BEACH", "plage": "Plage du Kuendu Beach", "gmaps_url": "https://maps.app.goo.gl/oGY6Hy4KCXJWxqfL9"},
+    ]
+    return pd.DataFrame(data)
+def get_pdf_url():
+    """
+    Alias public pour obtenir l'URL du dernier PDF d'analyses détaillées.
+    """
+    return get_latest_pdf_url()
+import pandas as pd
+import tabula
+import requests
+import io
+from bs4 import BeautifulSoup
+# URL de la page officielle contenant le lien vers le PDF
+PAGE_URL = "https://www.noumea.nc/noumea-pratique/salubrite-publique/qualite-eaux-baignade"
+def get_latest_pdf_url():
+    """
+    Récupère dynamiquement l'URL du dernier PDF d'analyses détaillées depuis la page officielle.
+    """
+    print(f"🔗 Recherche du lien PDF sur {PAGE_URL} ...")
+    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
+    try:
+        resp = requests.get(PAGE_URL, headers=headers)
+        resp.raise_for_status()
+    except Exception as e:
+        print(f"❌ Impossible de récupérer la page officielle : {e}")
+        return None
+    soup = BeautifulSoup(resp.text, "lxml")
+    # Chercher le premier lien PDF dans la page
+    link = soup.find("a", href=lambda h: h and h.endswith(".pdf"))
+    if not link:
+        print("❌ Aucun lien PDF trouvé sur la page.")
+        return None
+    pdf_url = link["href"]
+    # Si le lien est relatif, le rendre absolu
+    if pdf_url.startswith("/"):
+        pdf_url = "https://www.noumea.nc" + pdf_url
+    print(f"✅ Lien PDF trouvé : {pdf_url}")
+    return pdf_url
+def get_detailed_results():
+    """
+    Télécharge dynamiquement le PDF des résultats détaillés, en extrait le premier tableau
+    et le retourne sous forme de DataFrame pandas.
+    """
+    pdf_url = get_latest_pdf_url()
+    if not pdf_url:
+        return None
+    print(f"📥 Téléchargement du PDF depuis {pdf_url} ...")
+    try:
+        headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
+        response = requests.get(pdf_url, headers=headers)
+        response.raise_for_status()
+        print("✅ Téléchargement terminé.")
+    except requests.exceptions.RequestException as e:
+        print(f"❌ Erreur lors du téléchargement du fichier PDF : {e}")
+        return None
+    pdf_file = io.BytesIO(response.content)
+    try:
+        print("🔍 Extraction des tableaux du PDF...")
+        tables = tabula.read_pdf(pdf_file, pages='1', stream=True)
+    except Exception as e:
+        print(f"❌ Une erreur est survenue lors de l'extraction des données du PDF.")
+        print("ℹ️  Cela peut être dû à l'absence de Java sur votre système, qui est requis par la bibliothèque 'tabula-py'.")
+        print(f"   Erreur originale : {e}")
+        return None
+    if not tables:
+        print("❌ Aucun tableau n'a été trouvé dans le PDF.")
+        return None
+    print(f"✅ {len(tables)} tableau(x) trouvé(s). Affichage du premier.")
+    df = tables[0]
+    # Utiliser la première ligne comme en-têtes et supprimer cette ligne du DataFrame
+    df.columns = df.iloc[0]
+    df = df[1:].reset_index(drop=True)
+    # Nettoyer les noms de colonnes (supprimer les retours à la ligne et les espaces superflus)
+    df.columns = df.columns.str.replace('\n', ' ', regex=False).str.strip()
+    print("\n--- Aperçu du tableau extrait (toutes colonnes) ---")
+    with pd.option_context('display.max_columns', None):
+        print(df)
+    print("\nColonnes:", list(df.columns))
+    print("Shape:", df.shape)
+    # Sélection dynamique des colonnes par nom
+    # Recherche des colonnes contenant les mots-clés
+    site_col = df.columns[0]
+    point_prelevement_col = df.columns[1]
+    date_col = next((col for col in df.columns if "Date" in str(col) and "prélèvement" in str(col)), None)
+    heure_col = next((col for col in df.columns if "Heure" in str(col) and "prélèvement" in str(col)), None)
+    e_coli_col = next((col for col in df.columns if "coli" in str(col) and "NPP" in str(col)), None)
+    entero_col = next((col for col in df.columns if ("Entérocoques" in str(col) or "intestinaux" in str(col)) and "NPP" in str(col)), None)
+    # Les noms de colonnes pour 'site' et 'point de prélèvement' sont souvent
+    # non reconnus par tabula, on se base donc sur leur position (2 premières colonnes).
+    if not all([date_col, heure_col, e_coli_col, entero_col]):
+        print(f"❌ Une ou plusieurs colonnes n'ont pas été trouvées dans le tableau. Colonnes disponibles : {list(df.columns)}")
+        return None
+    # Sélectionne les colonnes d'intérêt
+    selected_cols = [site_col, point_prelevement_col, date_col, heure_col, e_coli_col, entero_col]
+    cleaned_df = df[selected_cols].copy()
+    cleaned_df.columns = [
+        "site",
+        "point_de_prelevement",
+        "date",
+        "heure",
+        "e_coli_npp_100ml",
+        "enterocoques_npp_100ml"
+    ]
+    # Ajoute deux colonnes issues du split de 'point_de_prelevement'
+    split_points = cleaned_df["point_de_prelevement"].str.split(",", n=1, expand=True)
+    cleaned_df["id_point_prelevement"] = split_points[0].str.strip()
+    cleaned_df["desc_point_prelevement"] = split_points[1].str.strip() if split_points.shape[1] > 1 else ""
+    # S'assurer que la colonne 'heure' est bien présente et de type string
+    if "heure" in cleaned_df.columns:
+        cleaned_df["heure"] = cleaned_df["heure"].astype(str)
+    # Nettoyer et convertir les colonnes e_coli_npp_100ml et enterocoques_npp_100ml
+    if "e_coli_npp_100ml" in cleaned_df.columns:
+        cleaned_df["e_coli_npp_100ml"] = cleaned_df["e_coli_npp_100ml"].astype(str).str.replace(r"<\s*10", "10", regex=True)
+        cleaned_df["e_coli_npp_100ml"] = pd.to_numeric(cleaned_df["e_coli_npp_100ml"], errors="coerce").astype('Int64')
+    if "enterocoques_npp_100ml" in cleaned_df.columns:
+        cleaned_df["enterocoques_npp_100ml"] = cleaned_df["enterocoques_npp_100ml"].astype(str).str.replace(r"<\s*10", "10", regex=True)
+        cleaned_df["enterocoques_npp_100ml"] = pd.to_numeric(cleaned_df["enterocoques_npp_100ml"], errors="coerce").astype('Int64')
+    # Convertir la colonne 'date' en datetime (format jour/mois/année)
+    if "date" in cleaned_df.columns:
+        cleaned_df["date"] = pd.to_datetime(cleaned_df["date"], format="%d/%m/%Y", errors="coerce")
+    return cleaned_df
+if __name__ == "__main__":
+    # Obtenir le DataFrame des résultats détaillés
+    detailed_df = get_detailed_results()
+    # Afficher seulement les colonnes demandées
+    if detailed_df is not None:
+        print("\n📋 Détails synthétiques :")
+        print(detailed_df[[
+            "point_de_prelevement",
+            "date",
+            "e_coli_npp_100ml",
+            "enterocoques_npp_100ml"
+        ]])
+        # Sauvegarder le DataFrame dans un fichier CSV
+        output_csv_path = "details.csv"
+        detailed_df.to_csv(output_csv_path, index=False)
+        print(f"\n✅ Résultats détaillés sauvegardés dans : {output_csv_path}")

edb_noumea-0.2.14/edb_noumea.egg-info/PKG-INFO ADDED Viewed

@@ -0,0 +1,203 @@
+Metadata-Version: 2.4
+Name: edb-noumea
+Version: 0.2.14
+Summary: Un scraper pour la qualité des eaux de baignade à Nouméa.
+Author: Adrien SALES
+License: MIT
+Project-URL: Homepage, https://github.com/adriens/edb-noumea
+Project-URL: Repository, https://github.com/adriens/edb-noumea
+Classifier: Development Status :: 4 - Beta
+Classifier: Programming Language :: Python :: 3
+Classifier: License :: OSI Approved :: MIT License
+Classifier: Operating System :: OS Independent
+Classifier: Topic :: Utilities
+Description-Content-Type: text/markdown
+Requires-Dist: requests
+Requires-Dist: beautifulsoup4
+Requires-Dist: pandas
+Requires-Dist: lxml
+Requires-Dist: tabula-py
+Requires-Dist: matplotlib
+Provides-Extra: dev
+Requires-Dist: pytest; extra == "dev"
+Requires-Dist: ruff; extra == "dev"
+![Built with uv](https://img.shields.io/badge/Built%20with-uv-blueviolet?logo=python&logoColor=white)
+[![PyPI - Downloads](https://img.shields.io/pypi/dm/edb-noumea)](https://pypistats.org/packages/edb-noumea)
+# Qualité des Eaux de Baignade à Nouméa
+Ce projet Python fournit un outil simple pour scraper les données sur la qualité des eaux de baignade à Nouméa depuis le site officiel de la ville (`noumea.nc`). Il extrait les informations et les présente sous forme de tableau dans le terminal.
+Il se base sur les données de https://www.noumea.nc/noumea-pratique/salubrite-publique/qualite-eaux-baignade
+## Prérequis
+Avant de commencer, assurez-vous d'avoir installé `uv`, le gestionnaire de paquets et d'environnements virtuels Python.
+## Installation
+Suivez ces étapes pour configurer l'environnement et installer les dépendances.
+1.  **Accédez au répertoire du projet :**
+    ```bash
+    cd edb-noumea
+    ```
+2.  **Créez un environnement virtuel avec `uv` :**
+    ```bash
+    uv venv
+    ```
+3.  **Activez l'environnement virtuel :**
+    ```bash
+    source .venv/bin/activate
+    ```
+    *(Sur Windows, utilisez `.venv\Scripts\activate`)*
+4.  **Installez les dépendances du projet :**
+    ```bash
+    uv pip install -e .
+    ```
+    *(L'option `-e .` installe le projet en mode "éditable", ce qui vous permet de modifier le code sans avoir à le réinstaller.)*
+## Utilisation
+Ce package peut être utilisé de deux manières : soit pour obtenir un résumé de l'état des plages, soit pour obtenir les résultats détaillés des derniers prélèvements.
+### Obtenir le résumé de l'état sanitaire
+Pour obtenir le tableau de résumé simple depuis la page web principale, exécutez :
+```bash
+python -m edb_noumea.main
+```
+### Obtenir les résultats détaillés (depuis PDF)
+Pour obtenir le tableau détaillé des derniers relevés (extrait automatiquement du dernier fichier PDF disponible), exécutez :
+```bash
+python -m edb_noumea.details
+```
+## Générer des graphiques PNG des analyses détaillées
+Vous pouvez générer automatiquement deux graphiques au format PNG (niveaux d'E. coli et d'Entérocoques par point de prélèvement) à partir des derniers résultats d'analyses, grâce au script fourni.
+### Étapes
+1. Assurez-vous que l'environnement virtuel est activé et que les dépendances sont installées.
+2. Exécutez le script suivant depuis le répertoire du projet :
+```bash
+source .venv/bin/activate
+/home/adriens/Github/edb-noumea/noumea_water_quality/.venv/bin/python generer_graphique_analyses.py
+```
+Deux fichiers PNG seront générés dans le dossier courant :
+Vous pouvez ouvrir ces fichiers pour visualiser les résultats détaillés des analyses.
+## Utilisation en tant que Bibliothèque
+Vous pouvez également importer les fonctions dans vos propres scripts Python pour une intégration plus poussée.
+Installer
+### Obtenir le résumé
+```python
+# exemple_resume.py
+from edb_noumea.main import get_water_quality
+df_resume = get_water_quality()
+if df_resume is not None:
+    print("Résumé de l'état des plages :")
+    print(df_resume.to_string())
+```
+### Obtenir les résultats détaillés
+```python
+# exemple_details.py
+from edb_noumea.details import get_detailed_results
+df_details = get_detailed_results()
+if df_details is not None:
+    print("Détails des derniers relevés :")
+    print(df_details.to_string())
+```
+### Exemple de Visualisation
+Voici un exemple montrant comment récupérer les données détaillées et créer un graphique simple avec `matplotlib` pour visualiser les niveaux d'E. coli par point de prélèvement.
+```python
+# exemple_visualisation.py
+import pandas as pd
+import matplotlib.pyplot as plt
+from edb_noumea.details import get_detailed_results
+# Obtenir les données détaillées
+df = get_detailed_results()
+if df is not None and not df.empty:
+    print("Création du graphique...")
+    # S'assurer que les données sont triées pour une meilleure lisibilité
+    df_sorted = df.sort_values(by='e_coli_npp_100ml', ascending=False)
+    # Créer le graphique à barres horizontales
+    plt.figure(figsize=(12, 8))
+    plt.barh(df_sorted['point_de_prelevement'], df_sorted['e_coli_npp_100ml'], color='skyblue')
+    # Ajouter les titres et les étiquettes
+    plt.xlabel('E. coli (NPP/100ml)')
+    plt.ylabel('Point de prélèvement')
+    plt.title("Niveaux d'E. coli par Point de Prélèvement")
+    plt.gca().invert_yaxis() # Afficher le plus élevé en haut
+    plt.tight_layout() # Ajuster le layout pour que tout soit visible
+    # Sauvegarder le graphique dans un fichier
+    plt.savefig('ecoli_levels.png')
+    print("Graphique sauvegardé sous 'ecoli_levels.png'")
+    # Afficher le graphique
+    plt.show()
+else:
+    print("Aucune donnée à afficher.")
+```
+*Assurez-vous que votre script est exécuté dans le même environnement virtuel où le package `edb-noumea` a été installé.*
+## Sortie Attendue
+### Résumé de l'état sanitaire (`main`)
+```
+📊 État sanitaire des eaux de baignade à Nouméa 📊
+                                  Plage      État sanitaire
+0          Plage de la baie des Citrons  Baignade autorisée
+1  Plage de la promenade Pierre-Vernier  Baignade autorisée
+...
+```
+### Détails des relevés (`details`)
+```
+📋 Voici les détails des derniers relevés :
+                                   Site                       Point de prélèvement        Date  Heure E. coli (NPP/100ml) Entérocoques (NPP/100ml)
+0          PLAGE DE LA BAIE DES CITRONS               P18049, Face The Beach House  04/09/2025  07:29                    10                         20
+1          PLAGE DE LA BAIE DES CITRONS   P18050, Face allée centrale Mirage plaza  04/09/2025  07:33                    62                         75
+...
+```

{edb_noumea-0.2.6 → edb_noumea-0.2.14}/edb_noumea.egg-info/requires.txt RENAMED Viewed

@@ -4,3 +4,7 @@ pandas
 lxml
 tabula-py
 matplotlib
+[dev]
+pytest
+ruff

{edb_noumea-0.2.6 → edb_noumea-0.2.14}/edb_noumea.egg-info/top_level.txt RENAMED Viewed

@@ -1,2 +1,3 @@
 dist
 edb_noumea
+examples

edb_noumea-0.2.14/pyproject.toml ADDED Viewed

@@ -0,0 +1,49 @@
+# It's best practice to specify your build system
+[build-system]
+requires = ["setuptools>=61.0"]
+build-backend = "setuptools.build_meta"
+[project]
+name = "edb-noumea"
+version = "0.2.14"
+description = "Un scraper pour la qualité des eaux de baignade à Nouméa."
+# Add your name
+authors = [
+  { name="Adrien SALES" },
+]
+# Specify the license, e.g., "MIT"
+license = { text="MIT" }
+# Link your README for PyPI
+readme = "README.md"
+# Specify supported Python versions
+# Add classifiers for better discoverability
+classifiers = [
+    "Development Status :: 4 - Beta",
+    "Programming Language :: Python :: 3",
+    "License :: OSI Approved :: MIT License",
+    "Operating System :: OS Independent",
+    "Topic :: Utilities",
+]
+dependencies = [
+    "requests",
+    "beautifulsoup4",
+    "pandas",
+    "lxml",
+    "tabula-py",
+    "matplotlib",
+]
+[tool.setuptools.packages.find]
+where = ["."]
+[project.urls]
+"Homepage" = "https://github.com/adriens/edb-noumea"
+"Repository" = "https://github.com/adriens/edb-noumea"
+# Example of optional dependencies for development
+[project.optional-dependencies]
+dev = [
+    "pytest",
+    "ruff", # A popular linter and formatter
+]

edb_noumea-0.2.6/PKG-INFO DELETED Viewed

@@ -1,12 +0,0 @@
-Metadata-Version: 2.4
-Name: edb-noumea
-Version: 0.2.6
-Summary: Un scraper pour la qualité des eaux de baignade à Nouméa.
-Project-URL: Homepage, https://github.com/adriens/edb-noumea
-Project-URL: Repository, https://github.com/adriens/edb-noumea
-Requires-Dist: requests
-Requires-Dist: beautifulsoup4
-Requires-Dist: pandas
-Requires-Dist: lxml
-Requires-Dist: tabula-py
-Requires-Dist: matplotlib

edb_noumea-0.2.6/edb_noumea/details.py DELETED Viewed

@@ -1,113 +0,0 @@
-def get_pdf_url():
-    """
-    Alias public pour obtenir l'URL du dernier PDF d'analyses détaillées.
-    """
-    return get_latest_pdf_url()
-import pandas as pd
-import tabula
-import requests
-import io
-from bs4 import BeautifulSoup
-# URL de la page officielle contenant le lien vers le PDF
-PAGE_URL = "https://www.noumea.nc/noumea-pratique/salubrite-publique/qualite-eaux-baignade"
-def get_latest_pdf_url():
-    """
-    Récupère dynamiquement l'URL du dernier PDF d'analyses détaillées depuis la page officielle.
-    """
-    print(f"🔗 Recherche du lien PDF sur {PAGE_URL} ...")
-    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
-    try:
-        resp = requests.get(PAGE_URL, headers=headers)
-        resp.raise_for_status()
-    except Exception as e:
-        print(f"❌ Impossible de récupérer la page officielle : {e}")
-        return None
-    soup = BeautifulSoup(resp.text, "lxml")
-    # Chercher le premier lien PDF dans la page
-    link = soup.find("a", href=lambda h: h and h.endswith(".pdf"))
-    if not link:
-        print("❌ Aucun lien PDF trouvé sur la page.")
-        return None
-    pdf_url = link["href"]
-    # Si le lien est relatif, le rendre absolu
-    if pdf_url.startswith("/"):
-        pdf_url = "https://www.noumea.nc" + pdf_url
-    print(f"✅ Lien PDF trouvé : {pdf_url}")
-    return pdf_url
-def get_detailed_results():
-    """
-    Télécharge dynamiquement le PDF des résultats détaillés, en extrait le premier tableau
-    et le retourne sous forme de DataFrame pandas.
-    """
-    pdf_url = get_latest_pdf_url()
-    if not pdf_url:
-        return None
-    print(f"📥 Téléchargement du PDF depuis {pdf_url} ...")
-    try:
-        headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
-        response = requests.get(pdf_url, headers=headers)
-        response.raise_for_status()
-        print("✅ Téléchargement terminé.")
-    except requests.exceptions.RequestException as e:
-        print(f"❌ Erreur lors du téléchargement du fichier PDF : {e}")
-        return None
-    pdf_file = io.BytesIO(response.content)
-    try:
-        print("🔍 Extraction des tableaux du PDF...")
-        tables = tabula.read_pdf(pdf_file, pages='1', stream=True)
-    except Exception as e:
-        print(f"❌ Une erreur est survenue lors de l'extraction des données du PDF.")
-        print("ℹ️  Cela peut être dû à l'absence de Java sur votre système, qui est requis par la bibliothèque 'tabula-py'.")
-        print(f"   Erreur originale : {e}")
-        return None
-    if not tables:
-        print("❌ Aucun tableau n'a été trouvé dans le PDF.")
-        return None
-    print(f"✅ {len(tables)} tableau(x) trouvé(s). Affichage du premier.")
-    df = tables[0]
-    # --- Nettoyage du DataFrame ---
-    columns_to_keep = {
-        df.columns[0]: "site",
-        df.columns[1]: "point_de_prelevement",
-        df.columns[2]: "date",
-        df.columns[4]: "heure",
-        df.columns[6]: "e_coli_npp_100ml",
-        df.columns[9]: "enterocoques_npp_100ml"
-    }
-    cleaned_df = df[columns_to_keep.keys()].copy()
-    cleaned_df.rename(columns=columns_to_keep, inplace=True)
-    cleaned_df.replace({'<10': 0}, inplace=True)
-    cleaned_df['e_coli_npp_100ml'] = pd.to_numeric(cleaned_df['e_coli_npp_100ml'], errors='coerce')
-    cleaned_df['enterocoques_npp_100ml'] = pd.to_numeric(cleaned_df['enterocoques_npp_100ml'], errors='coerce')
-    cleaned_df.fillna(0, inplace=True)
-    # Split de la colonne point_de_prelevement
-    split_points = cleaned_df['point_de_prelevement'].str.split(',', n=1, expand=True)
-    cleaned_df['id_point_prelevement'] = split_points[0].str.strip()
-    cleaned_df['desc_point_prelevement'] = split_points[1].str.strip() if split_points.shape[1] > 1 else ''
-    # Conversion explicite de la colonne 'date' en type date Python
-    cleaned_df['date'] = pd.to_datetime(cleaned_df['date'], format='%d/%m/%Y', errors='coerce').dt.date
-    return cleaned_df
-if __name__ == "__main__":
-    # Obtenir le DataFrame des résultats détaillés
-    detailed_df = get_detailed_results()
-    # Afficher le DataFrame s'il a été créé avec succès
-    if detailed_df is not None:
-        print("\n📋 Voici les détails des derniers relevés (toutes colonnes) :")
-        print(detailed_df)
-        print("\nColonnes du DataFrame :")
-        print(list(detailed_df.columns))

edb_noumea-0.2.6/edb_noumea.egg-info/PKG-INFO DELETED Viewed

@@ -1,12 +0,0 @@
-Metadata-Version: 2.4
-Name: edb-noumea
-Version: 0.2.6
-Summary: Un scraper pour la qualité des eaux de baignade à Nouméa.
-Project-URL: Homepage, https://github.com/adriens/edb-noumea
-Project-URL: Repository, https://github.com/adriens/edb-noumea
-Requires-Dist: requests
-Requires-Dist: beautifulsoup4
-Requires-Dist: pandas
-Requires-Dist: lxml
-Requires-Dist: tabula-py
-Requires-Dist: matplotlib

edb_noumea-0.2.6/pyproject.toml DELETED Viewed

@@ -1,19 +0,0 @@
-[project]
-name = "edb-noumea"
-version = "0.2.6"
-description = "Un scraper pour la qualité des eaux de baignade à Nouméa."
-dependencies = [
-    "requests",
-    "beautifulsoup4",
-    "pandas",
-    "lxml",
-    "tabula-py",
-    "matplotlib",
-]
-[tool.setuptools.packages.find]
-where = ["."]
-[project.urls]
-"Homepage" = "https://github.com/adriens/edb-noumea"
-"Repository" = "https://github.com/adriens/edb-noumea"

{edb_noumea-0.2.6 → edb_noumea-0.2.14}/edb_noumea/__init__.py RENAMED Viewed

File without changes

{edb_noumea-0.2.6 → edb_noumea-0.2.14}/edb_noumea/main.py RENAMED Viewed

File without changes

{edb_noumea-0.2.6 → edb_noumea-0.2.14}/edb_noumea.egg-info/SOURCES.txt RENAMED Viewed

File without changes

{edb_noumea-0.2.6 → edb_noumea-0.2.14}/edb_noumea.egg-info/dependency_links.txt RENAMED Viewed

File without changes

{edb_noumea-0.2.6 → edb_noumea-0.2.14}/setup.cfg RENAMED Viewed

File without changes

edb-noumea 0.2.6__tar.gz → 0.2.14__tar.gz

edb-noumea 0.2.6tar.gz → 0.2.14tar.gz