npm - @tricoteuses/senat - Versions diffs - 2.10.5 → 2.11.1 - Mend

@tricoteuses/senat 2.10.5 → 2.11.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (54) hide show

package/lib/databases.d.ts +1 -28
package/lib/databases.js +0 -6
package/lib/datasets.d.ts +6 -0
package/lib/datasets.js +233 -0
package/lib/loaders.d.ts +5 -0
package/lib/loaders.js +14 -9
package/lib/model/ameli.d.ts +31 -143
package/lib/model/ameli.js +102 -95
package/lib/model/commission.d.ts +5 -0
package/lib/model/commission.js +263 -0
package/lib/model/debats.d.ts +13 -51
package/lib/model/documents.d.ts +2 -0
package/lib/model/documents.js +37 -0
package/lib/model/dosleg.d.ts +9 -104
package/lib/model/dosleg.js +76 -108
package/lib/model/index.d.ts +4 -2
package/lib/model/index.js +4 -2
package/lib/model/questions.d.ts +10 -458
package/lib/model/scrutins.d.ts +3 -0
package/lib/model/scrutins.js +74 -0
package/lib/model/{compte_rendu.js → seance.js} +47 -28
package/lib/model/sens.d.ts +28 -1002
package/lib/model/sens.js +65 -33
package/lib/model/util.d.ts +1 -0
package/lib/model/util.js +19 -1
package/lib/raw_types/ameli.d.ts +778 -1521
package/lib/raw_types/ameli.js +5 -345
package/lib/raw_types/debats.d.ts +163 -306
package/lib/raw_types/debats.js +5 -84
package/lib/raw_types/dosleg.d.ts +1349 -2293
package/lib/raw_types/dosleg.js +5 -550
package/lib/raw_types/questions.d.ts +374 -519
package/lib/raw_types/questions.js +5 -84
package/lib/raw_types/senat.d.ts +11389 -0
package/lib/raw_types/senat.js +5 -0
package/lib/raw_types/sens.d.ts +6729 -12571
package/lib/raw_types/sens.js +5 -2944
package/lib/raw_types_schemats/ameli.d.ts +2 -2
package/lib/raw_types_schemats/debats.d.ts +2 -2
package/lib/raw_types_schemats/dosleg.d.ts +2 -2
package/lib/raw_types_schemats/questions.d.ts +2 -2
package/lib/raw_types_schemats/sens.d.ts +2 -2
package/lib/scripts/convert_data.js +37 -31
package/lib/scripts/retrieve_cr_commission.d.ts +1 -0
package/lib/scripts/retrieve_cr_commission.js +291 -0
package/lib/scripts/{retrieve_comptes_rendus.js → retrieve_cr_seance.js} +1 -1
package/lib/scripts/retrieve_open_data.js +35 -1
package/lib/utils/cr_spliting.d.ts +22 -1
package/lib/utils/cr_spliting.js +273 -12
package/lib/utils/reunion_grouping.d.ts +3 -0
package/lib/utils/reunion_grouping.js +1 -1
package/package.json +12 -11
/package/lib/model/{compte_rendu.d.ts → seance.d.ts} +0 -0
/package/lib/scripts/{retrieve_comptes_rendus.d.ts → retrieve_cr_seance.d.ts} +0 -0

package/lib/model/{compte_rendu.js → seance.js} RENAMED Viewed

@@ -2,9 +2,9 @@ import fs from "fs";
 import * as cheerio from "cheerio";
 import path from "path";
 import { computeIntervalsBySlot } from "../utils/cr_spliting";
-import { norm } from "./util";
-const asArray = (x) => x == null ? [] : Array.isArray(x) ? x : [x];
-const toInt = (s) => Number.isFinite(Number(s)) ? Number(s) : Number.POSITIVE_INFINITY;
+import { norm, toCRDate } from "./util";
+const asArray = (x) => (x == null ? [] : Array.isArray(x) ? x : [x]);
+const toInt = (s) => (Number.isFinite(Number(s)) ? Number(s) : Number.POSITIVE_INFINITY);
 export async function parseCompteRenduSlotFromFile(xmlFilePath, wantedSlot, firstSlotOfDay) {
     try {
         const raw = fs.readFileSync(xmlFilePath, "utf8");
@@ -13,7 +13,7 @@ export async function parseCompteRenduSlotFromFile(xmlFilePath, wantedSlot, firs
         const order = $("body *").toArray();
         const idx = new Map(order.map((el, i) => [el, i]));
         const intervalsAll = computeIntervalsBySlot($, idx, firstSlotOfDay);
-        const intervals = intervalsAll.filter(iv => iv.slot === wantedSlot);
+        const intervals = intervalsAll.filter((iv) => iv.slot === wantedSlot);
         if (intervals.length === 0) {
             console.warn(`[CRI] no intervals for ${path.basename(xmlFilePath)} [${wantedSlot}]`);
             return null;
@@ -35,7 +35,8 @@ export async function parseCompteRenduSlotFromFile(xmlFilePath, wantedSlot, firs
             if (!elementInAnyInterval(block, idx, intervals))
                 return;
             const $block = $(block);
-            $block.find([
+            $block
+                .find([
                 "p[class^='titre_S']",
                 "p.mention_titre",
                 "p.intitule_titre",
@@ -45,7 +46,8 @@ export async function parseCompteRenduSlotFromFile(xmlFilePath, wantedSlot, firs
                 "p.intitule_article",
                 "p.mention_section",
                 "p.intitule_section",
-            ].join(",")).remove();
+            ].join(","))
+                .remove();
             const firstP = $block.find("p").first();
             const speakerLabelRaw = firstP.find(".orateur_nom").text() || firstP.find("a.lien_senfic").text() || "";
             const speakerLabel = dedupeSpeaker(speakerLabelRaw);
@@ -98,7 +100,7 @@ export function parseYYYYMMDD(yyyymmdd) {
 }
 export function deriveTitreObjetFromSommaire(sommaire, slot) {
     const items = extractLevel1Items(sommaire);
-    const meaningful = items.filter(it => !isBoilerplate(it.label));
+    const meaningful = items.filter((it) => !isBoilerplate(it.label));
     if (meaningful.length === 0) {
         return {
             titre: `Séance publique ${slotLabel(slot)}`,
@@ -106,15 +108,22 @@ export function deriveTitreObjetFromSommaire(sommaire, slot) {
         };
     }
     const titre = meaningful[0].label;
-    const objet = meaningful.slice(0, 3).map(it => it.label).join(" ; ");
+    const objet = meaningful
+        .slice(0, 3)
+        .map((it) => it.label)
+        .join(" ; ");
     return { titre, objet };
 }
 function slotLabel(slot) {
     switch (slot) {
-        case "MATIN": return "du matin";
-        case "APRES-MIDI": return "de l’après-midi";
-        case "SOIR": return "du soir";
-        default: return "";
+        case "MATIN":
+            return "du matin";
+        case "APRES-MIDI":
+            return "de l’après-midi";
+        case "SOIR":
+            return "du soir";
+        default:
+            return "";
     }
 }
 const BOILERPLATE_PATTERNS = [
@@ -132,18 +141,20 @@ const BOILERPLATE_PATTERNS = [
     /ouverture de la séance/i,
     /clo(?:t|̂)ure de la séance/i,
 ];
-const isBoilerplate = (label) => !label?.trim() || BOILERPLATE_PATTERNS.some(rx => rx.test(label));
+const isBoilerplate = (label) => !label?.trim() || BOILERPLATE_PATTERNS.some((rx) => rx.test(label));
 function extractLevel1Items(sommaire) {
     const level1 = asArray(sommaire?.sommaire1);
     return level1
-        .map(el => ({
+        .map((el) => ({
         numero: toInt(el?.valeur_pts_odj),
         label: String(el?.titreStruct?.intitule ?? "").trim(),
     }))
-        .filter(it => !!it.label)
+        .filter((it) => !!it.label)
         .sort((a, b) => a.numero - b.numero);
 }
-function stripTrailingPunct(s) { return s.replace(/\s*([:,.;])\s*$/u, "").trim(); }
+function stripTrailingPunct(s) {
+    return s.replace(/\s*([:,.;])\s*$/u, "").trim();
+}
 function dedupeSpeaker(raw) {
     let s = norm(raw);
     s = stripTrailingPunct(s);
@@ -158,7 +169,8 @@ function dedupeSpeaker(raw) {
     return s.replace(/\.\s*$/, "");
 }
 function decodeHtmlEntities(s) {
-    return s.replace(/&#(\d+);/g, (_, d) => String.fromCharCode(parseInt(d, 10)))
+    return s
+        .replace(/&#(\d+);/g, (_, d) => String.fromCharCode(parseInt(d, 10)))
         .replace(/&#x([0-9a-fA-F]+);/g, (_, h) => String.fromCharCode(parseInt(h, 16)));
 }
 function fixApostrophes(s) {
@@ -169,7 +181,9 @@ function fixApostrophes(s) {
     out = out.replace(/\s+([,;:.!?])/g, "$1");
     return out;
 }
-function normalizeTitle(text) { return text.replace(/^PR[ÉE]SIDENCE DE\b/i, "Présidence de "); }
+function normalizeTitle(text) {
+    return text.replace(/^PR[ÉE]SIDENCE DE\b/i, "Présidence de ");
+}
 function roleForSpeaker(labelOrQualite) {
     const s = (labelOrQualite || "").toLowerCase();
     if (/^(m\.|mme)?\s*(le|la)\s+pr[ée]sident(e)?\b/.test(s) || /\bpr[ée]sident[e]?\s+de\s+séance\b/.test(s))
@@ -177,7 +191,7 @@ function roleForSpeaker(labelOrQualite) {
     return "";
 }
 function readIntervenantMeta($block) {
-    const int = $block.find('cri\\:intervenant').first();
+    const int = $block.find("cri\\:intervenant").first();
     if (int.length)
         return { mat: int.attr("mat") || undefined, nom: int.attr("nom") || undefined, qua: int.attr("qua") || undefined };
     const html = $block.html() || "";
@@ -220,6 +234,7 @@ function extractAndRemoveLeadingQualite($, $block) {
         else if (node.type === "text") {
             const t = norm(node.data || "");
             if (!t || /^[:.,;–—-]+$/.test(t)) {
+                ;
                 node.data = "";
                 return;
             }
@@ -230,11 +245,11 @@ function extractAndRemoveLeadingQualite($, $block) {
 }
 function sanitizeInterventionHtml($, $block) {
     const $clone = $block.clone();
-    $clone.find('a[name]').remove();
+    $clone.find("a[name]").remove();
     $clone.find('div[align="right"]').remove();
-    $clone.find('a.link').remove();
-    $clone.find('img').remove();
-    $clone.find('a#ameli_amendement_cri_phrase, a#ameli_amendement_cra_contenu, a#ameli_amendement_cra_objet').remove();
+    $clone.find("a.link").remove();
+    $clone.find("img").remove();
+    $clone.find("a#ameli_amendement_cri_phrase, a#ameli_amendement_cra_contenu, a#ameli_amendement_cra_objet").remove();
     $clone.find(".orateur_nom, .orateur_qualite").remove();
     let html = $clone.html() || "";
     html = html.replace(/<!--[\s\S]*?-->/g, "");
@@ -244,11 +259,14 @@ function extractSommaireForIntervals($, idx, intervals) {
     const inIv = (el) => elementInAnyInterval(el, idx, intervals);
     const root = $("body");
     const sommaire = { presidentSeance: { _: "" }, sommaire1: [] };
-    // (1) Présidence (tm2) — première ligne dans l’intervalle
-    const pres = root.find("p.tm2").filter((_, el) => inIv(el)).first();
+    // (1) Présidence (tm2) — première ligne dans l’intervalle
+    const pres = root
+        .find("p.tm2")
+        .filter((_, el) => inIv(el))
+        .first();
     if (pres.length)
         sommaire.presidentSeance = { _: norm(pres.text()) };
-    // (2) Paras tm5 présents dans l’intervalle
+    // (2) Paras tm5 présents dans l’intervalle
     const paras = [];
     root.find("p.tm5").each((_, el) => {
         if (!inIv(el))
@@ -259,7 +277,7 @@ function extractSommaireForIntervals($, idx, intervals) {
     });
     if (paras.length)
         sommaire.para = paras.length === 1 ? paras[0] : paras;
-    // (3) Items de 1er niveau (tm3) présents dans l’intervalle
+    // (3) Items de 1er niveau (tm3) présents dans l’intervalle
     const items = [];
     root.find("p.tm3").each((_, el) => {
         if (!inIv(el))
@@ -297,6 +315,7 @@ function extractMetadonnees($, filePath) {
         if (m)
             dateSeance = `${m[1]}-${m[2]}-${m[3]}`;
     }
+    dateSeance = toCRDate(dateSeance, null);
     return {
         dateSeance,
         dateSeanceJour: dateSeance,
@@ -311,7 +330,7 @@ function extractMetadonnees($, filePath) {
         diffusion: "",
         version: "1.0",
         environnement: "",
-        heureGeneration: new Date()
+        heureGeneration: new Date(),
     };
 }
 function elementInAnyInterval(el, idx, intervals) {