PyPI - meta-edc - Versions diffs - 1.1.0__py3-none-any.whl → 1.1.2__py3-none-any.whl - Mend

meta-edc 1.1.0py3-none-any.whl → 1.1.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

meta_analytics/notebooks/monitoring_report.ipynb CHANGED Viewed

@@ -10,6 +10,7 @@
     "%%capture\n",
     "import os\n",
     "from pathlib import Path\n",
+    "\n",
     "import pandas as pd\n",
     "from dj_notebook import activate\n",
     "import numpy as np\n",
@@ -47,8 +48,8 @@
     "from meta_consent.models import SubjectConsentV1Ext\n",
     "from meta_analytics.dataframes import get_glucose_df, get_screening_df\n",
     "\n",
-    "from edc_appointment.constants import SCHEDULED_APPT, UNSCHEDULED_APPT # noqa\n",
-    "from edc_constants.constants import YES # noqa"
+    "from edc_appointment.constants import SCHEDULED_APPT, UNSCHEDULED_APPT  # noqa\n",
+    "from edc_constants.constants import YES  # noqa"
    ]
   },
   {
@@ -59,9 +60,9 @@
    "outputs": [],
    "source": [
     "html_data = []\n",
-    "data_download_date= date(2025,6, 17)\n",
-    "cutoff_date = date(2025,6, 17)\n",
-    "end_of_trial_date= date(2026,7, 1)\n",
+    "data_download_date = date(2025, 6, 30)\n",
+    "cutoff_date = date(2025, 6, 30)\n",
+    "end_of_trial_date = date(2026, 7, 1)\n",
     "document_title = f\"<h2>Monitoring Report: {cutoff_date.strftime('%B %Y')}</h2><h5>Data Download: {data_download_date.strftime('%d %B %Y')}</h5>\"\n",
     "study_title = 'META3 - Metformin treatment for diabetes prevention in Africa'\n",
     "pdf_filename = f\"monitoring_report_{cutoff_date.strftime('%Y%m%d')}.pdf\"\n"
@@ -77,8 +78,12 @@
     "# 105-30-0288-5 should also be late excluded based on the haemoglobin 4.8 presented at baseline\n",
     "\n",
     "df_visit = get_subject_visit(\"meta_subject.subjectvisit\")\n",
-    "late_exlusion_offstudy_reasons = ['Patient fulfilled late exclusion criteria (due to abnormal blood values or raised blood pressure at enrolment']\n",
+    "df_visit_1691 = df_visit.copy()\n",
+    "\n",
+    "late_exlusion_offstudy_reasons = [\n",
+    "    'Patient fulfilled late exclusion criteria (due to abnormal blood values or raised blood pressure at enrolment']\n",
     "df_eos = get_eos_df()\n",
+    "df_eos_1691 = df_eos.copy()\n",
     "df_eos_excluded = (\n",
     "    df_eos\n",
     "    .query(\"offstudy_reason.isin(@late_exlusion_offstudy_reasons)\")\n",
@@ -87,23 +92,25 @@
     ")\n",
     "df_visit = (\n",
     "    df_visit\n",
-    "    .merge(df_eos_excluded[[\"subject_identifier\", \"offstudy_datetime\", \"offstudy_reason\"]], on=\"subject_identifier\", how=\"left\", indicator=True)\n",
+    "    .merge(df_eos_excluded[[\"subject_identifier\", \"offstudy_datetime\", \"offstudy_reason\"]], on=\"subject_identifier\",\n",
+    "           how=\"left\", indicator=True)\n",
     "    .query(\"_merge=='left_only'\")\n",
     "    .drop(columns=[\"_merge\"])\n",
     ")\n",
     "\n",
-    "df_visit = df_visit[df_visit.appt_datetime.dt.date<=cutoff_date]\n",
+    "df_visit = df_visit[df_visit.appt_datetime.dt.date <= cutoff_date]\n",
     "\n",
     "df_appointments = get_appointment_df()\n",
     "df_appointments[\"site_id\"] = df_appointments.site_id.astype(str)\n",
+    "df_appointments_1691 = df_appointments.copy()\n",
     "df_appointments = (\n",
     "    df_appointments\n",
-    "    .merge(df_eos_excluded[[\"subject_identifier\", \"offstudy_datetime\", \"offstudy_reason\"]], on=\"subject_identifier\", how=\"left\", indicator=True)\n",
+    "    .merge(df_eos_excluded[[\"subject_identifier\", \"offstudy_datetime\", \"offstudy_reason\"]], on=\"subject_identifier\",\n",
+    "           how=\"left\", indicator=True)\n",
     "    .query(\"_merge=='left_only'\")\n",
     "    .drop(columns=[\"_merge\"])\n",
     ")\n",
     "\n",
-    "\n",
     "cls = GlucoseEndpointsByDate()\n",
     "cls.run()\n",
     "df_endpoint = cls.endpoint_only_df.copy()\n",
@@ -121,8 +128,8 @@
     "    .reset_index()\n",
     "    .pivot_table(columns=\"site_id\", values=0, observed=True)\n",
     ")\n",
-    "enrolled_pivot.columns.name=\"\"\n",
-    "enrolled_pivot[\"total\"] = enrolled_pivot[[\"10\", \"20\",\"30\",\"40\",\"60\"]].sum(axis=1)"
+    "enrolled_pivot.columns.name = \"\"\n",
+    "enrolled_pivot[\"total\"] = enrolled_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\"]].sum(axis=1)"
    ]
   },
   {
@@ -132,12 +139,23 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "# df_eos.query(\"offstudy_reason.isin(@late_exlusion_offstudy_reasons)\")[[\"subject_identifier\", \"offstudy_datetime\", \"offstudy_reason\"]].to_stata(\n",
-    "#         path=analysis_folder / \"late_exclusions.dta\",\n",
-    "#         variable_labels={},\n",
-    "#         version=118,\n",
-    "#         write_index=False,\n",
-    "#     )"
+    "# before late exclusion\n",
+    "df_visit_orig = df_visit_1691[df_visit_1691.appt_datetime.dt.date <= cutoff_date]\n",
+    "enrolled_1691 = df_visit_1691.copy()\n",
+    "enrolled_1691[\"site_id\"] = enrolled_1691[\"site_id\"].astype(str)\n",
+    "enrolled_1691_pivot = (\n",
+    "    enrolled_1691\n",
+    "    .query(\"visit_code==1000.0\").groupby([\"site_id\"])\n",
+    "    .size()\n",
+    "    .reset_index()\n",
+    "    .pivot_table(columns=\"site_id\", values=0, observed=True)\n",
+    ")\n",
+    "enrolled_1691_pivot.columns.name = \"\"\n",
+    "enrolled_1691_pivot[\"total\"] = enrolled_1691_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\"]].sum(axis=1)\n",
+    "\n",
+    "# df_eos_1691\n",
+    "# df_appointments_1691\n",
+    "\n"
    ]
   },
   {
@@ -147,8 +165,10 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "column_headers = {\"label\": \"Label\", \"visit_code\": \"Visit code\", \"10\": \"Hindu Mandal\", \"20\": \"Amana\", \"30\": \"Temeke\", \"40\": \"Mwananyamala\", \"60\": \"Mnazi Moja\", \"total\": \"Total\"}\n",
-    "column_headers_with_str = {\"label\": \"Label\", \"10_str\": \"Hindu Mandal\", \"20_str\": \"Amana\", \"30_str\": \"Temeke\", \"40_str\": \"Mwananyamala\", \"60_str\": \"Mnazi Moja\", \"total_str\": \"Total\"}"
+    "column_headers = {\"label\": \"Label\", \"visit_code\": \"Visit code\", \"10\": \"Hindu Mandal\", \"20\": \"Amana\", \"30\": \"Temeke\",\n",
+    "                  \"40\": \"Mwananyamala\", \"60\": \"Mnazi Moja\", \"total\": \"Total\"}\n",
+    "column_headers_with_str = {\"label\": \"Label\", \"10_str\": \"Hindu Mandal\", \"20_str\": \"Amana\", \"30_str\": \"Temeke\",\n",
+    "                           \"40_str\": \"Mwananyamala\", \"60_str\": \"Mnazi Moja\", \"total_str\": \"Total\"}"
    ]
   },
   {
@@ -160,7 +180,9 @@
    "source": [
     "# Table 1a Visits completed to date\n",
     "\n",
-    "df_tbl1 = df_visit[(df_visit.visit_code_sequence==0) & (df_visit.appt_timing==ONTIME_APPT) & ~(df_visit.appt_status.isin([NEW_APPT, CANCELLED_APPT]))].groupby(by=[\"visit_code\", \"site_id\"]).size().to_frame().reset_index()\n",
+    "df_tbl1 = df_visit[(df_visit.visit_code_sequence == 0) & (df_visit.appt_timing == ONTIME_APPT) & ~(\n",
+    "    df_visit.appt_status.isin([NEW_APPT, CANCELLED_APPT]))].groupby(\n",
+    "    by=[\"visit_code\", \"site_id\"]).size().to_frame().reset_index()\n",
     "\n",
     "df_tbl1.columns = [\"visit_code\", \"site_id\", \"visits\"]\n",
     "df1 = df_tbl1.pivot(index=\"visit_code\", columns=\"site_id\", values=\"visits\").reset_index()\n",
@@ -185,7 +207,7 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({k:v for k, v in column_headers.items() if k!=\"label\"})\n",
+    "    .cols_label({k: v for k, v in column_headers.items() if k != \"label\"})\n",
     "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .cols_align(align=\"left\", columns=[\"visit_code\"])\n",
     "    .data_color(\n",
@@ -194,7 +216,8 @@
     "        domain=[2000, 5000],\n",
     "        na_color=\"white\"\n",
     "    )\n",
-    "    .tab_source_note(source_note=f\"Excludes visit reports submitted for participants eventually withdrawn on late exclusion criteria.\")\n",
+    "    .tab_source_note(\n",
+    "        source_note=f\"Excludes visit reports submitted for participants eventually withdrawn on late exclusion criteria.\")\n",
     ")\n",
     "html_data.append(gt.as_raw_html())\n",
     "gt.show()"
@@ -223,7 +246,7 @@
     "    .fillna(0)\n",
     ")\n",
     "\n",
-    "df_appt_pivot[\"total\"] = df_appt_pivot.iloc[:,1:].sum(axis=1)\n",
+    "df_appt_pivot[\"total\"] = df_appt_pivot.iloc[:, 1:].sum(axis=1)\n",
     "df_appt_pivot.columns.name = None\n",
     "gt = df_as_great_table(\n",
     "    df_appt_pivot,\n",
@@ -233,7 +256,7 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({k:v for k, v in column_headers.items() if k!=\"label\"})\n",
+    "    .cols_label({k: v for k, v in column_headers.items() if k != \"label\"})\n",
     "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .cols_align(align=\"left\", columns=[\"visit_code\"])\n",
     "    .data_color(\n",
@@ -256,7 +279,8 @@
    "source": [
     "# Table 1c Past scheduled appointments -- no information provided\n",
     "df_appt_pivot = (\n",
-    "    df_appointments.query(\"appt_datetime<@cutoff_date and appt_reason==@SCHEDULED_APPT and appt_timing==@ONTIME_APPT and appt_status.isin([@NEW_APPT])\")\n",
+    "    df_appointments.query(\n",
+    "        \"appt_datetime<@cutoff_date and appt_reason==@SCHEDULED_APPT and appt_timing==@ONTIME_APPT and appt_status.isin([@NEW_APPT])\")\n",
     "    .merge(df_eos_excluded[[\"subject_identifier\"]], on=\"subject_identifier\", how=\"left\", indicator=True)\n",
     "    .query(\"_merge=='left_only'\")\n",
     "    .drop(columns=[\"_merge\"])\n",
@@ -269,7 +293,7 @@
     "    .reset_index()\n",
     "    .fillna(0)\n",
     ")\n",
-    "df_appt_pivot[\"total\"] = df_appt_pivot.iloc[:,1:].sum(axis=1)\n",
+    "df_appt_pivot[\"total\"] = df_appt_pivot.iloc[:, 1:].sum(axis=1)\n",
     "df_appt_pivot.columns.name = None\n",
     "gt = df_as_great_table(\n",
     "    df_appt_pivot,\n",
@@ -278,7 +302,7 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({k:v for k, v in column_headers.items() if k!=\"label\"})\n",
+    "    .cols_label({k: v for k, v in column_headers.items() if k != \"label\"})\n",
     "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .cols_align(align=\"left\", columns=[\"visit_code\"])\n",
     "    .data_color(\n",
@@ -303,11 +327,11 @@
     "# Table 1d Unscheduled appointments\n",
     "df_appt = (\n",
     "    df_appointments.query(\"appt_reason==@UNSCHEDULED_APPT and appt_timing==@ONTIME_APPT and appt_status!=@NEW_APPT\")\n",
-    "     .merge(df_eos_excluded[[\"subject_identifier\"]], on=\"subject_identifier\", how=\"left\", indicator=True)\n",
+    "    .merge(df_eos_excluded[[\"subject_identifier\"]], on=\"subject_identifier\", how=\"left\", indicator=True)\n",
     "    .query(\"_merge=='left_only'\")\n",
     "    .drop(columns=[\"_merge\"])\n",
     "    .reset_index(drop=True)\n",
-    "   .copy()\n",
+    "    .copy()\n",
     "    .reset_index(drop=True)\n",
     ")\n",
     "df_appt['visit_code'] = df_appt['visit_code'].astype(int)\n",
@@ -325,10 +349,10 @@
     "    .reset_index()\n",
     "    .fillna(0)\n",
     ")\n",
-    "df_appt_pivot[\"total\"] = df_appt_pivot.iloc[:,1:].sum(axis=1)\n",
+    "df_appt_pivot[\"total\"] = df_appt_pivot.iloc[:, 1:].sum(axis=1)\n",
     "df_appt_pivot.columns.name = None\n",
-    "df_appt_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]] = df_appt_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]].astype('float64')\n",
-    "\n",
+    "df_appt_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]] = df_appt_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]].astype(\n",
+    "    'float64')\n",
     "\n",
     "# add totals row\n",
     "sum_row = df_appt_pivot.select_dtypes(include='float64').sum()\n",
@@ -343,7 +367,7 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({k:v for k, v in column_headers.items() if k!=\"label\"})\n",
+    "    .cols_label({k: v for k, v in column_headers.items() if k != \"label\"})\n",
     "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .cols_align(align=\"left\", columns=[\"visit_code\"])\n",
     "    .data_color(\n",
@@ -368,7 +392,8 @@
    "source": [
     "# Table 1e Future scheduled appointments\n",
     "df_appt_pivot = (\n",
-    "    df_appointments.query(\"@cutoff_date<=appt_datetime<@end_of_trial_date and appt_reason==@SCHEDULED_APPT and appt_timing==@ONTIME_APPT and appt_status.isin([@NEW_APPT])\")\n",
+    "    df_appointments.query(\n",
+    "        \"@cutoff_date<=appt_datetime<@end_of_trial_date and appt_reason==@SCHEDULED_APPT and appt_timing==@ONTIME_APPT and appt_status.isin([@NEW_APPT])\")\n",
     "    .merge(df_eos_excluded[[\"subject_identifier\"]], on=\"subject_identifier\", how=\"left\", indicator=True)\n",
     "    .query(\"_merge=='left_only'\")\n",
     "    .drop(columns=[\"_merge\"])\n",
@@ -381,7 +406,7 @@
     "    .reset_index()\n",
     "    .fillna(0)\n",
     ")\n",
-    "df_appt_pivot[\"total\"] = df_appt_pivot.iloc[:,1:].sum(axis=1)\n",
+    "df_appt_pivot[\"total\"] = df_appt_pivot.iloc[:, 1:].sum(axis=1)\n",
     "df_appt_pivot.columns.name = None\n",
     "gt = df_as_great_table(\n",
     "    df_appt_pivot,\n",
@@ -389,7 +414,7 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({k:v for k, v in column_headers.items() if k!=\"label\"})\n",
+    "    .cols_label({k: v for k, v in column_headers.items() if k != \"label\"})\n",
     "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .cols_align(align=\"left\", columns=[\"visit_code\"])\n",
     "    .data_color(\n",
@@ -399,7 +424,8 @@
     "        na_color=\"white\"\n",
     "    )\n",
     "    .fmt_number(columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"], decimals=0)\n",
-    "    .tab_source_note(source_note=f\"Scheduled appointment date is on or after {cutoff_date.strftime('%d %B %Y')} and before {end_of_trial_date.strftime('%d %B %Y')}.\")\n",
+    "    .tab_source_note(\n",
+    "        source_note=f\"Scheduled appointment date is on or after {cutoff_date.strftime('%d %B %Y')} and before {end_of_trial_date.strftime('%d %B %Y')}.\")\n",
     ")\n",
     "html_data.append(gt.as_raw_html())\n",
     "gt.show()"
@@ -422,7 +448,8 @@
     "    .query(\"visit_code_sequence==0 and appt_timing==@MISSED_APPT and ~appt_status.isin([@NEW_APPT, @CANCELLED_APPT])\")\n",
     ").subject_identifier.nunique()\n",
     "df_tbl = (\n",
-    "    df_visit[(df_visit.visit_code_sequence==0) & (df_visit.appt_timing==MISSED_APPT) & ~(df_visit.appt_status.isin([NEW_APPT, CANCELLED_APPT]))]\n",
+    "    df_visit[(df_visit.visit_code_sequence == 0) & (df_visit.appt_timing == MISSED_APPT) & ~(\n",
+    "        df_visit.appt_status.isin([NEW_APPT, CANCELLED_APPT]))]\n",
     "    .merge(df_eos_excluded[[\"subject_identifier\"]], on=\"subject_identifier\", how=\"left\", indicator=True)\n",
     "    .query(\"_merge=='left_only'\")\n",
     "    .drop(columns=[\"_merge\"])\n",
@@ -458,7 +485,7 @@
     "    .set_index([\"visit_code\"])\n",
     ")\n",
     "\n",
-    "attended_and_missed_perc = df_missed/attended_and_missed\n",
+    "attended_and_missed_perc = df_missed / attended_and_missed\n",
     "attended_and_missed_perc = (\n",
     "    attended_and_missed_perc\n",
     "    .fillna(0)\n",
@@ -467,9 +494,9 @@
     ")\n",
     "\n",
     "df_result = df_missed.merge(attended_and_missed_perc, on=[\"visit_code\"], suffixes=(\"\", \"_perc\"))\n",
-    "for col in  [\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]:\n",
+    "for col in [\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]:\n",
     "    col_perc = f\"{col}_perc\"\n",
-    "    df_result[col] = df_result.apply(lambda x: f\"{x[col]} ({x[col_perc]*100:.2f})\", axis=1)\n",
+    "    df_result[col] = df_result.apply(lambda x: f\"{x[col]} ({x[col_perc] * 100:.2f})\", axis=1)\n",
     "df_result = df_result.reset_index().sort_values(by=[\"visit_code\"], ascending=True)\n",
     "df_result = df_result.fillna(0.0)"
    ]
@@ -489,7 +516,7 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({k:v for k, v in column_headers.items() if k!=\"label\"})\n",
+    "    .cols_label({k: v for k, v in column_headers.items() if k != \"label\"})\n",
     "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .cols_align(align=\"left\", columns=[\"visit_code\", \"label\"])\n",
     "    .tab_style(\n",
@@ -523,7 +550,8 @@
     "    .query(\"visit_code_sequence==0 and appt_timing==@MISSED_APPT and ~appt_status.isin([@NEW_APPT, @CANCELLED_APPT])\")\n",
     ").subject_identifier.nunique()\n",
     "df_tbl = (\n",
-    "    df_visit[(df_visit.visit_code_sequence==0) & (df_visit.appt_timing==MISSED_APPT) & ~(df_visit.appt_status.isin([NEW_APPT, CANCELLED_APPT]))]\n",
+    "    df_visit[(df_visit.visit_code_sequence == 0) & (df_visit.appt_timing == MISSED_APPT) & ~(\n",
+    "        df_visit.appt_status.isin([NEW_APPT, CANCELLED_APPT]))]\n",
     "    .merge(df_eos_excluded[[\"subject_identifier\"]], on=\"subject_identifier\", how=\"left\", indicator=True)\n",
     "    .query(\"_merge=='left_only'\")\n",
     "    .drop(columns=[\"_merge\"])\n",
@@ -534,15 +562,16 @@
     "    .reset_index()\n",
     ")\n",
     "df_tbl.columns = [\"subject_identifier\", \"site_id\", \"missed_count\"]\n",
-    "df_tbl[\"category\"] = pd.cut(df_tbl[\"missed_count\"], bins=[0, 1, 3, 5, 7, 100], labels=[\"Missed at least 1\", \"2 to 3\", \"4 to 5\", \"6 to 7\", \"missed more than 7\"])\n",
-    "df_tbl_pivot = df_tbl.pivot_table(index=\"category\", columns=\"site_id\", values=\"missed_count\", observed=False, aggfunc=\"count\").reset_index()\n",
+    "df_tbl[\"category\"] = pd.cut(df_tbl[\"missed_count\"], bins=[0, 1, 3, 5, 7, 100],\n",
+    "                            labels=[\"Missed at least 1\", \"2 to 3\", \"4 to 5\", \"6 to 7\", \"missed more than 7\"])\n",
+    "df_tbl_pivot = df_tbl.pivot_table(index=\"category\", columns=\"site_id\", values=\"missed_count\", observed=False,\n",
+    "                                  aggfunc=\"count\").reset_index()\n",
     "\n",
     "df_tbl_pivot['total'] = df_tbl_pivot.select_dtypes(include='int').sum(axis=1, skipna=True)\n",
     "\n",
     "sum_row = df_tbl_pivot.select_dtypes(include='int64').sum()\n",
     "sum_row['category'] = 'Total'\n",
     "\n",
-    "\n",
     "df_tbl_pivot = (\n",
     "    pd.concat([df_tbl_pivot, sum_row.to_frame().T], axis=0)\n",
     "    .rename(columns={10: \"10\", 20: \"20\", 30: \"30\", 40: \"40\", 60: \"60\"})\n",
@@ -554,7 +583,8 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({\"category\": \"Category\", **{k:v for k, v in column_headers.items() if k not in [\"visit_code\", \"label\"]}})\n",
+    "    .cols_label(\n",
+    "        {\"category\": \"Category\", **{k: v for k, v in column_headers.items() if k not in [\"visit_code\", \"label\"]}})\n",
     "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .cols_align(align=\"left\", columns=[\"category\"])\n",
     "    .tab_style(\n",
@@ -578,7 +608,7 @@
    "outputs": [],
    "source": [
     "# func for tables 3,4,5\n",
-    "def get_row_df(row_df:pd.DataFrame, label:str=None, **kwargs)->pd.DataFrame:\n",
+    "def get_row_df(row_df: pd.DataFrame, label: str = None, **kwargs) -> pd.DataFrame:\n",
     "    row_df = row_df.groupby(by=[\"site_id\"]).site_id.count().to_frame(name=\"n\")\n",
     "    row_df[\"label\"] = label\n",
     "    row_df = row_df.reset_index()\n",
@@ -593,50 +623,55 @@
     "\n",
     "\n",
     "def get_table_df(\n",
-    "        df_source:pd.DataFrame,\n",
-    "        visit_code:float|None=None,\n",
-    "        month_label:str|None=None,\n",
-    "        visit_codes:list[float]|None=None,\n",
-    "        get_row_func:Callable|None=None,\n",
-    "        category_labels:list[str]|None=None,\n",
-    ")->pd.DataFrame:\n",
+    "        df_source: pd.DataFrame,\n",
+    "        visit_code: float | None = None,\n",
+    "        month_label: str | None = None,\n",
+    "        visit_codes: list[float] | None = None,\n",
+    "        get_row_func: Callable | None = None,\n",
+    "        category_labels: list[str] | None = None,\n",
+    ") -> pd.DataFrame:\n",
     "    get_row_df_func = get_row_func or get_row_df\n",
     "    if visit_code:\n",
-    "        df_month = df_source[df_source.visit_code==visit_code].copy()\n",
+    "        df_month = df_source[df_source.visit_code == visit_code].copy()\n",
     "    elif visit_codes:\n",
     "        df_month = df_source[df_source.visit_code.isin(visit_codes)].copy()\n",
     "    elif month_label:\n",
     "        df_month = df_source.copy()\n",
     "\n",
-    "    \n",
     "    row_df = df_month.copy()\n",
     "    table_df = get_row_df_func(row_df, \"Total (n)\", category_labels=category_labels)\n",
-    "    \n",
+    "\n",
     "    row_df = df_month.query(\"ogtt_value<7.8 and fbg_value<6.1\").copy()\n",
     "    table_df = pd.concat([table_df, get_row_df_func(row_df, \"OGTT <7.8; FBG <6.1\", category_labels=category_labels)])\n",
-    "    \n",
-    "    row_df = df_month[(df_month.ogtt_value<7.8) & (df_month.fbg_value>=6.1) & (df_month.fbg_value<7.0)].copy()\n",
-    "    table_df = pd.concat([table_df, get_row_df_func(row_df, \"OGTT <7.8; FBG >=6.1 <7.0\", category_labels=category_labels)])\n",
-    "    \n",
-    "    row_df = df_month[(df_month.ogtt_value<7.8) & (df_month.fbg_value>=7.0)].copy()\n",
+    "\n",
+    "    row_df = df_month[(df_month.ogtt_value < 7.8) & (df_month.fbg_value >= 6.1) & (df_month.fbg_value < 7.0)].copy()\n",
+    "    table_df = pd.concat(\n",
+    "        [table_df, get_row_df_func(row_df, \"OGTT <7.8; FBG >=6.1 <7.0\", category_labels=category_labels)])\n",
+    "\n",
+    "    row_df = df_month[(df_month.ogtt_value < 7.8) & (df_month.fbg_value >= 7.0)].copy()\n",
     "    table_df = pd.concat([table_df, get_row_df_func(row_df, \"OGTT <7.8; FBG >=7.0\", category_labels=category_labels)])\n",
-    "    \n",
-    "    row_df = df_month[(df_month.ogtt_value>=7.8) & (df_month.ogtt_value<11.1) & (df_month.fbg_value<6.1)].copy()\n",
-    "    table_df = pd.concat([table_df, get_row_df_func(row_df, \"OGTT ≥7.8 to <11.1; FBG <6.1\", category_labels=category_labels)])\n",
-    "    \n",
-    "    row_df = df_month[(df_month.ogtt_value>=7.8) & (df_month.ogtt_value<11.1) & (df_month.fbg_value>=6.1) & (df_month.fbg_value<7.0)].copy()\n",
-    "    table_df = pd.concat([table_df, get_row_df_func(row_df, \"OGTT ≥7.8 to <11.1; FBG >=6.1 <7.0\", category_labels=category_labels)])\n",
-    "    \n",
-    "    row_df = df_month[(df_month.ogtt_value>=7.8) & (df_month.ogtt_value<11.1) & (df_month.fbg_value>=7.0)].copy()\n",
-    "    table_df = pd.concat([table_df, get_row_df_func(row_df, \"OGTT ≥7.8 to <11.1; FBG >=7.0\", category_labels=category_labels)])\n",
-    "    \n",
-    "    row_df = df_month[(df_month.ogtt_value>=11.1) & (df_month.fbg_value<6.1)].copy()\n",
+    "\n",
+    "    row_df = df_month[(df_month.ogtt_value >= 7.8) & (df_month.ogtt_value < 11.1) & (df_month.fbg_value < 6.1)].copy()\n",
+    "    table_df = pd.concat(\n",
+    "        [table_df, get_row_df_func(row_df, \"OGTT ≥7.8 to <11.1; FBG <6.1\", category_labels=category_labels)])\n",
+    "\n",
+    "    row_df = df_month[(df_month.ogtt_value >= 7.8) & (df_month.ogtt_value < 11.1) & (df_month.fbg_value >= 6.1) & (\n",
+    "            df_month.fbg_value < 7.0)].copy()\n",
+    "    table_df = pd.concat(\n",
+    "        [table_df, get_row_df_func(row_df, \"OGTT ≥7.8 to <11.1; FBG >=6.1 <7.0\", category_labels=category_labels)])\n",
+    "\n",
+    "    row_df = df_month[(df_month.ogtt_value >= 7.8) & (df_month.ogtt_value < 11.1) & (df_month.fbg_value >= 7.0)].copy()\n",
+    "    table_df = pd.concat(\n",
+    "        [table_df, get_row_df_func(row_df, \"OGTT ≥7.8 to <11.1; FBG >=7.0\", category_labels=category_labels)])\n",
+    "\n",
+    "    row_df = df_month[(df_month.ogtt_value >= 11.1) & (df_month.fbg_value < 6.1)].copy()\n",
     "    table_df = pd.concat([table_df, get_row_df_func(row_df, \"OGTT ≥11.1; FBG <6.1\", category_labels=category_labels)])\n",
-    "    \n",
-    "    row_df = df_month[(df_month.ogtt_value>=11.1) & (df_month.fbg_value>=6.1) & (df_month.fbg_value<7.0)].copy()\n",
-    "    table_df = pd.concat([table_df, get_row_df_func(row_df, \"OGTT ≥11.1; FBG >=6.1 <7.0\", category_labels=category_labels)])\n",
-    "    \n",
-    "    row_df = df_month[(df_month.ogtt_value>=11.1) & (df_month.fbg_value>=7.0)].copy()\n",
+    "\n",
+    "    row_df = df_month[(df_month.ogtt_value >= 11.1) & (df_month.fbg_value >= 6.1) & (df_month.fbg_value < 7.0)].copy()\n",
+    "    table_df = pd.concat(\n",
+    "        [table_df, get_row_df_func(row_df, \"OGTT ≥11.1; FBG >=6.1 <7.0\", category_labels=category_labels)])\n",
+    "\n",
+    "    row_df = df_month[(df_month.ogtt_value >= 11.1) & (df_month.fbg_value >= 7.0)].copy()\n",
     "    table_df = pd.concat([table_df, get_row_df_func(row_df, \"OGTT ≥11.1; FBG >=7.0\", category_labels=category_labels)])\n",
     "\n",
     "    row_df = df_month[(df_month.ogtt_value.isna())].copy()\n",
@@ -644,11 +679,11 @@
     "    return table_df\n",
     "\n",
     "\n",
-    "def format_table_df(tbl_df, add_totals:bool|None=None):\n",
+    "def format_table_df(tbl_df, add_totals: bool | None = None):\n",
     "    \"\"\"Pivot on site\"\"\"\n",
     "    add_totals = True if add_totals is None else add_totals\n",
     "    tbl_df = tbl_df.fillna(0.0)\n",
-    "    tbl_df[\"total\"] = tbl_df.iloc[:,1:].sum(axis=1)\n",
+    "    tbl_df[\"total\"] = tbl_df.iloc[:, 1:].sum(axis=1)\n",
     "    tbl_df = tbl_df.reset_index(drop=True)\n",
     "\n",
     "    if add_totals:\n",
@@ -656,7 +691,7 @@
     "        df_last.loc[\"label\"] = np.nan\n",
     "        df_last = df_last.reset_index()\n",
     "        df_last.columns = [\"label\", \"value\"]\n",
-    "        df_last = df_last.pivot_table(columns=\"label\",  values=\"value\").reset_index(drop=True)\n",
+    "        df_last = df_last.pivot_table(columns=\"label\", values=\"value\").reset_index(drop=True)\n",
     "        df_last.columns.name = \"\"\n",
     "        df_last[\"label\"] = \"Totals\"\n",
     "\n",
@@ -666,25 +701,27 @@
     "    tbl_df.columns = [\"label\", \"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]\n",
     "\n",
     "    for site in [\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]:\n",
-    "        tbl_df[f\"{site}_perc\"] = (tbl_df[site]/tbl_df.iloc[0][site]) * 100 if tbl_df.iloc[0][site]>0 else 0\n",
+    "        tbl_df[f\"{site}_perc\"] = (tbl_df[site] / tbl_df.iloc[0][site]) * 100 if tbl_df.iloc[0][site] > 0 else 0\n",
     "        tbl_df[f\"{site}_perc_str\"] = tbl_df[f\"{site}_perc\"].map('{:.1f}'.format)\n",
     "\n",
-    "\n",
     "    for site in [\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]:\n",
-    "        tbl_df[f\"{site}_str\"] = tbl_df[[f\"{site}\", f\"{site}_perc_str\"]].apply(lambda x: ' ('.join(x.astype(str)), axis=1)\n",
+    "        tbl_df[f\"{site}_str\"] = tbl_df[[f\"{site}\", f\"{site}_perc_str\"]].apply(lambda x: ' ('.join(x.astype(str)),\n",
+    "                                                                              axis=1)\n",
     "        tbl_df[f\"{site}_str\"] = tbl_df[f\"{site}_str\"] + \")\"\n",
     "\n",
     "    cols = [\"label\", *[f\"{site}_str\" for site in [\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]]]\n",
     "    tbl_df1 = tbl_df[cols]\n",
-    "    tbl_df1.loc[tbl_df.label==\"Total (n)\"] = tbl_df.iloc[0][[\"label\", \"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]].to_list()\n",
+    "    tbl_df1.loc[tbl_df.label == \"Total (n)\"] = tbl_df.iloc[0][\n",
+    "        [\"label\", \"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]].to_list()\n",
     "    return tbl_df1\n",
     "\n",
-    "def format_table_with_bmi_df(tbl_df, add_totals:bool|None=None, category_labels:list[str]=None):\n",
+    "\n",
+    "def format_table_with_bmi_df(tbl_df, add_totals: bool | None = None, category_labels: list[str] = None):\n",
     "    \"\"\"Pivot on BMI categories\"\"\"\n",
     "\n",
     "    add_totals = True if add_totals is None else add_totals\n",
     "    tbl_df = tbl_df.fillna(0.0)\n",
-    "    tbl_df[\"total\"] = tbl_df.iloc[:,1:].sum(axis=1)\n",
+    "    tbl_df[\"total\"] = tbl_df.iloc[:, 1:].sum(axis=1)\n",
     "    tbl_df = tbl_df.reset_index(drop=True)\n",
     "\n",
     "    if add_totals:\n",
@@ -692,7 +729,7 @@
     "        df_last.loc[\"label\"] = np.nan\n",
     "        df_last = df_last.reset_index()\n",
     "        df_last.columns = [\"label\", \"value\"]\n",
-    "        df_last = df_last.pivot_table(columns=\"label\",  values=\"value\").reset_index(drop=True)\n",
+    "        df_last = df_last.pivot_table(columns=\"label\", values=\"value\").reset_index(drop=True)\n",
     "        df_last.columns.name = \"\"\n",
     "        df_last[\"label\"] = \"Totals\"\n",
     "\n",
@@ -702,20 +739,21 @@
     "    tbl_df.columns = [\"label\", *category_labels, \"total\"]\n",
     "\n",
     "    for label in [*category_labels, \"total\"]:\n",
-    "        tbl_df[f\"{label}_perc\"] = (tbl_df[label]/tbl_df.iloc[0][label]) * 100 if tbl_df.iloc[0][label]>0 else 0\n",
+    "        tbl_df[f\"{label}_perc\"] = (tbl_df[label] / tbl_df.iloc[0][label]) * 100 if tbl_df.iloc[0][label] > 0 else 0\n",
     "        tbl_df[f\"{label}_perc_str\"] = tbl_df[f\"{label}_perc\"].map('{:.1f}'.format)\n",
     "\n",
     "    for cat in [*category_labels, \"total\"]:\n",
-    "        tbl_df[f\"{label}_str\"] = tbl_df[[f\"{label}\", f\"{label}_perc_str\"]].apply(lambda x: ' ('.join(x.astype(str)), axis=1)\n",
+    "        tbl_df[f\"{label}_str\"] = tbl_df[[f\"{label}\", f\"{label}_perc_str\"]].apply(lambda x: ' ('.join(x.astype(str)),\n",
+    "                                                                                 axis=1)\n",
     "        tbl_df[f\"{label}_str\"] = tbl_df[f\"{label}_str\"] + \")\"\n",
     "\n",
     "    cols = [\"label\", *[f\"{label}_str\" for label in [*category_labels, \"total\"]]]\n",
     "    tbl_df1 = tbl_df[cols]\n",
-    "    tbl_df1.loc[tbl_df.label==\"Total (n)\"] = tbl_df.iloc[0][[\"label\", *category_labels, \"total\"]].to_list()\n",
+    "    tbl_df1.loc[tbl_df.label == \"Total (n)\"] = tbl_df.iloc[0][[\"label\", *category_labels, \"total\"]].to_list()\n",
     "    return tbl_df1\n",
     "\n",
     "\n",
-    "def get_row_by_df(row_df:pd.DataFrame, label:str, category_labels:list[str])->pd.DataFrame:\n",
+    "def get_row_by_df(row_df: pd.DataFrame, label: str, category_labels: list[str]) -> pd.DataFrame:\n",
     "    # if label not in category_labels:\n",
     "    #     raise ValueError(f\"Invalid label. Expected one of {category_labels}. Got {label}.\")\n",
     "    row_df = row_df.groupby(by=[\"site_id\"]).site_id.count().to_frame(name=\"n\")\n",
@@ -743,6 +781,7 @@
     "        return r[\"converted_fbg2_value\"]\n",
     "    return r[\"converted_fbg_value\"]\n",
     "\n",
+    "\n",
     "def get_ogtt_value(r):\n",
     "    if not pd.isna(r[\"converted_ogtt2_value\"]):\n",
     "        return r[\"converted_ogtt2_value\"]\n",
@@ -770,7 +809,7 @@
     "df_table3 = df_table3.fillna(0.0)\n",
     "gt = df_as_great_table(df_table3, title=\"Table 3a: OGTT and FBG at Screening / Enrolment\")\n",
     "\n",
-    "column_headers_enrol = {k:v for k,v in column_headers_with_str.items() if k not in \"visit_code\"}\n",
+    "column_headers_enrol = {k: v for k, v in column_headers_with_str.items() if k not in \"visit_code\"}\n",
     "gt = (\n",
     "    gt\n",
     "    .cols_label(column_headers_enrol)\n",
@@ -914,7 +953,7 @@
    "outputs": [],
    "source": [
     "# Table 7: Any OGTT>11.1 ever\n",
-    "row_df = df_glucose[df_glucose.ogtt_value>=11.1].copy()\n",
+    "row_df = df_glucose[df_glucose.ogtt_value >= 11.1].copy()\n",
     "table_df = get_row_df(row_df, \"Total (n)\")\n",
     "df_table6 = format_table_df(table_df)\n",
     "df_table = df_table6[:1].fillna(0.0).copy().reset_index(drop=True)\n",
@@ -938,19 +977,19 @@
    "outputs": [],
    "source": [
     "# func for table 7\n",
-    "def get_table7_df(df_source:pd.DataFrame, visit_code:float)->pd.DataFrame:\n",
-    "    df_month = df_source[(df_source.visit_code>=visit_code) & (df_source.visit_code<=visit_code + 0.9)].copy()\n",
+    "def get_table7_df(df_source: pd.DataFrame, visit_code: float) -> pd.DataFrame:\n",
+    "    df_month = df_source[(df_source.visit_code >= visit_code) & (df_source.visit_code <= visit_code + 0.9)].copy()\n",
     "\n",
     "    row_df = df_month.copy()\n",
     "    table_df = get_row_df(row_df, \"Total (n)\")\n",
     "\n",
-    "    row_df = df_month[(df_month.fbg_value<6.1)].copy()\n",
+    "    row_df = df_month[(df_month.fbg_value < 6.1)].copy()\n",
     "    table_df = pd.concat([table_df, get_row_df(row_df, \"FBG <6.1\")])\n",
     "\n",
-    "    row_df = df_month[(df_month.fbg_value>=6.1) & (df_month.fbg_value<7.0)].copy()\n",
+    "    row_df = df_month[(df_month.fbg_value >= 6.1) & (df_month.fbg_value < 7.0)].copy()\n",
     "    table_df = pd.concat([table_df, get_row_df(row_df, \"FBG >=6.1 <7.0\")])\n",
     "\n",
-    "    row_df = df_month[(df_month.fbg_value>=7.0)].copy()\n",
+    "    row_df = df_month[(df_month.fbg_value >= 7.0)].copy()\n",
     "    table_df = pd.concat([table_df, get_row_df(row_df, \"FBG >=7.0\")])\n",
     "    return table_df"
    ]
@@ -1038,7 +1077,7 @@
     "df_endpoint_pivot.columns.name = \"\"\n",
     "df_endpoint_pivot.columns = ['label', \"10\", \"20\", \"30\", \"40\", \"60\"]\n",
     "df_endpoint_pivot.loc[len(df_endpoint_pivot)] = df_endpoint_pivot[['10', '20', '30', '40', '60']].sum().to_dict()\n",
-    "df_endpoint_pivot.at[len(df_endpoint_pivot)-1, 'label'] = 'Total'\n",
+    "df_endpoint_pivot.at[len(df_endpoint_pivot) - 1, 'label'] = 'Total'\n",
     "df_endpoint_pivot['total'] = df_endpoint_pivot[['10', '20', '30', '40', '60']].sum(axis=1)\n",
     "df_endpoint_pivot = df_endpoint_pivot.fillna(0.0)\n",
     "\n",
@@ -1048,7 +1087,7 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({k:v for k, v in column_headers.items() if k not in [\"visit_code\"]})\n",
+    "    .cols_label({k: v for k, v in column_headers.items() if k not in [\"visit_code\"]})\n",
     "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .cols_align(align=\"left\", columns=[\"label\"])\n",
     "    .cols_width(cases={\"label\": \"25%\"})\n",
@@ -1077,10 +1116,14 @@
     "from great_tables import html\n",
     "\n",
     "# Table 9b: Primary Endpoint no EOS or DM Referral\n",
-    "df_subjecthistory = read_frame(SubjectScheduleHistory.objects.filter(offschedule_model=\"meta_prn.offschedule\", offschedule_datetime__isnull=False), verbose=False).rename(columns={\"site\": \"site_id\"})\n",
+    "df_subjecthistory = read_frame(\n",
+    "    SubjectScheduleHistory.objects.filter(offschedule_model=\"meta_prn.offschedule\", offschedule_datetime__isnull=False),\n",
+    "    verbose=False).rename(columns={\"site\": \"site_id\"})\n",
     "df_subjecthistory[\"site_id\"] = df_subjecthistory[\"site_id\"].astype(str)\n",
-    "df_endpoint_no_off = df_endpoint.merge(df_subjecthistory[[\"subject_identifier\", \"offschedule_datetime\"]], on=[\"subject_identifier\"], how=\"left\")\n",
-    "df_endpoint_grp = df_endpoint_no_off.query(\"offschedule_datetime.isna()\").groupby(by=[\"site_id\", \"endpoint_label\"]).size().to_frame().reset_index()\n",
+    "df_endpoint_no_off = df_endpoint.merge(df_subjecthistory[[\"subject_identifier\", \"offschedule_datetime\"]],\n",
+    "                                       on=[\"subject_identifier\"], how=\"left\")\n",
+    "df_endpoint_grp = df_endpoint_no_off.query(\"offschedule_datetime.isna()\").groupby(\n",
+    "    by=[\"site_id\", \"endpoint_label\"]).size().to_frame().reset_index()\n",
     "df_endpoint_grp.columns = [\"site_id\", \"label\", \"endpoints\"]\n",
     "df_endpoint_pivot = df_endpoint_grp.pivot_table(index=\"label\", columns=\"site_id\", values=\"endpoints\").reset_index()\n",
     "df_endpoint_pivot.columns.name = \"\"\n",
@@ -1089,7 +1132,7 @@
     "    df_endpoint_pivot[str(col)] = np.nan\n",
     "df_endpoint_pivot.columns = ['label', \"10\", \"20\", \"30\", \"40\", \"60\"]\n",
     "df_endpoint_pivot.loc[len(df_endpoint_pivot)] = df_endpoint_pivot[['10', '20', '30', '40', '60']].sum().to_dict()\n",
-    "df_endpoint_pivot.at[len(df_endpoint_pivot)-1, 'label'] = 'Total'\n",
+    "df_endpoint_pivot.at[len(df_endpoint_pivot) - 1, 'label'] = 'Total'\n",
     "df_endpoint_pivot['total'] = df_endpoint_pivot[['10', '20', '30', '40', '60']].sum(axis=1)\n",
     "df_endpoint_pivot = df_endpoint_pivot.fillna(0.0)\n",
     "subjects = df_endpoint_no_off.query(\"offschedule_datetime.isna()\").subject_identifier.to_list()\n",
@@ -1100,7 +1143,7 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({k:v for k, v in column_headers.items() if k not in [\"visit_code\"]})\n",
+    "    .cols_label({k: v for k, v in column_headers.items() if k not in [\"visit_code\"]})\n",
     "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .cols_align(align=\"left\", columns=[\"label\"])\n",
     "    .cols_width(cases={\"label\": \"25%\"})\n",
@@ -1127,12 +1170,13 @@
    "source": [
     "# Table 10: Incident Rate per 1000 person years\n",
     "\n",
-    "def get_df_main(df_visit:pd.DataFrame, lower_days:float|None=None, upper_days:float|None=None):\n",
+    "def get_df_main(df_visit: pd.DataFrame, lower_days: float | None = None, upper_days: float | None = None):\n",
     "    if not lower_days:\n",
     "        lower_days = -1\n",
     "    cutoff_datetime = df_visit.query(\"@lower_days<followup_days<=@upper_days\").visit_datetime.max()\n",
     "    # exclude subjects for this reason\n",
-    "    offstudy_reasons = ['Patient fulfilled late exclusion criteria (due to abnormal blood values or raised blood pressure at enrolment']\n",
+    "    offstudy_reasons = [\n",
+    "        'Patient fulfilled late exclusion criteria (due to abnormal blood values or raised blood pressure at enrolment']\n",
     "\n",
     "    df_eos = get_eos_df()\n",
     "    df_eos_excluded = (\n",
@@ -1143,7 +1187,8 @@
     "    )\n",
     "    df_visit_final = (\n",
     "        df_visit.query(\"@lower_days<followup_days<=@upper_days and reason!='missed' and visit_code<2000.0\")\n",
-    "        .merge(df_eos_excluded[[\"subject_identifier\"]], on=\"subject_identifier\", how=\"left\", suffixes=(\"\", \"_y\"), indicator=True)\n",
+    "        .merge(df_eos_excluded[[\"subject_identifier\"]], on=\"subject_identifier\", how=\"left\", suffixes=(\"\", \"_y\"),\n",
+    "               indicator=True)\n",
     "        .query(\"_merge=='left_only'\")\n",
     "        .drop(columns=[\"_merge\"])\n",
     "    )\n",
@@ -1157,26 +1202,30 @@
     "    df_main = (\n",
     "        df_main\n",
     "        .merge(\n",
-    "            df_endpoint.query(\"days_to_endpoint>@lower_days\")[[\"subject_identifier\", \"endpoint_label\", \"endpoint_type\", \"days_to_endpoint\"]],\n",
+    "            df_endpoint.query(\"days_to_endpoint>@lower_days\")[\n",
+    "                [\"subject_identifier\", \"endpoint_label\", \"endpoint_type\", \"days_to_endpoint\"]],\n",
     "            how=\"left\",\n",
     "            on=[\"subject_identifier\"])\n",
     "        .reset_index(drop=True)\n",
     "    )\n",
-    "    if lower_days>=365.25:\n",
+    "    if lower_days >= 365.25:\n",
     "        df_main[\"followup_days\"] = df_main[\"followup_days\"] - lower_days\n",
-    "    df_main[\"followup_years\"] = df_main[\"followup_days\"]/365.25\n",
-    "    return df_main, len(df_main), len(df_main.query(\"@lower_days<days_to_endpoint<=@upper_days and endpoint_label.notna()\"))\n",
+    "    df_main[\"followup_years\"] = df_main[\"followup_days\"] / 365.25\n",
+    "    return df_main, len(df_main), len(\n",
+    "        df_main.query(\"@lower_days<days_to_endpoint<=@upper_days and endpoint_label.notna()\"))\n",
+    "\n",
     "\n",
     "def get_rate_and_ci(events, person_years_total):\n",
     "    lower_ci = (chi2.ppf(0.025, 2 * events) / (2 * person_years_total)) * 1000\n",
     "    upper_ci = (chi2.ppf(0.975, 2 * (events + 1)) / (2 * person_years_total)) * 1000\n",
-    "    return events/person_years_total*1000, lower_ci, upper_ci\n",
+    "    return events / person_years_total * 1000, lower_ci, upper_ci\n",
+    "\n",
     "\n",
-    "def get_incidence_data(term:str, lower_days:float, upper_days:float):\n",
+    "def get_incidence_data(term: str, lower_days: float, upper_days: float):\n",
     "    data = {}\n",
     "    df_main, subjects, events = get_df_main(df_visit, lower_days=lower_days, upper_days=upper_days)\n",
     "    person_years_total = df_main.followup_years.sum()\n",
-    "    data.update({term:[person_years_total, subjects, events, *get_rate_and_ci(events, person_years_total)]})\n",
+    "    data.update({term: [person_years_total, subjects, events, *get_rate_and_ci(events, person_years_total)]})\n",
     "    return data"
    ]
   },
@@ -1205,7 +1254,7 @@
     "    data[\"lower_ci\"].append(v[4])\n",
     "    data[\"upper_ci\"].append(v[5])\n",
     "\n",
-    "df_table9 = pd.DataFrame(data={k:v for k,v in data.items() if k!=\"subjects\"})"
+    "df_table9 = pd.DataFrame(data={k: v for k, v in data.items() if k != \"subjects\"})"
    ]
   },
   {
@@ -1222,15 +1271,17 @@
     ")\n",
     "gt = gt.fmt_number(columns=[\"person_years\", \"failures\", \"rate\", \"lower_ci\", \"upper_ci\"], decimals=2)\n",
     "gt = (gt\n",
-    "    .cols_label({\"label\": \"Label\", \"person_years\": \"Person years\", \"failures\": \"Failures\", \"rate\": \"Rate\", \"lower_ci\": \"Lower\", \"upper_ci\": \"Upper\"})\n",
-    "    .cols_align(align=\"left\", columns=[\"label\"])\n",
-    "    .cols_align(align=\"center\", columns=[\"person_years\", \"failures\", \"rate\", \"lower_ci\", \"upper_ci\"])\n",
-    "    .tab_spanner(\n",
-    "        label=\"95%CI\",\n",
-    "        columns=[\"lower_ci\", \"upper_ci\"],\n",
-    "    )\n",
-    "    .tab_source_note(source_note=\"Excluding patients withdrawn for `late exclusion` criteria\")\n",
+    "      .cols_label(\n",
+    "    {\"label\": \"Label\", \"person_years\": \"Person years\", \"failures\": \"Failures\", \"rate\": \"Rate\", \"lower_ci\": \"Lower\",\n",
+    "     \"upper_ci\": \"Upper\"})\n",
+    "      .cols_align(align=\"left\", columns=[\"label\"])\n",
+    "      .cols_align(align=\"center\", columns=[\"person_years\", \"failures\", \"rate\", \"lower_ci\", \"upper_ci\"])\n",
+    "      .tab_spanner(\n",
+    "    label=\"95%CI\",\n",
+    "    columns=[\"lower_ci\", \"upper_ci\"],\n",
     ")\n",
+    "      .tab_source_note(source_note=\"Excluding patients withdrawn for `late exclusion` criteria\")\n",
+    "      )\n",
     "gt.show()\n",
     "html_data.append(gt.as_raw_html())"
    ]
@@ -1244,7 +1295,7 @@
    "source": [
     "# Table 11: Proportion meeting primary endpoint\n",
     "df_table10 = pd.DataFrame(data=data)\n",
-    "df_table10[\"proportion\"] = df_table10[\"failures\"]/df_table10[\"subjects\"]*100\n",
+    "df_table10[\"proportion\"] = df_table10[\"failures\"] / df_table10[\"subjects\"] * 100\n",
     "gt = df_as_great_table(\n",
     "    df_table10[[\"label\", \"subjects\", 'failures', \"proportion\"]],\n",
     "    title=\"Table 11: Proportion meeting primary endpoint\",\n",
@@ -1276,8 +1327,6 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "# TODO: EoS should be for all 1691, not 1631\n",
-    "\n",
     "# Table 11a: End of Study Table (for those who have completed an end of study form)\n",
     "df_eos = get_eos_df()\n",
     "offstudy_reasons = {\n",
@@ -1293,11 +1342,12 @@
     "    \"Patient withdrew consent to participate further\": \"Withdrawal: Consent\",\n",
     "}\n",
     "df_eos[\"offstudy_reason\"] = df_eos[\"offstudy_reason\"].map(offstudy_reasons)\n",
-    "df_eos[\"offstudy_reason\"] = pd.Categorical(df_eos[\"offstudy_reason\"], categories=sorted(list(offstudy_reasons.values())), ordered=True)\n",
+    "df_eos[\"offstudy_reason\"] = pd.Categorical(df_eos[\"offstudy_reason\"],\n",
+    "                                           categories=sorted(list(offstudy_reasons.values())), ordered=True)\n",
     "df_eos[\"site_id\"] = df_eos[\"site_id\"].astype(str)\n",
     "df_eos_pivot = (\n",
     "    df_eos\n",
-    "    .groupby(by=[\"offstudy_reason\", \"site_id\"],observed=True)\n",
+    "    .groupby(by=[\"offstudy_reason\", \"site_id\"], observed=True)\n",
     "    .size()\n",
     "    .reset_index()\n",
     "    .pivot_table(index=\"offstudy_reason\", columns=\"site_id\", values=0, observed=True)\n",
@@ -1305,14 +1355,14 @@
     "    .astype(int)\n",
     "    .reset_index()\n",
     ")\n",
-    "df_eos_pivot[\"total\"] = df_eos_pivot[[\"10\", \"20\",\"30\",\"40\",\"60\"]].sum(axis=1)\n",
-    "df_eos_pivot.columns.name=\"\"\n",
+    "df_eos_pivot[\"total\"] = df_eos_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\"]].sum(axis=1)\n",
+    "df_eos_pivot.columns.name = \"\"\n",
     "sum_row = df_eos_pivot.select_dtypes(include='int64').sum()\n",
     "sum_row['offstudy_reason'] = 'Total'\n",
     "sum_row_df = pd.DataFrame(sum_row).T\n",
-    "enrolled_pivot[\"offstudy_reason\"] = \"Enrolled\"\n",
-    "enrolled_pivot = enrolled_pivot[[*df_eos_pivot.columns]]\n",
-    "df_eos_pivot = pd.concat([enrolled_pivot, df_eos_pivot, sum_row_df], ignore_index=True)\n",
+    "enrolled_1691_pivot[\"offstudy_reason\"] = \"Enrolled\"\n",
+    "enrolled_1691_pivot = enrolled_1691_pivot[[*df_eos_pivot.columns]]\n",
+    "df_eos_pivot = pd.concat([enrolled_1691_pivot, df_eos_pivot, sum_row_df], ignore_index=True)\n",
     "\n",
     "gt = df_as_great_table(\n",
     "    df_eos_pivot,\n",
@@ -1321,27 +1371,28 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({\"offstudy_reason\": \"Reason\", **{k:v for k,v in column_headers.items() if k not in [\"visit_code\", \"label\"]}})\n",
+    "    .cols_label(\n",
+    "        {\"offstudy_reason\": \"Reason\", **{k: v for k, v in column_headers.items() if k not in [\"visit_code\", \"label\"]}})\n",
     "    .cols_align(align=\"left\", columns=[\"offstudy_reason\"])\n",
-    "    .cols_align(align=\"center\", columns=[\"10\", \"20\",\"30\",\"40\",\"60\", \"total\"])\n",
+    "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .tab_style(\n",
     "        style=[style.fill(color=\"snow\"), style.text(color=\"black\")],\n",
     "        locations=loc.body(\n",
     "            columns=[0],\n",
-    "            rows=[len(df_eos_pivot)-1]),\n",
-    "        )\n",
+    "            rows=[len(df_eos_pivot) - 1]),\n",
+    "    )\n",
     "    .tab_style(\n",
     "        style=[style.fill(color=\"lightblue\"), style.text(color=\"black\")],\n",
     "        locations=loc.body(\n",
     "            columns=[\"10\", \"20\", \"30\", \"40\", \"60\"],\n",
-    "            rows=[len(df_eos_pivot)-1],\n",
+    "            rows=[len(df_eos_pivot) - 1],\n",
     "        ),\n",
     "    )\n",
     "    .tab_style(\n",
     "        style=[style.fill(color=\"lightgreen\"), style.text(color=\"black\")],\n",
     "        locations=loc.body(\n",
     "            columns=[\"total\"],\n",
-    "            rows=[len(df_eos_pivot)-1],\n",
+    "            rows=[len(df_eos_pivot) - 1],\n",
     "        ),\n",
     "    )\n",
     "    .tab_style(\n",
@@ -1372,23 +1423,26 @@
    "outputs": [],
    "source": [
     "# Table 12b: Study status\n",
-    "def get_schedule_df(df_subjecthistory:pd.DataFrame, onschedule_model:str, offschedule_model:str, mode:str)->pd.DataFrame:\n",
-    "    columns = {k:f\"{k}_{mode}\" for k in [\"10\", \"20\", \"30\", \"40\", \"60\"]}\n",
+    "def get_schedule_df(df_subjecthistory: pd.DataFrame, onschedule_model: str, offschedule_model: str,\n",
+    "                    mode: str) -> pd.DataFrame:\n",
+    "    columns = {k: f\"{k}_{mode}\" for k in [\"10\", \"20\", \"30\", \"40\", \"60\"]}\n",
     "    df_schedule = (\n",
     "        df_subjecthistory\n",
-    "        .query(f\"onschedule_model==@onschedule_model and offschedule_model==@offschedule_model and offschedule_datetime.{'isna' if mode=='on' else 'notna'}()\")\n",
+    "        .query(\n",
+    "            f\"onschedule_model==@onschedule_model and offschedule_model==@offschedule_model and offschedule_datetime.{'isna' if mode == 'on' else 'notna'}()\")\n",
     "        .groupby(by=[\"onschedule_model\", \"site_id\"])\n",
     "        .size()\n",
     "        .reset_index()\n",
     "        .pivot_table(index=\"onschedule_model\", columns=\"site_id\", values=0, observed=True)\n",
     "        .reset_index()\n",
-    "        .rename(columns={\"onschedule_model\":\"schedule\", **columns})\n",
+    "        .rename(columns={\"onschedule_model\": \"schedule\", **columns})\n",
     "        .fillna(0)\n",
     "        .copy()\n",
     "    )\n",
     "    df_schedule.columns.name = \"\"\n",
     "    return df_schedule\n",
     "\n",
+    "\n",
     "df_subjecthistory = read_frame(SubjectScheduleHistory.objects.all(), verbose=False).rename(columns={\"site\": \"site_id\"})\n",
     "df_subjecthistory[\"site_id\"] = df_subjecthistory[\"site_id\"].astype(str)\n",
     "\n",
@@ -1423,7 +1477,9 @@
     "df_status[\"total_on\"] = df_status[[col for col in columns if \"on\" in col]].sum(axis=1)\n",
     "df_status[\"total_off\"] = df_status[[col for col in columns if \"off\" in col]].sum(axis=1)\n",
     "df_status[\"total\"] = df_status[columns].sum(axis=1)\n",
-    "df_status[\"schedule\"] = df_status.schedule.map({\"meta_prn.onschedule\": \"Main trial\", \"meta_prn.onscheduledmreferral\": \"Diabetes\", \"meta_prn.onschedulepregnancy\": \"Pregnancy\"})\n",
+    "df_status[\"schedule\"] = df_status.schedule.map(\n",
+    "    {\"meta_prn.onschedule\": \"Main trial\", \"meta_prn.onscheduledmreferral\": \"Diabetes\",\n",
+    "     \"meta_prn.onschedulepregnancy\": \"Pregnancy\"})\n",
     "\n",
     "gt = df_as_great_table(\n",
     "    df_status,\n",
@@ -1432,63 +1488,63 @@
     ")\n",
     "# gt = gt.fmt_number(columns=[\"person_years\", \"failures\", \"rate\", \"lower_ci\", \"upper_ci\"], decimals=0)\n",
     "gt = (gt\n",
-    "    .tab_source_note(\n",
-    "        source_note=(\n",
-    "            \"Note: Offschedule form is always submitted before the End of study report. \"\n",
-    "            \"When the Offschedule form is submitted, future appointments for the schedule are removed and \"\n",
-    "            \"the site staff are actioned to submit the End of study report.\"\n",
-    "        )\n",
-    "    )\n",
-    "    .cols_label({\n",
-    "        \"10_on\": \"On\", \"10_off\": \"Off\",\n",
-    "        \"20_on\": \"On\", \"20_off\": \"Off\",\n",
-    "        \"30_on\": \"On\", \"30_off\": \"Off\",\n",
-    "        \"40_on\": \"On\", \"40_off\": \"Off\",\n",
-    "        \"60_on\": \"On\", \"60_off\": \"Off\",\n",
-    "        \"total_on\": \"On\", \"total_off\": \"Off\",\n",
-    "        \"schedule\": \"Schedule\", \"total\": \"Total\"})\n",
-    "    .cols_align(align=\"center\")\n",
-    "    .cols_align(align=\"left\", columns=[\"label\"])\n",
-    "    .tab_spanner(\n",
-    "        label=\"Hindu mandal\",\n",
-    "        columns=[\"10_on\", \"10_off\"],\n",
-    "    )\n",
-    "    .tab_spanner(\n",
-    "        label=\"Amana\",\n",
-    "        columns=[\"20_on\", \"20_off\"],\n",
-    "    )\n",
-    "    .tab_spanner(\n",
-    "        label=\"Temeke\",\n",
-    "        columns=[\"30_on\", \"30_off\"],\n",
+    "      .tab_source_note(\n",
+    "    source_note=(\n",
+    "        \"Note: Offschedule form is always submitted before the End of study report. \"\n",
+    "        \"When the Offschedule form is submitted, future appointments for the schedule are removed and \"\n",
+    "        \"the site staff are actioned to submit the End of study report.\"\n",
     "    )\n",
-    "    .tab_spanner(\n",
-    "        label=\"Mwananyamala\",\n",
-    "        columns=[\"40_on\", \"40_off\"],\n",
-    "    )\n",
-    "    .tab_spanner(\n",
-    "        label=\"Mnazi Moja\",\n",
-    "        columns=[\"60_on\", \"60_off\"],\n",
-    "    )\n",
-    "    .tab_spanner(\n",
-    "        label=\"Total\",\n",
-    "        columns=[\"total_on\", \"total_off\"],\n",
-    "    )\n",
-    "    .tab_style(\n",
-    "        style=[style.fill(color=\"lightblue\"), style.text(color=\"black\")],\n",
-    "        locations=loc.body(\n",
-    "            columns=[\"10_off\", \"20_off\", \"30_off\", \"40_off\", \"60_off\"],\n",
-    "            rows=list(range(0, 1)),\n",
-    "        ),\n",
-    "    )\n",
-    "    .tab_style(\n",
-    "        style=[style.fill(color=\"lightgreen\"), style.text(color=\"black\")],\n",
-    "        locations=loc.body(\n",
-    "            columns=[\"total_off\"],\n",
-    "            rows=list(range(0, 1)),\n",
-    "        ),\n",
-    "    )\n",
-    "    .fmt_number(columns=[*[c for c in df_status.columns if c not in [\"schedule\"]]], decimals=0)\n",
     ")\n",
+    "      .cols_label({\n",
+    "    \"10_on\": \"On\", \"10_off\": \"Off\",\n",
+    "    \"20_on\": \"On\", \"20_off\": \"Off\",\n",
+    "    \"30_on\": \"On\", \"30_off\": \"Off\",\n",
+    "    \"40_on\": \"On\", \"40_off\": \"Off\",\n",
+    "    \"60_on\": \"On\", \"60_off\": \"Off\",\n",
+    "    \"total_on\": \"On\", \"total_off\": \"Off\",\n",
+    "    \"schedule\": \"Schedule\", \"total\": \"Total\"})\n",
+    "      .cols_align(align=\"center\")\n",
+    "      .cols_align(align=\"left\", columns=[\"label\"])\n",
+    "      .tab_spanner(\n",
+    "    label=\"Hindu mandal\",\n",
+    "    columns=[\"10_on\", \"10_off\"],\n",
+    ")\n",
+    "      .tab_spanner(\n",
+    "    label=\"Amana\",\n",
+    "    columns=[\"20_on\", \"20_off\"],\n",
+    ")\n",
+    "      .tab_spanner(\n",
+    "    label=\"Temeke\",\n",
+    "    columns=[\"30_on\", \"30_off\"],\n",
+    ")\n",
+    "      .tab_spanner(\n",
+    "    label=\"Mwananyamala\",\n",
+    "    columns=[\"40_on\", \"40_off\"],\n",
+    ")\n",
+    "      .tab_spanner(\n",
+    "    label=\"Mnazi Moja\",\n",
+    "    columns=[\"60_on\", \"60_off\"],\n",
+    ")\n",
+    "      .tab_spanner(\n",
+    "    label=\"Total\",\n",
+    "    columns=[\"total_on\", \"total_off\"],\n",
+    ")\n",
+    "      .tab_style(\n",
+    "    style=[style.fill(color=\"lightblue\"), style.text(color=\"black\")],\n",
+    "    locations=loc.body(\n",
+    "        columns=[\"10_off\", \"20_off\", \"30_off\", \"40_off\", \"60_off\"],\n",
+    "        rows=list(range(0, 1)),\n",
+    "    ),\n",
+    ")\n",
+    "      .tab_style(\n",
+    "    style=[style.fill(color=\"lightgreen\"), style.text(color=\"black\")],\n",
+    "    locations=loc.body(\n",
+    "        columns=[\"total_off\"],\n",
+    "        rows=list(range(0, 1)),\n",
+    "    ),\n",
+    ")\n",
+    "      .fmt_number(columns=[*[c for c in df_status.columns if c not in [\"schedule\"]]], decimals=0)\n",
+    "      )\n",
     "html_data.append(gt.as_raw_html())\n",
     "gt.show()"
    ]
@@ -1499,21 +1555,46 @@
    "id": "39",
    "metadata": {},
    "outputs": [],
+   "source": [
+    "# off schedule no eos\n",
+    "\n",
+    "subjects_preg_dm = df_subjecthistory[~(df_subjecthistory.offschedule_datetime.isna()) & (\n",
+    "        df_subjecthistory.schedule_name != \"schedule\")].subject_identifier\n",
+    "\n",
+    "df_subjecthistory[\n",
+    "    ~(df_subjecthistory.subject_identifier.isin(df_eos_1691.subject_identifier))].sort_values(\n",
+    "    by=[\"subject_identifier\", \"onschedule_datetime\"])"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "40",
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "41",
+   "metadata": {},
+   "outputs": [],
    "source": [
     "# Table 13: Loss to Follow Up\n",
     "df_ltfu = read_frame(LossToFollowup.objects.all(), verbose=False).rename(columns={\"site\": \"site_id\"})\n",
     "df_ltfu_pivot = (\n",
     "    df_ltfu\n",
-    "    .groupby(by=[\"loss_category\", \"site_id\"],observed=True,dropna=False)\n",
+    "    .groupby(by=[\"loss_category\", \"site_id\"], observed=True, dropna=False)\n",
     "    .size()\n",
     "    .reset_index()\n",
-    "    .pivot_table(index=\"loss_category\", columns=\"site_id\", values=0, observed=True,dropna=False)\n",
+    "    .pivot_table(index=\"loss_category\", columns=\"site_id\", values=0, observed=True, dropna=False)\n",
     "    .fillna(0)\n",
     "    .astype(int)\n",
     "    .reset_index()\n",
     ")\n",
-    "df_ltfu_pivot[\"total\"] = df_eos_pivot[[\"10\", \"20\",\"30\",\"40\",\"60\"]].sum(axis=1)\n",
-    "df_ltfu_pivot.columns.name=\"\"\n",
+    "df_ltfu_pivot[\"total\"] = df_eos_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\"]].sum(axis=1)\n",
+    "df_ltfu_pivot.columns.name = \"\"\n",
     "sum_row = df_ltfu_pivot.select_dtypes(include='int64').sum()\n",
     "sum_row['loss_category'] = 'Total'\n",
     "sum_row_df = pd.DataFrame(sum_row).T\n",
@@ -1524,7 +1605,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "40",
+   "id": "42",
    "metadata": {},
    "outputs": [],
    "source": [
@@ -1533,19 +1614,19 @@
     "df1 = (\n",
     "    df_status\n",
     "    .query(\"schedule=='Main trial'\")[[col for col in columns if \"off\" in col]]\n",
-    "    .rename(columns=dict(zip([col for col in columns if \"off\" in col], [\"10\", \"20\",\"30\",\"40\",\"60\"])))\n",
+    "    .rename(columns=dict(zip([col for col in columns if \"off\" in col], [\"10\", \"20\", \"30\", \"40\", \"60\"])))\n",
     "    .reset_index(drop=True)\n",
     ")\n",
     "df2 = (\n",
     "    df_eos_pivot\n",
-    "    .query(\"offstudy_reason=='Total'\")[[\"10\", \"20\",\"30\",\"40\",\"60\"]]\n",
+    "    .query(\"offstudy_reason=='Total'\")[[\"10\", \"20\", \"30\", \"40\", \"60\"]]\n",
     "    .reset_index(drop=True)\n",
     ")\n",
     "\n",
-    "df_eos_not_reported = df1-df2\n",
+    "df_eos_not_reported = df1 - df2\n",
     "df_eos_not_reported[\"schedule\"] = 'Main trial'\n",
-    "df_eos_not_reported[\"total\"] = df_eos_not_reported[[\"10\", \"20\",\"30\",\"40\",\"60\"]].sum(axis=1)\n",
-    "df_eos_not_reported = df_eos_not_reported[[\"schedule\", \"10\", \"20\",\"30\",\"40\",\"60\", \"total\"]]\n",
+    "df_eos_not_reported[\"total\"] = df_eos_not_reported[[\"10\", \"20\", \"30\", \"40\", \"60\"]].sum(axis=1)\n",
+    "df_eos_not_reported = df_eos_not_reported[[\"schedule\", \"10\", \"20\", \"30\", \"40\", \"60\", \"total\"]]\n",
     "\n",
     "gt = df_as_great_table(\n",
     "    df_eos_not_reported,\n",
@@ -1554,27 +1635,28 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({\"schedule\": \"Schedule\", **{k:v for k,v in column_headers.items() if k not in [\"visit_code\", \"label\"]}})\n",
+    "    .cols_label(\n",
+    "        {\"schedule\": \"Schedule\", **{k: v for k, v in column_headers.items() if k not in [\"visit_code\", \"label\"]}})\n",
     "    .cols_align(align=\"left\", columns=[\"schedule\"])\n",
-    "    .cols_align(align=\"center\", columns=[\"10\", \"20\",\"30\",\"40\",\"60\", \"total\"])\n",
+    "    .cols_align(align=\"center\", columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"])\n",
     "    .tab_style(\n",
     "        style=[style.fill(color=\"snow\"), style.text(color=\"black\")],\n",
     "        locations=loc.body(\n",
     "            columns=[0],\n",
-    "            rows=[len(df_eos_pivot)-1]),\n",
-    "        )\n",
+    "            rows=[len(df_eos_pivot) - 1]),\n",
+    "    )\n",
     "    .tab_style(\n",
     "        style=[style.fill(color=\"lightblue\"), style.text(color=\"black\")],\n",
     "        locations=loc.body(\n",
     "            columns=[\"10\", \"20\", \"30\", \"40\", \"60\"],\n",
-    "            rows=[len(df_eos_pivot)-1],\n",
+    "            rows=[len(df_eos_pivot) - 1],\n",
     "        ),\n",
     "    )\n",
     "    .tab_style(\n",
     "        style=[style.fill(color=\"lightgreen\"), style.text(color=\"black\")],\n",
     "        locations=loc.body(\n",
     "            columns=[\"total\"],\n",
-    "            rows=[len(df_eos_pivot)-1],\n",
+    "            rows=[len(df_eos_pivot) - 1],\n",
     "        ),\n",
     "    )\n",
     ")\n",
@@ -1585,7 +1667,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "41",
+   "id": "43",
    "metadata": {},
    "outputs": [],
    "source": [
@@ -1595,7 +1677,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "42",
+   "id": "44",
    "metadata": {},
    "outputs": [],
    "source": [
@@ -1623,16 +1705,16 @@
     ")\n",
     "if \"60\" not in df_consented_pivot.columns:\n",
     "    df_consented_pivot[\"60\"] = 0.0 * len(df_consented_pivot)\n",
-    "df_consented_pivot.columns.name=\"\"\n",
+    "df_consented_pivot.columns.name = \"\"\n",
     "df_consented_pivot[\"year\"] = df_consented_pivot[\"year\"].astype(str)\n",
     "df_consented_pivot[\"month\"] = df_consented_pivot[\"month\"].astype(str)\n",
     "\n",
-    "sum_row = df_consented_pivot[[\"10\", \"20\",\"30\",\"40\",\"60\"]].sum()\n",
+    "sum_row = df_consented_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\"]].sum()\n",
     "sum_row['year'] = \"Total\"\n",
     "sum_row['month'] = \"\"\n",
     "df_consented_pivot = pd.concat([df_consented_pivot, sum_row.to_frame().T], ignore_index=True)\n",
-    "df_consented_pivot[\"total\"] = df_consented_pivot[[\"10\", \"20\",\"30\",\"40\",\"60\"]].sum(axis=1).astype(int)\n",
-    "df_consented_pivot[[\"10\", \"20\",\"30\",\"40\",\"60\"]] = df_consented_pivot[[\"10\", \"20\",\"30\",\"40\",\"60\"]].astype(int)\n",
+    "df_consented_pivot[\"total\"] = df_consented_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\"]].sum(axis=1).astype(int)\n",
+    "df_consented_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\"]] = df_consented_pivot[[\"10\", \"20\", \"30\", \"40\", \"60\"]].astype(int)\n",
     "gt = df_as_great_table2(\n",
     "    df_consented_pivot,\n",
     "    title=\"Table 15: Consented to extended followup\",\n",
@@ -1641,7 +1723,8 @@
     ")\n",
     "gt = (\n",
     "    gt\n",
-    "    .cols_label({\"year\": \"Year\", \"month\": \"Month\", **{k:v for k, v in column_headers.items() if k not in [\"visit_code\", \"label\"]}})\n",
+    "    .cols_label({\"year\": \"Year\", \"month\": \"Month\",\n",
+    "                 **{k: v for k, v in column_headers.items() if k not in [\"visit_code\", \"label\"]}})\n",
     "    .cols_align(align=\"center\")\n",
     "    .fmt_number(columns=[\"10\", \"20\", \"30\", \"40\", \"60\", \"total\"], decimals=0)\n",
     "    .tab_stubhead(label=\"Consented\")\n",
@@ -1660,7 +1743,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "43",
+   "id": "45",
    "metadata": {},
    "outputs": [],
    "source": []
@@ -1668,7 +1751,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "44",
+   "id": "46",
    "metadata": {},
    "outputs": [],
    "source": [
@@ -1694,34 +1777,34 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "45",
+   "id": "47",
    "metadata": {},
    "outputs": [],
    "source": [
     "# render html to PDF\n",
     "pdfkit.from_string(raw_html, str(analysis_folder / pdf_filename),\n",
-    "options={\n",
-    "    'footer-center': 'Page [page] of [topage]',\n",
-    "    'footer-font-size': '8',\n",
-    "    'footer-spacing': '5',\n",
-    "    'encoding': \"UTF-8\",\n",
-    "    'margin-top':'10mm',\n",
-    "    'margin-right':'15mm',\n",
-    "    'margin-bottom':'15mm',\n",
-    "    'margin-left':'15mm',\n",
-    "    'header-center': study_title,\n",
-    "    'header-font-size': '6',\n",
-    "    'header-spacing': '0',\n",
-    "    'disable-javascript': None,\n",
-    "    'no-outline': None,\n",
-    "},\n",
-    "verbose=True)"
+    "                   options={\n",
+    "                       'footer-center': 'Page [page] of [topage]',\n",
+    "                       'footer-font-size': '8',\n",
+    "                       'footer-spacing': '5',\n",
+    "                       'encoding': \"UTF-8\",\n",
+    "                       'margin-top': '10mm',\n",
+    "                       'margin-right': '15mm',\n",
+    "                       'margin-bottom': '15mm',\n",
+    "                       'margin-left': '15mm',\n",
+    "                       'header-center': study_title,\n",
+    "                       'header-font-size': '6',\n",
+    "                       'header-spacing': '0',\n",
+    "                       'disable-javascript': None,\n",
+    "                       'no-outline': None,\n",
+    "                   },\n",
+    "                   verbose=True)"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "46",
+   "id": "48",
    "metadata": {},
    "outputs": [],
    "source": []

meta-edc 1.1.0__py3-none-any.whl → 1.1.2__py3-none-any.whl

meta-edc 1.1.0py3-none-any.whl → 1.1.2py3-none-any.whl