PyPI - pat2vec - Versions diffs - 0.1.1__py3-none-any.whl - Mend

pat2vec 0.1.1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (103) hide show

pat2vec/__init__.py +463 -0
pat2vec/main_pat2vec.py +720 -0
pat2vec/pat2vec_get_methods/__init__.py +4 -0
pat2vec/pat2vec_get_methods/get_method_appointments.py +220 -0
pat2vec/pat2vec_get_methods/get_method_bed.py +177 -0
pat2vec/pat2vec_get_methods/get_method_bloods.py +388 -0
pat2vec/pat2vec_get_methods/get_method_bmi.py +281 -0
pat2vec/pat2vec_get_methods/get_method_core02.py +250 -0
pat2vec/pat2vec_get_methods/get_method_core_resus.py +239 -0
pat2vec/pat2vec_get_methods/get_method_current_pat_annotations_mrc_cs.py +126 -0
pat2vec/pat2vec_get_methods/get_method_demo.py +196 -0
pat2vec/pat2vec_get_methods/get_method_demographics.py +389 -0
pat2vec/pat2vec_get_methods/get_method_diagnostics.py +354 -0
pat2vec/pat2vec_get_methods/get_method_drugs.py +330 -0
pat2vec/pat2vec_get_methods/get_method_hosp_site.py +169 -0
pat2vec/pat2vec_get_methods/get_method_news.py +152 -0
pat2vec/pat2vec_get_methods/get_method_pat_annotations.py +128 -0
pat2vec/pat2vec_get_methods/get_method_report_annotations.py +116 -0
pat2vec/pat2vec_get_methods/get_method_smoking.py +224 -0
pat2vec/pat2vec_get_methods/get_method_textual_obs_annotations.py +141 -0
pat2vec/pat2vec_get_methods/get_method_vte_status.py +229 -0
pat2vec/pat2vec_main_methods/__init__.py +0 -0
pat2vec/pat2vec_main_methods/main_batch.py +341 -0
pat2vec/pat2vec_pat_list/__init__.py +0 -0
pat2vec/pat2vec_pat_list/get_patient_treatment_list.py +437 -0
pat2vec/pat2vec_search/cogstack_search_methods.py +1356 -0
pat2vec/pat2vec_search/data_helper_functions.py +105 -0
pat2vec/pat2vec_search/matcher.py +94 -0
pat2vec/pat2vec_search/nearest.py +50 -0
pat2vec/pat2vec_search/search_helper_functions.py +160 -0
pat2vec/pat2vec_search/search_multiprocess.py +100 -0
pat2vec/patvec_get_batch_methods/__init__.py +0 -0
pat2vec/patvec_get_batch_methods/get_merged_batches.py +1456 -0
pat2vec/patvec_get_batch_methods/get_prefetch_batches.py +225 -0
pat2vec/patvec_get_batch_methods/main.py +1370 -0
pat2vec/tests/config_pat2vec.py +0 -0
pat2vec/tests/test_calculate_interval.py +146 -0
pat2vec/tests/test_config_class.py +221 -0
pat2vec/tests/test_filter_dataframe_by_timestamp_extended.py +164 -0
pat2vec/tests/test_generate_date_list.py +223 -0
pat2vec/tests/test_get_dummy_data_cohort_searcher_get_date.py +95 -0
pat2vec/tests/test_get_method_bloods.py +0 -0
pat2vec/tests/test_get_start_end_year_month.py +173 -0
pat2vec/tests/test_global_date_validation.py +126 -0
pat2vec/tests/test_individual_patient_window.py +297 -0
pat2vec/tests/test_methods_annotation_filter_annot_dataframe.py +139 -0
pat2vec/tests/test_methods_annotation_multi_annots_to_df.py +259 -0
pat2vec/tests/test_methods_get.py +229 -0
pat2vec/tests/test_parse_date.py +139 -0
pat2vec/tests/test_post_processing_build_ipw_dataframe.py +318 -0
pat2vec/tests/test_post_processing_get_pat_ipw_record.py +484 -0
pat2vec/tests/test_post_processing_process_csv_files.py +169 -0
pat2vec/util/__init__.py +0 -0
pat2vec/util/anonymisation_data_methods.py +243 -0
pat2vec/util/anonymisation_deid_documents.py +616 -0
pat2vec/util/calculate_interval.py +50 -0
pat2vec/util/clinical_note_splitter.py +327 -0
pat2vec/util/compile_requirements.py +97 -0
pat2vec/util/config_pat2vec.py +1216 -0
pat2vec/util/credentials.py +34 -0
pat2vec/util/current_pat_batch_path_methods.py +84 -0
pat2vec/util/dummy_data_files/__init__.py +0 -0
pat2vec/util/dummy_data_files/dummy_lists.py +1899 -0
pat2vec/util/elasticsearch_methods.py +284 -0
pat2vec/util/ethnicity_abstractor.py +730 -0
pat2vec/util/evaluation_methods.py +232 -0
pat2vec/util/evaluation_methods_ploting.py +116 -0
pat2vec/util/filter_dataframe_by_timestamp.py +86 -0
pat2vec/util/filter_methods.py +213 -0
pat2vec/util/generate_date_list.py +145 -0
pat2vec/util/get_best_gpu.py +31 -0
pat2vec/util/get_dummy_data_cohort_searcher.py +1864 -0
pat2vec/util/get_dummy_data_medcat_annotation.py +104 -0
pat2vec/util/get_start_end_year_month.py +51 -0
pat2vec/util/helper_functions.py +70 -0
pat2vec/util/impute_data_for_pipe.py +148 -0
pat2vec/util/logger_setup.py +122 -0
pat2vec/util/medcat_misc_methods.py +668 -0
pat2vec/util/methods_annotation.py +527 -0
pat2vec/util/methods_annotation_filter_annot_dataframe.py +71 -0
pat2vec/util/methods_annotation_get_pat_document_annotation_batch.py +243 -0
pat2vec/util/methods_annotation_json_to_dataframe.py +240 -0
pat2vec/util/methods_annotation_multi_annots_to_df.py +164 -0
pat2vec/util/methods_annotation_regex.py +39 -0
pat2vec/util/methods_get.py +995 -0
pat2vec/util/methods_get_medcat.py +121 -0
pat2vec/util/methods_post_get.py +190 -0
pat2vec/util/parse_date.py +74 -0
pat2vec/util/post_processing.py +1485 -0
pat2vec/util/post_processing_build_ipw_dataframe.py +80 -0
pat2vec/util/post_processing_build_methods.py +683 -0
pat2vec/util/post_processing_get_pat_ipw_record.py +379 -0
pat2vec/util/post_processing_medcat.py +230 -0
pat2vec/util/post_processing_process_csv_files.py +293 -0
pat2vec/util/pre_get_drug_treatment_docs.py +465 -0
pat2vec/util/pre_processing.py +457 -0
pat2vec/util/presentation_methods.py +106 -0
pat2vec/util/testing_helpers.py +29 -0
pat2vec-0.1.1.dist-info/METADATA +391 -0
pat2vec-0.1.1.dist-info/RECORD +103 -0
pat2vec-0.1.1.dist-info/WHEEL +5 -0
pat2vec-0.1.1.dist-info/top_level.txt +2 -0
pat2vec_env/bin/vba_extract.py +79 -0

pat2vec/__init__.py ADDED Viewed

@@ -0,0 +1,463 @@
+"""
+pat2vec: A package for processing patient data.
+This file is auto-generated by `generate_init.py`.
+It exposes the main functions and methods of the pat2vec library for easy access.
+"""
+from .main_pat2vec import (
+    main
+)
+from .pat2vec_get_methods.get_method_appointments import (
+    get_appointments, search_appointments
+)
+from .pat2vec_get_methods.get_method_bed import (
+    get_bed, search_bed_data
+)
+from .pat2vec_get_methods.get_method_bloods import (
+    get_current_pat_bloods, search_bloods_data
+)
+from .pat2vec_get_methods.get_method_bmi import (
+    calculate_bmi_features, get_bmi_features, search_bmi_observations
+)
+from .pat2vec_get_methods.get_method_core02 import (
+    calculate_core_o2_features, clean_observation_value, get_core_02,
+    search_core_o2_observations
+)
+from .pat2vec_get_methods.get_method_core_resus import (
+    calculate_core_resus_features, get_core_resus, search_core_resus_observations
+)
+from .pat2vec_get_methods.get_method_current_pat_annotations_mrc_cs import (
+    get_current_pat_annotations_mrc_cs
+)
+from .pat2vec_get_methods.get_method_demo import (
+    get_demographics3, process_demographics_data, search_demographics
+)
+from .pat2vec_get_methods.get_method_demographics import (
+    get_demo, get_demographics3_batch
+)
+from .pat2vec_get_methods.get_method_diagnostics import (
+    calculate_diagnostic_features, create_diagnostic_features_dataframe,
+    get_current_pat_diagnostics, prepare_diagnostic_datetime, search_diagnostic_orders
+)
+from .pat2vec_get_methods.get_method_drugs import (
+    calculate_drug_features, create_drug_features_dataframe, get_current_pat_drugs,
+    prepare_drug_datetime, search_drug_orders
+)
+from .pat2vec_get_methods.get_method_hosp_site import (
+    calculate_hospital_site_features, get_hosp_site, prepare_hospital_site_data,
+    search_hospital_site
+)
+from .pat2vec_get_methods.get_method_news import (
+    compute_feature_stats, get_news
+)
+from .pat2vec_get_methods.get_method_pat_annotations import (
+    get_current_pat_annotations
+)
+from .pat2vec_get_methods.get_method_report_annotations import (
+    get_current_pat_report_annotations
+)
+from .pat2vec_get_methods.get_method_smoking import (
+    calculate_smoking_features, get_smoking, prepare_smoking_data, search_smoking
+)
+from .pat2vec_get_methods.get_method_textual_obs_annotations import (
+    get_current_pat_textual_obs_annotations
+)
+from .pat2vec_get_methods.get_method_vte_status import (
+    calculate_vte_features, get_vte_status, prepare_vte_data, search_vte
+)
+from .pat2vec_main_methods.main_batch import (
+    main_batch
+)
+from .pat2vec_pat_list.get_patient_treatment_list import (
+    analyze_client_codes, extract_treatment_id_list_from_docs, generate_control_list,
+    get_all_patients_list, sanitize_hospital_ids
+)
+from .pat2vec_search.cogstack_search_methods import (
+    CogStack, cohort_searcher_no_terms, cohort_searcher_no_terms_fuzzy,
+    cohort_searcher_with_terms_and_search, cohort_searcher_with_terms_no_search,
+    create_credentials_file, dataframe_generator, initialize_cogstack_client,
+    iterative_multi_term_cohort_searcher_no_terms_fuzzy,
+    iterative_multi_term_cohort_searcher_no_terms_fuzzy_mct,
+    iterative_multi_term_cohort_searcher_no_terms_fuzzy_textual_obs, list_chunker,
+    set_index_safe_wrapper
+)
+from .pat2vec_search.data_helper_functions import (
+    appendAge, appendAgeAtRecord, append_age_at_record_series, df_column_uniquify
+)
+from .pat2vec_search.matcher import (
+    matcher
+)
+from .pat2vec_search.nearest import (
+    nearest
+)
+from .pat2vec_search.search_helper_functions import (
+    bulk_str_extract, bulk_str_extract_round_robin, bulk_str_findall, date_cleaner,
+    pylist2searchlist, stringlist2pylist, stringlist2searchlist, without_keys
+)
+from .pat2vec_search.search_multiprocess import (
+    cohort_searcher_with_terms_and_search_multi, pull_and_write
+)
+from .patvec_get_batch_methods.get_merged_batches import (
+    get_merged_pat_batch_appointments, get_merged_pat_batch_bloods,
+    get_merged_pat_batch_bmi, get_merged_pat_batch_demo,
+    get_merged_pat_batch_diagnostics, get_merged_pat_batch_drugs,
+    get_merged_pat_batch_epr_docs, get_merged_pat_batch_mct_docs,
+    get_merged_pat_batch_news, get_merged_pat_batch_obs, get_merged_pat_batch_reports,
+    get_merged_pat_batch_textual_obs_docs, save_group, split_and_save_csv,
+    verify_split_data_concatenated, verify_split_data_individual
+)
+from .patvec_get_batch_methods.get_prefetch_batches import (
+    BatchConfig, prefetch_batches
+)
+from .patvec_get_batch_methods.main import (
+    get_pat_batch_appointments, get_pat_batch_bloods, get_pat_batch_bmi,
+    get_pat_batch_demo, get_pat_batch_diagnostics, get_pat_batch_drugs,
+    get_pat_batch_epr_docs, get_pat_batch_epr_docs_annotations, get_pat_batch_mct_docs,
+    get_pat_batch_mct_docs_annotations, get_pat_batch_news, get_pat_batch_obs,
+    get_pat_batch_reports, get_pat_batch_reports_docs_annotations,
+    get_pat_batch_textual_obs_annotations, get_pat_batch_textual_obs_docs
+)
+from .tests.test_calculate_interval import (
+    TestCalculateInterval
+)
+from .tests.test_config_class import (
+    TestConfigClass
+)
+from .tests.test_filter_dataframe_by_timestamp_extended import (
+    TestFilterDataFrameByTimestampExtended
+)
+from .tests.test_generate_date_list import (
+    TestGenerateDateList
+)
+from .tests.test_get_dummy_data_cohort_searcher_get_date import (
+    TestCreateRandomDateFromGlobals
+)
+from .tests.test_get_start_end_year_month import (
+    MockConfig, TestGetStartEndYearMonth
+)
+from .tests.test_global_date_validation import (
+    TestGlobalDateValidation
+)
+from .tests.test_individual_patient_window import (
+    TestIndividualPatientWindow
+)
+from .tests.test_methods_annotation_filter_annot_dataframe import (
+    TestFilterAnnotDataframe
+)
+from .tests.test_methods_annotation_multi_annots_to_df import (
+    TestMultiAnnotsToDf
+)
+from .tests.test_methods_get import (
+    TestFilterDataFrameByTimestamp
+)
+from .tests.test_parse_date import (
+    TestDateValidationForElasticsearch
+)
+from .tests.test_post_processing_build_ipw_dataframe import (
+    TestBuildIpwDataframe
+)
+from .tests.test_post_processing_get_pat_ipw_record import (
+    TestGetPatIpwRecord
+)
+from .tests.test_post_processing_process_csv_files import (
+    TestProcessCsvFiles
+)
+from .util.anonymisation_data_methods import (
+    anonymize_feature_names, deanonymize_feature_names
+)
+from .util.anonymisation_deid_documents import (
+    DeIdAnonymizer, anonymize_dataframe_quick, anonymize_single_text
+)
+from .util.calculate_interval import (
+    calculate_interval
+)
+from .util.clinical_note_splitter import (
+    find_date, split_and_append_chunks, split_clinical_notes, split_clinical_notes_mct
+)
+from .util.compile_requirements import (
+    append_to_file, process_requirements, run_pip_compile
+)
+from .util.config_pat2vec import (
+    config_class, update_global_start_date, validate_and_fix_global_dates
+)
+from .util.current_pat_batch_path_methods import (
+    PathsClass
+)
+from .util.elasticsearch_methods import (
+    get_guess_datetime_column, guess_datetime_columns, handle_inconsistent_dtypes,
+    ingest_data_to_elasticsearch
+)
+from .util.ethnicity_abstractor import (
+    EthnicityAbstractor
+)
+from .util.evaluation_methods import (
+    CsvProfiler, compare_ipw_annotation_rows
+)
+from .util.evaluation_methods_ploting import (
+    generate_pie_charts
+)
+from .util.filter_dataframe_by_timestamp import (
+    filter_dataframe_by_timestamp
+)
+from .util.filter_methods import (
+    apply_bloods_data_type_filter, apply_data_type_epr_docs_filters,
+    apply_data_type_mct_docs_filters, filter_dataframe_by_fuzzy_terms
+)
+from .util.generate_date_list import (
+    generate_date_list
+)
+from .util.get_best_gpu import (
+    set_best_gpu
+)
+from .util.get_dummy_data_cohort_searcher import (
+    cohort_searcher_with_terms_and_search_dummy, create_random_date_from_globals,
+    extract_date_range, extract_search_term_obscatalogmasteritem_displayname,
+    generate_appointments_data, generate_basic_observations_data,
+    generate_basic_observations_textual_obs_data, generate_bmi_data,
+    generate_core_o2_data, generate_core_resus_data, generate_diagnostic_orders_data,
+    generate_drug_orders_data, generate_epr_documents_data,
+    generate_epr_documents_personal_data, generate_hospital_site_data,
+    generate_observations_MRC_text_data, generate_observations_Reports_text_data,
+    generate_observations_data, generate_patient_timeline,
+    generate_patient_timeline_faker, generate_uuid, generate_uuid_list,
+    get_patient_timeline_dummy, maybe_nan, run_generate_patient_timeline_and_append
+)
+from .util.get_dummy_data_medcat_annotation import (
+    dummy_CAT, dummy_medcat_annotation_generator, random_sample
+)
+from .util.get_start_end_year_month import (
+    get_start_end_year_month
+)
+from .util.helper_functions import (
+    extract_nhs_numbers, get_search_client_idcode_list_from_nhs_number_list
+)
+from .util.impute_data_for_pipe import (
+    mean_impute_dataframe, save_missing_percentage
+)
+from .util.logger_setup import (
+    setup_logger
+)
+from .util.medcat_misc_methods import (
+    create_ner_results_dataframe, extract_labels_from_medcat_annotation_export,
+    manually_label_annotation_df, medcat_trainer_export_to_df,
+    parse_medcat_trainer_project_json, plot_ner_results, recreate_json
+)
+from .util.methods_annotation import (
+    annot_pat_batch_docs, calculate_pretty_name_count_features,
+    check_pat_document_annotation_complete, multi_annots_to_df_mct,
+    multi_annots_to_df_reports, multi_annots_to_df_textual_obs
+)
+from .util.methods_annotation_filter_annot_dataframe import (
+    filter_annot_dataframe
+)
+from .util.methods_annotation_get_pat_document_annotation_batch import (
+    get_pat_batch_textual_obs_annotation_batch, get_pat_document_annotation_batch,
+    get_pat_document_annotation_batch_mct, get_pat_document_annotation_batch_reports
+)
+from .util.methods_annotation_json_to_dataframe import (
+    json_to_dataframe, parse_meta_anns
+)
+from .util.methods_annotation_multi_annots_to_df import (
+    multi_annots_to_df, temporary_file
+)
+from .util.methods_annotation_regex import (
+    append_regex_term_counts
+)
+from .util.methods_get import (
+    add_offset_column, build_patient_dict, convert_date, convert_timestamp_to_tuple,
+    create_folders, create_folders_annot_csv_wrapper, create_folders_for_pat,
+    create_local_folders, create_remote_folders, dump_results,
+    enum_exact_target_date_vector, enum_target_date_vector, exist_check,
+    filter_stripped_list, get_empty_date_vector, get_free_gpu, list_dir_wrapper,
+    read_csv_wrapper, read_remote, sftp_exists, test_datetime_formats, update_pbar,
+    write_csv_wrapper, write_remote
+)
+from .util.methods_get_medcat import (
+    get_cat
+)
+from .util.methods_post_get import (
+    check_csv_files_in_directory, check_csv_integrity,
+    copy_project_folders_with_substring_match, retrieve_pat_annotations
+)
+from .util.parse_date import (
+    validate_input_dates
+)
+from .util.post_processing import (
+    aggregate_dataframe_mean, check_list_presence, collapse_df_to_mean,
+    convert_true_to_float, copy_files_and_dirs, count_files, drop_columns_with_all_nan,
+    extract_datetime_from_binary_columns,
+    extract_datetime_from_binary_columns_chunk_reader, extract_datetime_to_column,
+    extract_types_from_csv, filter_and_select_rows, filter_and_update_csv,
+    filter_annot_dataframe2, filter_dataframe_by_cui, filter_dataframe_n_lists,
+    get_all_target_annots, impute_dataframe, impute_datetime,
+    join_icd10_OPC4S_codes_to_annot, join_icd10_codes_to_annot, missing_percentage_df,
+    plot_missing_pattern_bloods, process_chunk, produce_filtered_annotation_dataframe,
+    remove_file_from_paths, retrieve_pat_annots_mct_epr, save_missing_values_pickle
+)
+from .util.post_processing_build_ipw_dataframe import (
+    build_ipw_dataframe
+)
+from .util.post_processing_build_methods import (
+    build_merged_bloods, build_merged_epr_mct_annot_df, build_merged_epr_mct_doc_df,
+    filter_annot_dataframe, get_annots_joined_to_docs, join_docs_to_annots,
+    merge_appointments_csv, merge_bmi_csv, merge_demographics_csv,
+    merge_diagnostics_csv, merge_drugs_csv, merge_news_csv, retrieve_pat_bloods,
+    retrieve_pat_docs_mct_epr
+)
+from .util.post_processing_get_pat_ipw_record import (
+    get_pat_ipw_record
+)
+from .util.post_processing_medcat import (
+    coerce_document_df_to_medcat_trainer_input, sample_by_terms
+)
+from .util.post_processing_process_csv_files import (
+    process_csv_files, process_csv_files_multi
+)
+from .util.pre_get_drug_treatment_docs import (
+    get_treatment_records_by_drug_order_name, iterative_drug_treatment_search
+)
+from .util.pre_processing import (
+    calculate_age_append, demo_to_latest, draw_document_samples,
+    get_treatment_docs_by_iterative_multi_term_cohort_searcher_no_terms_fuzzy,
+    search_cohort
+)
+from .util.presentation_methods import (
+    create_powerpoint_from_images, create_powerpoint_from_images_group,
+    create_powerpoint_slides, create_powerpoint_slides_client_idcode_groups,
+    group_images_by_suffix
+)
+from .util.testing_helpers import (
+    read_test_data
+)
+# Define the public API of the package
+__all__ = [
+    "BatchConfig", "CogStack", "CsvProfiler", "DeIdAnonymizer", "EthnicityAbstractor",
+    "MockConfig", "PathsClass", "TestBuildIpwDataframe", "TestCalculateInterval",
+    "TestConfigClass", "TestCreateRandomDateFromGlobals",
+    "TestDateValidationForElasticsearch", "TestFilterAnnotDataframe",
+    "TestFilterDataFrameByTimestamp", "TestFilterDataFrameByTimestampExtended",
+    "TestGenerateDateList", "TestGetPatIpwRecord", "TestGetStartEndYearMonth",
+    "TestGlobalDateValidation", "TestIndividualPatientWindow", "TestMultiAnnotsToDf",
+    "TestProcessCsvFiles", "add_offset_column", "aggregate_dataframe_mean",
+    "analyze_client_codes", "annot_pat_batch_docs", "anonymize_dataframe_quick",
+    "anonymize_feature_names", "anonymize_single_text", "appendAge",
+    "appendAgeAtRecord", "append_age_at_record_series", "append_regex_term_counts",
+    "append_to_file", "apply_bloods_data_type_filter",
+    "apply_data_type_epr_docs_filters", "apply_data_type_mct_docs_filters",
+    "build_ipw_dataframe", "build_merged_bloods", "build_merged_epr_mct_annot_df",
+    "build_merged_epr_mct_doc_df", "build_patient_dict", "bulk_str_extract",
+    "bulk_str_extract_round_robin", "bulk_str_findall", "calculate_age_append",
+    "calculate_bmi_features", "calculate_core_o2_features",
+    "calculate_core_resus_features", "calculate_diagnostic_features",
+    "calculate_drug_features", "calculate_hospital_site_features", "calculate_interval",
+    "calculate_pretty_name_count_features", "calculate_smoking_features",
+    "calculate_vte_features", "check_csv_files_in_directory", "check_csv_integrity",
+    "check_list_presence", "check_pat_document_annotation_complete",
+    "clean_observation_value", "coerce_document_df_to_medcat_trainer_input",
+    "cohort_searcher_no_terms", "cohort_searcher_no_terms_fuzzy",
+    "cohort_searcher_with_terms_and_search",
+    "cohort_searcher_with_terms_and_search_dummy",
+    "cohort_searcher_with_terms_and_search_multi",
+    "cohort_searcher_with_terms_no_search", "collapse_df_to_mean",
+    "compare_ipw_annotation_rows", "compute_feature_stats", "config_class",
+    "convert_date", "convert_timestamp_to_tuple", "convert_true_to_float",
+    "copy_files_and_dirs", "copy_project_folders_with_substring_match", "count_files",
+    "create_credentials_file", "create_diagnostic_features_dataframe",
+    "create_drug_features_dataframe", "create_folders",
+    "create_folders_annot_csv_wrapper", "create_folders_for_pat",
+    "create_local_folders", "create_ner_results_dataframe",
+    "create_powerpoint_from_images", "create_powerpoint_from_images_group",
+    "create_powerpoint_slides", "create_powerpoint_slides_client_idcode_groups",
+    "create_random_date_from_globals", "create_remote_folders", "dataframe_generator",
+    "date_cleaner", "deanonymize_feature_names", "demo_to_latest", "df_column_uniquify",
+    "draw_document_samples", "drop_columns_with_all_nan", "dummy_CAT",
+    "dummy_medcat_annotation_generator", "dump_results",
+    "enum_exact_target_date_vector", "enum_target_date_vector", "exist_check",
+    "extract_date_range", "extract_datetime_from_binary_columns",
+    "extract_datetime_from_binary_columns_chunk_reader", "extract_datetime_to_column",
+    "extract_labels_from_medcat_annotation_export", "extract_nhs_numbers",
+    "extract_search_term_obscatalogmasteritem_displayname",
+    "extract_treatment_id_list_from_docs", "extract_types_from_csv",
+    "filter_and_select_rows", "filter_and_update_csv", "filter_annot_dataframe",
+    "filter_annot_dataframe2", "filter_dataframe_by_cui",
+    "filter_dataframe_by_fuzzy_terms", "filter_dataframe_by_timestamp",
+    "filter_dataframe_n_lists", "filter_stripped_list", "find_date",
+    "generate_appointments_data", "generate_basic_observations_data",
+    "generate_basic_observations_textual_obs_data", "generate_bmi_data",
+    "generate_control_list", "generate_core_o2_data", "generate_core_resus_data",
+    "generate_date_list", "generate_diagnostic_orders_data",
+    "generate_drug_orders_data", "generate_epr_documents_data",
+    "generate_epr_documents_personal_data", "generate_hospital_site_data",
+    "generate_observations_MRC_text_data", "generate_observations_Reports_text_data",
+    "generate_observations_data", "generate_patient_timeline",
+    "generate_patient_timeline_faker", "generate_pie_charts", "generate_uuid",
+    "generate_uuid_list", "get_all_patients_list", "get_all_target_annots",
+    "get_annots_joined_to_docs", "get_appointments", "get_bed", "get_bmi_features",
+    "get_cat", "get_core_02", "get_core_resus", "get_current_pat_annotations",
+    "get_current_pat_annotations_mrc_cs", "get_current_pat_bloods",
+    "get_current_pat_diagnostics", "get_current_pat_drugs",
+    "get_current_pat_report_annotations", "get_current_pat_textual_obs_annotations",
+    "get_demo", "get_demographics3", "get_demographics3_batch", "get_empty_date_vector",
+    "get_free_gpu", "get_guess_datetime_column", "get_hosp_site",
+    "get_merged_pat_batch_appointments", "get_merged_pat_batch_bloods",
+    "get_merged_pat_batch_bmi", "get_merged_pat_batch_demo",
+    "get_merged_pat_batch_diagnostics", "get_merged_pat_batch_drugs",
+    "get_merged_pat_batch_epr_docs", "get_merged_pat_batch_mct_docs",
+    "get_merged_pat_batch_news", "get_merged_pat_batch_obs",
+    "get_merged_pat_batch_reports", "get_merged_pat_batch_textual_obs_docs", "get_news",
+    "get_pat_batch_appointments", "get_pat_batch_bloods", "get_pat_batch_bmi",
+    "get_pat_batch_demo", "get_pat_batch_diagnostics", "get_pat_batch_drugs",
+    "get_pat_batch_epr_docs", "get_pat_batch_epr_docs_annotations",
+    "get_pat_batch_mct_docs", "get_pat_batch_mct_docs_annotations",
+    "get_pat_batch_news", "get_pat_batch_obs", "get_pat_batch_reports",
+    "get_pat_batch_reports_docs_annotations",
+    "get_pat_batch_textual_obs_annotation_batch",
+    "get_pat_batch_textual_obs_annotations", "get_pat_batch_textual_obs_docs",
+    "get_pat_document_annotation_batch", "get_pat_document_annotation_batch_mct",
+    "get_pat_document_annotation_batch_reports", "get_pat_ipw_record",
+    "get_patient_timeline_dummy", "get_search_client_idcode_list_from_nhs_number_list",
+    "get_smoking", "get_start_end_year_month",
+    "get_treatment_docs_by_iterative_multi_term_cohort_searcher_no_terms_fuzzy",
+    "get_treatment_records_by_drug_order_name", "get_vte_status",
+    "group_images_by_suffix", "guess_datetime_columns", "handle_inconsistent_dtypes",
+    "impute_dataframe", "impute_datetime", "ingest_data_to_elasticsearch",
+    "initialize_cogstack_client", "iterative_drug_treatment_search",
+    "iterative_multi_term_cohort_searcher_no_terms_fuzzy",
+    "iterative_multi_term_cohort_searcher_no_terms_fuzzy_mct",
+    "iterative_multi_term_cohort_searcher_no_terms_fuzzy_textual_obs",
+    "join_docs_to_annots", "join_icd10_OPC4S_codes_to_annot",
+    "join_icd10_codes_to_annot", "json_to_dataframe", "list_chunker",
+    "list_dir_wrapper", "main", "main_batch", "manually_label_annotation_df", "matcher",
+    "maybe_nan", "mean_impute_dataframe", "medcat_trainer_export_to_df",
+    "merge_appointments_csv", "merge_bmi_csv", "merge_demographics_csv",
+    "merge_diagnostics_csv", "merge_drugs_csv", "merge_news_csv",
+    "missing_percentage_df", "multi_annots_to_df", "multi_annots_to_df_mct",
+    "multi_annots_to_df_reports", "multi_annots_to_df_textual_obs", "nearest",
+    "parse_medcat_trainer_project_json", "parse_meta_anns",
+    "plot_missing_pattern_bloods", "plot_ner_results", "prefetch_batches",
+    "prepare_diagnostic_datetime", "prepare_drug_datetime",
+    "prepare_hospital_site_data", "prepare_smoking_data", "prepare_vte_data",
+    "process_chunk", "process_csv_files", "process_csv_files_multi",
+    "process_demographics_data", "process_requirements",
+    "produce_filtered_annotation_dataframe", "pull_and_write", "pylist2searchlist",
+    "random_sample", "read_csv_wrapper", "read_remote", "read_test_data",
+    "recreate_json", "remove_file_from_paths", "retrieve_pat_annotations",
+    "retrieve_pat_annots_mct_epr", "retrieve_pat_bloods", "retrieve_pat_docs_mct_epr",
+    "run_generate_patient_timeline_and_append", "run_pip_compile", "sample_by_terms",
+    "sanitize_hospital_ids", "save_group", "save_missing_percentage",
+    "save_missing_values_pickle", "search_appointments", "search_bed_data",
+    "search_bloods_data", "search_bmi_observations", "search_cohort",
+    "search_core_o2_observations", "search_core_resus_observations",
+    "search_demographics", "search_diagnostic_orders", "search_drug_orders",
+    "search_hospital_site", "search_smoking", "search_vte", "set_best_gpu",
+    "set_index_safe_wrapper", "setup_logger", "sftp_exists", "split_and_append_chunks",
+    "split_and_save_csv", "split_clinical_notes", "split_clinical_notes_mct",
+    "stringlist2pylist", "stringlist2searchlist", "temporary_file",
+    "test_datetime_formats", "update_global_start_date", "update_pbar",
+    "validate_and_fix_global_dates", "validate_input_dates",
+    "verify_split_data_concatenated", "verify_split_data_individual", "without_keys",
+    "write_csv_wrapper", "write_remote"
+]