PyPI - endoreg-db - Versions diffs - 0.8.9.2__py3-none-any.whl → 0.8.9.10__py3-none-any.whl - Mend

endoreg-db 0.8.9.2py3-none-any.whl → 0.8.9.10py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of endoreg-db might be problematic. Click here for more details.

Files changed (450) hide show

endoreg_db/admin.py +10 -5
endoreg_db/apps.py +4 -7
endoreg_db/authz/auth.py +1 -0
endoreg_db/authz/backends.py +1 -1
endoreg_db/authz/management/commands/list_routes.py +2 -0
endoreg_db/authz/middleware.py +8 -7
endoreg_db/authz/permissions.py +21 -10
endoreg_db/authz/policy.py +14 -19
endoreg_db/authz/views_auth.py +14 -10
endoreg_db/codemods/rename_datetime_fields.py +8 -1
endoreg_db/exceptions.py +5 -2
endoreg_db/forms/__init__.py +0 -1
endoreg_db/forms/examination_form.py +4 -3
endoreg_db/forms/patient_finding_intervention_form.py +30 -8
endoreg_db/forms/patient_form.py +9 -13
endoreg_db/forms/questionnaires/__init__.py +1 -1
endoreg_db/forms/settings/__init__.py +4 -1
endoreg_db/forms/unit.py +2 -1
endoreg_db/helpers/count_db.py +17 -14
endoreg_db/helpers/default_objects.py +2 -1
endoreg_db/helpers/download_segmentation_model.py +4 -3
endoreg_db/helpers/interact.py +0 -5
endoreg_db/helpers/test_video_helper.py +33 -25
endoreg_db/import_files/__init__.py +1 -1
endoreg_db/import_files/context/__init__.py +1 -1
endoreg_db/import_files/context/default_sensitive_meta.py +11 -9
endoreg_db/import_files/context/ensure_center.py +4 -4
endoreg_db/import_files/context/file_lock.py +3 -3
endoreg_db/import_files/context/import_context.py +11 -12
endoreg_db/import_files/context/validate_directories.py +1 -0
endoreg_db/import_files/file_storage/create_report_file.py +57 -34
endoreg_db/import_files/file_storage/create_video_file.py +64 -35
endoreg_db/import_files/file_storage/sensitive_meta_storage.py +5 -2
endoreg_db/import_files/file_storage/state_management.py +89 -122
endoreg_db/import_files/file_storage/storage.py +5 -1
endoreg_db/import_files/processing/report_processing/report_anonymization.py +24 -19
endoreg_db/import_files/processing/sensitive_meta_adapter.py +3 -3
endoreg_db/import_files/processing/video_processing/video_anonymization.py +18 -18
endoreg_db/import_files/pseudonymization/k_anonymity.py +8 -9
endoreg_db/import_files/pseudonymization/k_pseudonymity.py +16 -5
endoreg_db/import_files/report_import_service.py +36 -30
endoreg_db/import_files/video_import_service.py +27 -23
endoreg_db/logger_conf.py +56 -40
endoreg_db/management/__init__.py +1 -1
endoreg_db/management/commands/__init__.py +1 -1
endoreg_db/management/commands/check_auth.py +45 -38
endoreg_db/management/commands/create_model_meta_from_huggingface.py +53 -2
endoreg_db/management/commands/create_multilabel_model_meta.py +54 -19
endoreg_db/management/commands/fix_missing_patient_data.py +105 -71
endoreg_db/management/commands/fix_video_paths.py +75 -54
endoreg_db/management/commands/import_report.py +1 -3
endoreg_db/management/commands/list_routes.py +2 -0
endoreg_db/management/commands/load_ai_model_data.py +8 -2
endoreg_db/management/commands/load_ai_model_label_data.py +0 -1
endoreg_db/management/commands/load_center_data.py +3 -3
endoreg_db/management/commands/load_distribution_data.py +35 -38
endoreg_db/management/commands/load_endoscope_data.py +0 -3
endoreg_db/management/commands/load_examination_data.py +20 -4
endoreg_db/management/commands/load_finding_data.py +18 -3
endoreg_db/management/commands/load_gender_data.py +17 -24
endoreg_db/management/commands/load_green_endoscopy_wuerzburg_data.py +95 -85
endoreg_db/management/commands/load_information_source.py +0 -3
endoreg_db/management/commands/load_lab_value_data.py +14 -3
endoreg_db/management/commands/load_legacy_data.py +303 -0
endoreg_db/management/commands/load_name_data.py +1 -2
endoreg_db/management/commands/load_pdf_type_data.py +4 -8
endoreg_db/management/commands/load_profession_data.py +0 -1
endoreg_db/management/commands/load_report_reader_flag_data.py +0 -4
endoreg_db/management/commands/load_requirement_data.py +6 -2
endoreg_db/management/commands/load_unit_data.py +0 -4
endoreg_db/management/commands/load_user_groups.py +5 -7
endoreg_db/management/commands/model_input.py +169 -0
endoreg_db/management/commands/register_ai_model.py +22 -16
endoreg_db/management/commands/setup_endoreg_db.py +110 -32
endoreg_db/management/commands/storage_management.py +14 -8
endoreg_db/management/commands/summarize_db_content.py +154 -63
endoreg_db/management/commands/train_image_multilabel_model.py +144 -0
endoreg_db/management/commands/validate_video_files.py +82 -50
endoreg_db/management/commands/video_validation.py +4 -6
endoreg_db/migrations/0001_initial.py +112 -63
endoreg_db/models/__init__.py +8 -0
endoreg_db/models/administration/ai/active_model.py +5 -5
endoreg_db/models/administration/ai/ai_model.py +41 -18
endoreg_db/models/administration/ai/model_type.py +1 -0
endoreg_db/models/administration/case/case.py +22 -22
endoreg_db/models/administration/center/__init__.py +5 -5
endoreg_db/models/administration/center/center.py +6 -2
endoreg_db/models/administration/center/center_resource.py +18 -4
endoreg_db/models/administration/center/center_shift.py +3 -1
endoreg_db/models/administration/center/center_waste.py +6 -2
endoreg_db/models/administration/person/__init__.py +1 -1
endoreg_db/models/administration/person/employee/__init__.py +1 -1
endoreg_db/models/administration/person/employee/employee_type.py +3 -1
endoreg_db/models/administration/person/examiner/__init__.py +1 -1
endoreg_db/models/administration/person/examiner/examiner.py +10 -2
endoreg_db/models/administration/person/names/first_name.py +6 -4
endoreg_db/models/administration/person/names/last_name.py +4 -3
endoreg_db/models/administration/person/patient/__init__.py +1 -1
endoreg_db/models/administration/person/patient/patient.py +0 -1
endoreg_db/models/administration/person/patient/patient_external_id.py +0 -1
endoreg_db/models/administration/person/person.py +1 -1
endoreg_db/models/administration/product/__init__.py +7 -6
endoreg_db/models/administration/product/product.py +6 -2
endoreg_db/models/administration/product/product_group.py +9 -7
endoreg_db/models/administration/product/product_material.py +9 -2
endoreg_db/models/administration/product/reference_product.py +64 -15
endoreg_db/models/administration/qualification/qualification.py +3 -1
endoreg_db/models/administration/shift/shift.py +3 -1
endoreg_db/models/administration/shift/shift_type.py +12 -4
endoreg_db/models/aidataset/__init__.py +5 -0
endoreg_db/models/aidataset/aidataset.py +193 -0
endoreg_db/models/label/__init__.py +1 -1
endoreg_db/models/label/label.py +10 -2
endoreg_db/models/label/label_set.py +3 -1
endoreg_db/models/label/label_video_segment/_create_from_video.py +6 -2
endoreg_db/models/label/label_video_segment/label_video_segment.py +148 -44
endoreg_db/models/media/__init__.py +12 -5
endoreg_db/models/media/frame/__init__.py +1 -1
endoreg_db/models/media/frame/frame.py +34 -8
endoreg_db/models/media/pdf/__init__.py +2 -1
endoreg_db/models/media/pdf/raw_pdf.py +11 -4
endoreg_db/models/media/pdf/report_file.py +6 -2
endoreg_db/models/media/pdf/report_reader/__init__.py +3 -3
endoreg_db/models/media/pdf/report_reader/report_reader_flag.py +15 -5
endoreg_db/models/media/video/create_from_file.py +20 -41
endoreg_db/models/media/video/pipe_1.py +75 -30
endoreg_db/models/media/video/pipe_2.py +37 -12
endoreg_db/models/media/video/video_file.py +36 -24
endoreg_db/models/media/video/video_file_ai.py +235 -70
endoreg_db/models/media/video/video_file_anonymize.py +240 -65
endoreg_db/models/media/video/video_file_frames/_bulk_create_frames.py +6 -1
endoreg_db/models/media/video/video_file_frames/_create_frame_object.py +3 -1
endoreg_db/models/media/video/video_file_frames/_delete_frames.py +30 -9
endoreg_db/models/media/video/video_file_frames/_extract_frames.py +95 -29
endoreg_db/models/media/video/video_file_frames/_get_frame.py +13 -3
endoreg_db/models/media/video/video_file_frames/_get_frame_path.py +4 -1
endoreg_db/models/media/video/video_file_frames/_get_frame_paths.py +15 -3
endoreg_db/models/media/video/video_file_frames/_get_frame_range.py +15 -3
endoreg_db/models/media/video/video_file_frames/_get_frames.py +7 -2
endoreg_db/models/media/video/video_file_frames/_initialize_frames.py +109 -23
endoreg_db/models/media/video/video_file_frames/_manage_frame_range.py +111 -27
endoreg_db/models/media/video/video_file_frames/_mark_frames_extracted_status.py +46 -13
endoreg_db/models/media/video/video_file_io.py +85 -33
endoreg_db/models/media/video/video_file_meta/__init__.py +6 -6
endoreg_db/models/media/video/video_file_meta/get_crop_template.py +17 -4
endoreg_db/models/media/video/video_file_meta/get_endo_roi.py +28 -7
endoreg_db/models/media/video/video_file_meta/get_fps.py +46 -13
endoreg_db/models/media/video/video_file_meta/initialize_video_specs.py +81 -20
endoreg_db/models/media/video/video_file_meta/text_meta.py +61 -20
endoreg_db/models/media/video/video_file_meta/video_meta.py +40 -12
endoreg_db/models/media/video/video_file_segments.py +118 -27
endoreg_db/models/media/video/video_metadata.py +25 -6
endoreg_db/models/media/video/video_processing.py +54 -15
endoreg_db/models/medical/__init__.py +3 -13
endoreg_db/models/medical/contraindication/__init__.py +3 -1
endoreg_db/models/medical/disease.py +18 -6
endoreg_db/models/medical/event.py +6 -2
endoreg_db/models/medical/examination/__init__.py +5 -1
endoreg_db/models/medical/examination/examination.py +22 -6
endoreg_db/models/medical/examination/examination_indication.py +23 -7
endoreg_db/models/medical/examination/examination_time.py +6 -2
endoreg_db/models/medical/finding/__init__.py +3 -1
endoreg_db/models/medical/finding/finding.py +37 -12
endoreg_db/models/medical/finding/finding_classification.py +27 -8
endoreg_db/models/medical/finding/finding_intervention.py +19 -6
endoreg_db/models/medical/finding/finding_type.py +3 -1
endoreg_db/models/medical/hardware/__init__.py +1 -1
endoreg_db/models/medical/hardware/endoscope.py +14 -2
endoreg_db/models/medical/laboratory/__init__.py +1 -1
endoreg_db/models/medical/laboratory/lab_value.py +139 -39
endoreg_db/models/medical/medication/__init__.py +7 -3
endoreg_db/models/medical/medication/medication.py +3 -1
endoreg_db/models/medical/medication/medication_indication.py +3 -1
endoreg_db/models/medical/medication/medication_indication_type.py +11 -3
endoreg_db/models/medical/medication/medication_intake_time.py +3 -1
endoreg_db/models/medical/medication/medication_schedule.py +3 -1
endoreg_db/models/medical/patient/__init__.py +2 -10
endoreg_db/models/medical/patient/medication_examples.py +3 -14
endoreg_db/models/medical/patient/patient_disease.py +17 -5
endoreg_db/models/medical/patient/patient_event.py +12 -4
endoreg_db/models/medical/patient/patient_examination.py +52 -15
endoreg_db/models/medical/patient/patient_examination_indication.py +15 -4
endoreg_db/models/medical/patient/patient_finding.py +105 -29
endoreg_db/models/medical/patient/patient_finding_classification.py +41 -12
endoreg_db/models/medical/patient/patient_finding_intervention.py +11 -3
endoreg_db/models/medical/patient/patient_lab_sample.py +6 -2
endoreg_db/models/medical/patient/patient_lab_value.py +42 -10
endoreg_db/models/medical/patient/patient_medication.py +25 -7
endoreg_db/models/medical/patient/patient_medication_schedule.py +34 -10
endoreg_db/models/metadata/model_meta.py +40 -12
endoreg_db/models/metadata/model_meta_logic.py +51 -16
endoreg_db/models/metadata/sensitive_meta.py +65 -28
endoreg_db/models/metadata/sensitive_meta_logic.py +28 -26
endoreg_db/models/metadata/video_meta.py +146 -39
endoreg_db/models/metadata/video_prediction_logic.py +70 -21
endoreg_db/models/metadata/video_prediction_meta.py +80 -27
endoreg_db/models/operation_log.py +63 -0
endoreg_db/models/other/__init__.py +10 -10
endoreg_db/models/other/distribution/__init__.py +9 -7
endoreg_db/models/other/distribution/base_value_distribution.py +3 -1
endoreg_db/models/other/distribution/date_value_distribution.py +19 -5
endoreg_db/models/other/distribution/multiple_categorical_value_distribution.py +3 -1
endoreg_db/models/other/distribution/numeric_value_distribution.py +34 -9
endoreg_db/models/other/emission/__init__.py +1 -1
endoreg_db/models/other/emission/emission_factor.py +9 -3
endoreg_db/models/other/information_source.py +15 -5
endoreg_db/models/other/material.py +3 -1
endoreg_db/models/other/transport_route.py +3 -1
endoreg_db/models/other/unit.py +6 -2
endoreg_db/models/report/report.py +0 -1
endoreg_db/models/requirement/requirement.py +84 -27
endoreg_db/models/requirement/requirement_error.py +5 -6
endoreg_db/models/requirement/requirement_evaluation/__init__.py +1 -1
endoreg_db/models/requirement/requirement_evaluation/evaluate_with_dependencies.py +8 -8
endoreg_db/models/requirement/requirement_evaluation/get_values.py +3 -3
endoreg_db/models/requirement/requirement_evaluation/requirement_type_parser.py +24 -8
endoreg_db/models/requirement/requirement_operator.py +28 -8
endoreg_db/models/requirement/requirement_set.py +34 -11
endoreg_db/models/state/__init__.py +1 -0
endoreg_db/models/state/audit_ledger.py +9 -2
endoreg_db/models/{media → state}/processing_history/__init__.py +1 -3
endoreg_db/models/state/processing_history/processing_history.py +136 -0
endoreg_db/models/state/raw_pdf.py +0 -1
endoreg_db/models/state/video.py +2 -4
endoreg_db/models/utils.py +4 -2
endoreg_db/queries/__init__.py +2 -6
endoreg_db/queries/annotations/__init__.py +1 -3
endoreg_db/queries/annotations/legacy.py +37 -26
endoreg_db/root_urls.py +3 -4
endoreg_db/schemas/examination_evaluation.py +3 -0
endoreg_db/serializers/Frames_NICE_and_PARIS_classifications.py +249 -163
endoreg_db/serializers/__init__.py +2 -8
endoreg_db/serializers/administration/__init__.py +1 -2
endoreg_db/serializers/administration/ai/__init__.py +0 -1
endoreg_db/serializers/administration/ai/active_model.py +3 -1
endoreg_db/serializers/administration/ai/ai_model.py +5 -3
endoreg_db/serializers/administration/ai/model_type.py +3 -1
endoreg_db/serializers/administration/center.py +7 -2
endoreg_db/serializers/administration/gender.py +4 -2
endoreg_db/serializers/anonymization.py +13 -13
endoreg_db/serializers/evaluation/examination_evaluation.py +0 -1
endoreg_db/serializers/examination/__init__.py +1 -1
endoreg_db/serializers/examination/base.py +12 -13
endoreg_db/serializers/examination/dropdown.py +6 -7
endoreg_db/serializers/examination_serializer.py +3 -6
endoreg_db/serializers/finding/__init__.py +1 -1
endoreg_db/serializers/finding/finding.py +14 -7
endoreg_db/serializers/finding_classification/__init__.py +3 -3
endoreg_db/serializers/finding_classification/choice.py +3 -3
endoreg_db/serializers/finding_classification/classification.py +2 -4
endoreg_db/serializers/label_video_segment/__init__.py +5 -3
endoreg_db/serializers/{label → label_video_segment}/image_classification_annotation.py +5 -5
endoreg_db/serializers/label_video_segment/label/__init__.py +6 -0
endoreg_db/serializers/{label → label_video_segment/label}/label.py +1 -1
endoreg_db/serializers/label_video_segment/label_video_segment.py +338 -228
endoreg_db/serializers/meta/__init__.py +1 -2
endoreg_db/serializers/meta/sensitive_meta_detail.py +28 -13
endoreg_db/serializers/meta/sensitive_meta_update.py +51 -46
endoreg_db/serializers/meta/sensitive_meta_verification.py +19 -16
endoreg_db/serializers/misc/__init__.py +2 -2
endoreg_db/serializers/misc/file_overview.py +11 -7
endoreg_db/serializers/misc/stats.py +10 -8
endoreg_db/serializers/misc/translatable_field_mix_in.py +6 -6
endoreg_db/serializers/misc/upload_job.py +32 -29
endoreg_db/serializers/patient/__init__.py +2 -1
endoreg_db/serializers/patient/patient.py +32 -15
endoreg_db/serializers/patient/patient_dropdown.py +11 -3
endoreg_db/serializers/patient_examination/__init__.py +1 -1
endoreg_db/serializers/patient_examination/patient_examination.py +67 -40
endoreg_db/serializers/patient_finding/__init__.py +1 -1
endoreg_db/serializers/patient_finding/patient_finding.py +2 -1
endoreg_db/serializers/patient_finding/patient_finding_classification.py +17 -9
endoreg_db/serializers/patient_finding/patient_finding_detail.py +26 -17
endoreg_db/serializers/patient_finding/patient_finding_intervention.py +7 -5
endoreg_db/serializers/patient_finding/patient_finding_list.py +10 -11
endoreg_db/serializers/patient_finding/patient_finding_write.py +36 -27
endoreg_db/serializers/pdf/__init__.py +1 -3
endoreg_db/serializers/requirements/requirement_schema.py +1 -6
endoreg_db/serializers/sensitive_meta_serializer.py +100 -81
endoreg_db/serializers/video/__init__.py +2 -2
endoreg_db/serializers/video/{segmentation.py → video_file.py} +66 -47
endoreg_db/serializers/video/video_file_brief.py +6 -2
endoreg_db/serializers/video/video_file_detail.py +36 -23
endoreg_db/serializers/video/video_file_list.py +4 -2
endoreg_db/serializers/video/video_processing_history.py +54 -50
endoreg_db/services/__init__.py +1 -1
endoreg_db/services/anonymization.py +2 -2
endoreg_db/services/examination_evaluation.py +40 -17
endoreg_db/services/model_meta_from_hf.py +76 -0
endoreg_db/services/polling_coordinator.py +101 -70
endoreg_db/services/pseudonym_service.py +27 -22
endoreg_db/services/report_import.py +6 -3
endoreg_db/services/segment_sync.py +75 -59
endoreg_db/services/video_import.py +6 -7
endoreg_db/urls/__init__.py +2 -2
endoreg_db/urls/ai.py +7 -25
endoreg_db/urls/anonymization.py +61 -15
endoreg_db/urls/auth.py +4 -4
endoreg_db/urls/classification.py +4 -9
endoreg_db/urls/examination.py +27 -18
endoreg_db/urls/media.py +27 -34
endoreg_db/urls/patient.py +11 -7
endoreg_db/urls/requirements.py +3 -1
endoreg_db/urls/root_urls.py +2 -3
endoreg_db/urls/stats.py +24 -16
endoreg_db/urls/upload.py +3 -11
endoreg_db/utils/__init__.py +14 -15
endoreg_db/utils/ai/__init__.py +1 -1
endoreg_db/utils/ai/data_loader_for_model_input.py +262 -0
endoreg_db/utils/ai/data_loader_for_model_training.py +262 -0
endoreg_db/utils/ai/get.py +2 -1
endoreg_db/utils/ai/inference_dataset.py +14 -15
endoreg_db/utils/ai/model_training/config.py +117 -0
endoreg_db/utils/ai/model_training/dataset.py +74 -0
endoreg_db/utils/ai/model_training/losses.py +68 -0
endoreg_db/utils/ai/model_training/metrics.py +78 -0
endoreg_db/utils/ai/model_training/model_backbones.py +155 -0
endoreg_db/utils/ai/model_training/model_gastronet_resnet.py +118 -0
endoreg_db/utils/ai/model_training/trainer_gastronet_multilabel.py +771 -0
endoreg_db/utils/ai/multilabel_classification_net.py +21 -6
endoreg_db/utils/ai/predict.py +4 -4
endoreg_db/utils/ai/preprocess.py +19 -11
endoreg_db/utils/calc_duration_seconds.py +4 -4
endoreg_db/utils/case_generator/lab_sample_factory.py +3 -4
endoreg_db/utils/check_video_files.py +74 -47
endoreg_db/utils/cropping.py +10 -9
endoreg_db/utils/dataloader.py +11 -3
endoreg_db/utils/dates.py +3 -4
endoreg_db/utils/defaults/set_default_center.py +7 -6
endoreg_db/utils/env.py +6 -2
endoreg_db/utils/extract_specific_frames.py +24 -9
endoreg_db/utils/file_operations.py +30 -18
endoreg_db/utils/fix_video_path_direct.py +57 -41
endoreg_db/utils/frame_anonymization_utils.py +157 -157
endoreg_db/utils/hashs.py +3 -18
endoreg_db/utils/links/requirement_link.py +96 -52
endoreg_db/utils/ocr.py +30 -25
endoreg_db/utils/operation_log.py +61 -0
endoreg_db/utils/parse_and_generate_yaml.py +12 -13
endoreg_db/utils/paths.py +6 -6
endoreg_db/utils/permissions.py +40 -24
endoreg_db/utils/pipelines/process_video_dir.py +50 -26
endoreg_db/utils/product/sum_emissions.py +5 -3
endoreg_db/utils/product/sum_weights.py +4 -2
endoreg_db/utils/pydantic_models/__init__.py +3 -4
endoreg_db/utils/requirement_operator_logic/_old/lab_value_operators.py +207 -107
endoreg_db/utils/requirement_operator_logic/_old/model_evaluators.py +252 -65
endoreg_db/utils/requirement_operator_logic/new_operator_logic.py +27 -10
endoreg_db/utils/setup_config.py +21 -5
endoreg_db/utils/storage.py +3 -1
endoreg_db/utils/translation.py +19 -15
endoreg_db/utils/uuid.py +1 -0
endoreg_db/utils/validate_endo_roi.py +12 -4
endoreg_db/utils/validate_subcategory_dict.py +26 -24
endoreg_db/utils/validate_video_detailed.py +207 -149
endoreg_db/utils/video/__init__.py +7 -3
endoreg_db/utils/video/extract_frames.py +30 -18
endoreg_db/utils/video/names.py +11 -6
endoreg_db/utils/video/streaming_processor.py +175 -101
endoreg_db/utils/video/video_splitter.py +30 -19
endoreg_db/views/Frames_NICE_and_PARIS_classifications_views.py +59 -50
endoreg_db/views/__init__.py +0 -20
endoreg_db/views/anonymization/__init__.py +6 -2
endoreg_db/views/anonymization/media_management.py +2 -6
endoreg_db/views/anonymization/overview.py +34 -1
endoreg_db/views/anonymization/validate.py +79 -18
endoreg_db/views/auth/__init__.py +1 -1
endoreg_db/views/auth/keycloak.py +16 -14
endoreg_db/views/examination/__init__.py +12 -15
endoreg_db/views/examination/examination.py +5 -5
endoreg_db/views/examination/examination_manifest_cache.py +5 -5
endoreg_db/views/examination/get_finding_classification_choices.py +8 -5
endoreg_db/views/examination/get_finding_classifications.py +9 -7
endoreg_db/views/examination/get_findings.py +8 -10
endoreg_db/views/examination/get_instruments.py +3 -2
endoreg_db/views/examination/get_interventions.py +1 -1
endoreg_db/views/finding/__init__.py +2 -2
endoreg_db/views/finding/finding.py +58 -54
endoreg_db/views/finding/get_classifications.py +1 -1
endoreg_db/views/finding/get_interventions.py +1 -1
endoreg_db/views/finding_classification/__init__.py +5 -5
endoreg_db/views/finding_classification/finding_classification.py +5 -6
endoreg_db/views/finding_classification/get_classification_choices.py +3 -4
endoreg_db/views/media/__init__.py +13 -13
endoreg_db/views/media/pdf_media.py +9 -9
endoreg_db/views/media/sensitive_metadata.py +10 -7
endoreg_db/views/media/video_media.py +4 -4
endoreg_db/views/meta/__init__.py +1 -1
endoreg_db/views/meta/sensitive_meta_list.py +20 -22
endoreg_db/views/meta/sensitive_meta_verification.py +14 -11
endoreg_db/views/misc/__init__.py +6 -34
endoreg_db/views/misc/center.py +2 -1
endoreg_db/views/misc/csrf.py +2 -1
endoreg_db/views/misc/gender.py +2 -1
endoreg_db/views/misc/stats.py +141 -106
endoreg_db/views/patient/__init__.py +1 -3
endoreg_db/views/patient/patient.py +141 -99
endoreg_db/views/patient_examination/__init__.py +5 -5
endoreg_db/views/patient_examination/patient_examination.py +43 -42
endoreg_db/views/patient_examination/patient_examination_create.py +10 -15
endoreg_db/views/patient_examination/patient_examination_detail.py +12 -15
endoreg_db/views/patient_examination/patient_examination_list.py +21 -17
endoreg_db/views/patient_examination/video.py +114 -80
endoreg_db/views/patient_finding/__init__.py +1 -1
endoreg_db/views/patient_finding/patient_finding.py +17 -10
endoreg_db/views/patient_finding/patient_finding_optimized.py +127 -95
endoreg_db/views/patient_finding_classification/__init__.py +1 -1
endoreg_db/views/patient_finding_classification/pfc_create.py +35 -27
endoreg_db/views/report/reimport.py +1 -1
endoreg_db/views/report/report_stream.py +5 -8
endoreg_db/views/requirement/__init__.py +2 -1
endoreg_db/views/requirement/evaluate.py +7 -9
endoreg_db/views/requirement/lookup.py +2 -3
endoreg_db/views/requirement/lookup_store.py +0 -1
endoreg_db/views/requirement/requirement_utils.py +2 -4
endoreg_db/views/stats/__init__.py +4 -4
endoreg_db/views/stats/stats_views.py +152 -115
endoreg_db/views/video/__init__.py +18 -27
endoreg_db/views/{ai → video/ai}/__init__.py +2 -2
endoreg_db/views/{ai → video/ai}/label.py +20 -16
endoreg_db/views/video/correction.py +5 -6
endoreg_db/views/video/reimport.py +134 -99
endoreg_db/views/video/segments_crud.py +134 -44
endoreg_db/views/video/video_apply_mask.py +13 -12
endoreg_db/views/video/video_correction.py +2 -1
endoreg_db/views/video/video_download_processed.py +15 -15
endoreg_db/views/video/video_meta_stats.py +7 -6
endoreg_db/views/video/video_processing_history.py +3 -2
endoreg_db/views/video/video_remove_frames.py +13 -12
endoreg_db/views/video/video_stream.py +110 -82
{endoreg_db-0.8.9.2.dist-info → endoreg_db-0.8.9.10.dist-info}/METADATA +9 -3
{endoreg_db-0.8.9.2.dist-info → endoreg_db-0.8.9.10.dist-info}/RECORD +434 -431
endoreg_db/management/commands/import_fallback_video.py +0 -203
endoreg_db/management/commands/import_video.py +0 -422
endoreg_db/management/commands/import_video_with_classification.py +0 -367
endoreg_db/models/media/processing_history/processing_history.py +0 -96
endoreg_db/serializers/label/__init__.py +0 -7
endoreg_db/serializers/label_video_segment/_lvs_create.py +0 -149
endoreg_db/serializers/label_video_segment/_lvs_update.py +0 -138
endoreg_db/serializers/label_video_segment/_lvs_validate.py +0 -149
endoreg_db/serializers/label_video_segment/label_video_segment_annotation.py +0 -99
endoreg_db/serializers/label_video_segment/label_video_segment_update.py +0 -163
endoreg_db/services/__old/pdf_import.py +0 -1487
endoreg_db/services/__old/video_import.py +0 -1306
endoreg_db/tasks/upload_tasks.py +0 -216
endoreg_db/tasks/video_ingest.py +0 -161
endoreg_db/tasks/video_processing_tasks.py +0 -327
endoreg_db/views/misc/translation.py +0 -182
{endoreg_db-0.8.9.2.dist-info → endoreg_db-0.8.9.10.dist-info}/WHEEL +0 -0
{endoreg_db-0.8.9.2.dist-info → endoreg_db-0.8.9.10.dist-info}/licenses/LICENSE +0 -0

endoreg_db/utils/ai/model_training/trainer_gastronet_multilabel.py ADDED Viewed

@@ -0,0 +1,771 @@
+# endoreg_db/utils/ai/model_training/trainer_gastronet_multilabel.py
+from __future__ import annotations
+import json
+import random
+from pathlib import Path
+from typing import Dict, List, Optional, Sequence, Tuple
+import torch
+from torch.utils.data import DataLoader
+from torch.optim.lr_scheduler import CosineAnnealingLR
+from django.db import models
+from endoreg_db.models import AIDataSet
+from endoreg_db.utils.ai.data_loader_for_model_input import build_dataset_for_training
+from endoreg_db.utils.ai.model_training.config import (
+    TrainingConfig,
+    RUNS_DIR,
+)
+from endoreg_db.utils.ai.model_training.dataset import EndoMultiLabelDataset
+from endoreg_db.utils.ai.model_training.losses import (
+    compute_class_weights,
+    focal_loss_with_mask,
+)
+from endoreg_db.utils.ai.model_training.metrics import compute_metrics
+from endoreg_db.utils.ai.model_training.model_backbones import (
+    create_multilabel_model,
+)
+# ---------------------------------------------------------------------
+# HELPER: FILTER LABELS BY LABELSET VERSION
+# ---------------------------------------------------------------------
+def filter_labels_by_labelset_version(
+    labels: Sequence[models.Model],
+    label_vectors: Sequence[Sequence[Optional[int]]],
+    label_masks: Sequence[Sequence[int]],
+    target_version: int,
+) -> Tuple[
+    List[List[Optional[int]]],
+    List[List[int]],
+    List[models.Model],
+    List[int],
+]:
+    """
+    From the full label list + vectors, keep ONLY those labels that belong
+    to ANY LabelSet with version == target_version.
+    labels:        list[Label]
+    label_vectors: list[list[0/1/None]] (len = N samples)
+    label_masks:   list[list[0/1]]      (len = N samples)
+    target_version: integer LabelSet.version to filter by.
+    Returns:
+        filtered_label_vectors,
+        filtered_label_masks,
+        filtered_labels,
+        kept_indices (original label indices kept)
+    """
+    kept_indices: List[int] = []
+    for idx, lbl in enumerate(labels):
+        # lbl.label_sets is the M2M relation "LabelSet.labels"
+        if lbl.label_sets.filter(version=target_version).exists():
+            kept_indices.append(idx)
+    if not kept_indices:
+        raise ValueError(
+            f"No labels in this dataset belong to any LabelSet with version={target_version}. "
+            "Check your LabelSet configuration or change labelset_version_to_train "
+            "in config.py."
+        )
+    # Slice vectors + masks to keep only the chosen label indices
+    filtered_vectors: List[List[Optional[int]]] = []
+    filtered_masks: List[List[int]] = []
+    for vec, mask in zip(label_vectors, label_masks):
+        new_vec = [vec[j] for j in kept_indices]
+        new_mask = [mask[j] for j in kept_indices]
+        filtered_vectors.append(new_vec)
+        filtered_masks.append(new_mask)
+    filtered_labels = [labels[j] for j in kept_indices]
+    return filtered_vectors, filtered_masks, filtered_labels, kept_indices
+# ---------------------------------------------------------------------
+# GROUP-WISE SPLIT BY old_examination_id
+# ---------------------------------------------------------------------
+def groupwise_split_indices_by_examination(
+    frame_ids: Sequence[int],
+    old_examination_ids: Sequence[Optional[int]],
+    val_split: float,
+    test_split: float,
+    seed: int = 42,
+) -> Tuple[List[int], List[int], List[int]]:
+    """
+    Split sample indices into train / val / test based on old_examination_id.
+    All frames sharing the same old_examination_id go into the same split.
+    If old_examination_id is None, we treat each frame as its own group.
+    Returns:
+        train_indices, val_indices, test_indices
+    """
+    assert len(frame_ids) == len(old_examination_ids)
+    # 1) Build mapping: group_id -> list of sample indices
+    groups: Dict[object, List[int]] = {}
+    for idx, (fid, exam_id) in enumerate(zip(frame_ids, old_examination_ids)):
+        group_key = exam_id if exam_id is not None else f"no_exam_{fid}"
+        groups.setdefault(group_key, []).append(idx)
+    group_ids = list(groups.keys())
+    rng = random.Random(seed)
+    rng.shuffle(group_ids)
+    n_groups = len(group_ids)
+    n_test = int(round(test_split * n_groups))
+    n_val = int(round(val_split * n_groups))
+    n_train = n_groups - n_val - n_test
+    train_group_ids = group_ids[:n_train]
+    val_group_ids = group_ids[n_train : n_train + n_val]
+    test_group_ids = group_ids[n_train + n_val :]
+    train_indices: List[int] = []
+    val_indices: List[int] = []
+    test_indices: List[int] = []
+    for gid in train_group_ids:
+        train_indices.extend(groups[gid])
+    for gid in val_group_ids:
+        val_indices.extend(groups[gid])
+    for gid in test_group_ids:
+        test_indices.extend(groups[gid])
+    # Sort indices for reproducibility
+    train_indices.sort()
+    val_indices.sort()
+    test_indices.sort()
+    print(
+        f"[TRAIN] Group-wise split by old_examination_id: "
+        f"#groups={n_groups}, train_groups={len(train_group_ids)}, "
+        f"val_groups={len(val_group_ids)}, test_groups={len(test_group_ids)}"
+    )
+    return train_indices, val_indices, test_indices
+# ---------------------------------------------------------------------
+# MAIN TRAINING FUNCTION
+# ---------------------------------------------------------------------
+def train_gastronet_multilabel(config: TrainingConfig) -> Dict:
+    """
+    High-level training entry point.
+    Pipeline:
+      1. Load AIDataSet from DB and build raw dataset via build_dataset_for_training.
+      2. Filter labels by LabelSet.version == config.labelset_version_to_train.
+      3. Optionally convert unlabeled → negative (Option A).
+      4. Compute dataset statistics (positives per label, etc.).
+      5. Group-wise split by old_examination_id into train/val/test.
+      6. Wrap in PyTorch Dataset + DataLoaders.
+      7. Build GastroNet-ResNet50 backbone + new head.
+      8. Train with focal loss + class weights (+ mask).
+      9. LR schedule: warm-up + cosine decay (if enabled).
+     10. Save model + metadata in model_training/runs.
+    """
+    # ------------------------------------------------------------------
+    # 1. Load dataset from DB
+    # ------------------------------------------------------------------
+    dataset_obj = AIDataSet.objects.get(id=config.dataset_id)
+    data = build_dataset_for_training(dataset_obj)
+    image_paths: List[str] = data["image_paths"]
+    label_vectors: List[List[Optional[int]]] = data["label_vectors"]
+    label_masks: List[List[int]] = data["label_masks"]
+    labels = data["labels"]  # list[Label]
+    labelset = data["labelset"]
+    frame_ids: List[int] = data.get("frame_ids", [])
+    old_exam_ids: List[Optional[int]] = data.get("old_examination_ids", [])
+    num_samples_raw = len(image_paths)
+    num_labels_raw = len(labels)
+    print(f"[TRAIN] AIDataSet id={dataset_obj.id}")
+    print(
+        f"[TRAIN] #samples (raw) = {num_samples_raw}, #labels (raw) = {num_labels_raw}"
+    )
+    print(
+        f"[TRAIN] LabelSet id={labelset.id}, "
+        f"name={labelset.name}, version={labelset.version}"
+    )
+    print("[TRAIN] Labels (raw):")
+    for idx, lbl in enumerate(labels):
+        print(f"    [{idx}] {lbl.name}")
+    # ------------------------------------------------------------------
+    # 2. Filter labels by LabelSet.version == config.labelset_version_to_train
+    # ------------------------------------------------------------------
+    target_version = config.labelset_version_to_train
+    print(
+        f"[TRAIN] Filtering labels to those belonging to ANY LabelSet with version={target_version}..."
+    )
+    (
+        label_vectors,
+        label_masks,
+        labels,
+        kept_indices,
+    ) = filter_labels_by_labelset_version(
+        labels=labels,
+        label_vectors=label_vectors,
+        label_masks=label_masks,
+        target_version=target_version,
+    )
+    num_labels_filtered = len(labels)
+    print(
+        f"[TRAIN] Label filtering done. "
+        f"Kept {num_labels_filtered} / {num_labels_raw} labels."
+    )
+    print("[TRAIN] Kept labels (new index -> original index -> name):")
+    for new_idx, orig_idx in enumerate(kept_indices):
+        print(f"    [{new_idx}] (orig {orig_idx}) {labels[new_idx].name}")
+    # ------------------------------------------------------------------
+    # 2b. OPTION A: treat UNLABELED v2 labels as NEGATIVE (0) + KNOWN
+    # ------------------------------------------------------------------
+    # After filtering to the target version, we decide how to interpret
+    # unlabeled entries:
+    #
+    # If treat_unlabeled_as_negative == True:
+    #   vec[j] == 1   -> positive, mask[j] = 1
+    #   vec[j] is None -> assume 0 (negative), mask[j] = 1
+    #
+    # If False:
+    #   vec[j] is None -> value 0, but mask[j] = 0 (ignored)
+    #
+    # In your current setup you want Option A (True).
+    if config.treat_unlabeled_as_negative:
+        for i in range(len(label_vectors)):
+            vec = label_vectors[i]
+            mask = label_masks[i]
+            new_vec = []
+            new_mask = []
+            for x in vec:
+                if x is None:
+                    # unlabeled -> assume negative but KNOWN
+                    new_vec.append(0)
+                    new_mask.append(1)
+                else:
+                    # explicit label (1 or 0) -> keep value, mark as known
+                    new_vec.append(int(x))
+                    new_mask.append(1)
+            label_vectors[i] = new_vec
+            label_masks[i] = new_mask
+    else:
+        # Respect original semantics: None = unknown -> mask=0
+        cleaned_vectors = []
+        cleaned_masks = []
+        for vec, mask in zip(label_vectors, label_masks):
+            v = []
+            m = []
+            for x, ms in zip(vec, mask):
+                if x is None:
+                    v.append(0)  # value won't be used
+                    m.append(0)  # unknown -> ignore in loss/metrics
+                else:
+                    v.append(int(x))  # 0 or 1
+                    m.append(int(ms))
+            cleaned_vectors.append(v)
+            cleaned_masks.append(m)
+        label_vectors = cleaned_vectors
+        label_masks = cleaned_masks
+    # ------------------------------------------------------------------
+    # 3. Dataset statistics AFTER filtering + Option A conversion
+    # ------------------------------------------------------------------
+    labels_arr = []
+    masks_arr = []
+    for vec, mask in zip(label_vectors, label_masks):
+        v = [int(x) for x in vec]  # now guaranteed 0/1
+        m = [int(x) for x in mask]  # typically 1
+        labels_arr.append(v)
+        masks_arr.append(m)
+    labels_tensor = torch.tensor(labels_arr, dtype=torch.float32)
+    masks_tensor = torch.tensor(masks_arr, dtype=torch.float32)
+    total_known = masks_tensor.sum().item()
+    total_pos = (labels_tensor * masks_tensor).sum().item()
+    print("[DEBUG] Dataset statistics AFTER label filtering:")
+    print(f"    #samples           = {len(image_paths)}")
+    print(f"    #labels            = {num_labels_filtered}")
+    print(f"    total known entries= {total_known}")
+    print(f"    total positive labels (over known) = {total_pos}")
+    pos_per_label = (labels_tensor * masks_tensor).sum(dim=0).tolist()
+    print("[DEBUG] Positives per label (index: count):")
+    for idx, c in enumerate(pos_per_label):
+        print(f"    [{idx}] = {int(c)}")
+    # ------------------------------------------------------------------
+    # 4. Group-wise split by old_examination_id (train/val/test)
+    # ------------------------------------------------------------------
+    if not frame_ids or not old_exam_ids:
+        frame_ids = list(range(len(image_paths)))
+        old_exam_ids = [None] * len(image_paths)
+    train_indices, val_indices, test_indices = groupwise_split_indices_by_examination(
+        frame_ids=frame_ids,
+        old_examination_ids=old_exam_ids,
+        val_split=config.val_split,
+        test_split=config.test_split,
+        seed=config.random_seed,
+    )
+    print(
+        f"[TRAIN] Train size: {len(train_indices)}, "
+        f"Val size: {len(val_indices)}, "
+        f"Test size: {len(test_indices)}"
+    )
+    # ------------------------------------------------------------------
+    # 5. Build PyTorch datasets + loaders
+    # ------------------------------------------------------------------
+    full_ds = EndoMultiLabelDataset(
+        image_paths=image_paths,
+        label_vectors=label_vectors,
+        label_masks=label_masks,
+        image_size=224,
+    )
+    def subset_dataset(
+        ds: EndoMultiLabelDataset, indices: List[int]
+    ) -> EndoMultiLabelDataset:
+        sub_image_paths = [ds.image_paths[i] for i in indices]
+        sub_labels = ds.labels[indices]
+        sub_masks = ds.masks[indices]
+        sub_label_vectors = sub_labels.tolist()
+        sub_label_masks = sub_masks.tolist()
+        return EndoMultiLabelDataset(
+            image_paths=sub_image_paths,
+            label_vectors=sub_label_vectors,
+            label_masks=sub_label_masks,
+            image_size=ds.image_size,
+        )
+    train_ds = subset_dataset(full_ds, train_indices)
+    val_ds = subset_dataset(full_ds, val_indices)
+    test_ds = subset_dataset(full_ds, test_indices)
+    train_loader = DataLoader(
+        train_ds,
+        batch_size=config.batch_size,
+        shuffle=True,
+        num_workers=4,
+        pin_memory=True,
+    )
+    val_loader = DataLoader(
+        val_ds,
+        batch_size=config.batch_size,
+        shuffle=False,
+        num_workers=4,
+        pin_memory=True,
+    )
+    test_loader = DataLoader(
+        test_ds,
+        batch_size=config.batch_size,
+        shuffle=False,
+        num_workers=4,
+        pin_memory=True,
+    )
+    # ------------------------------------------------------------------
+    # 6. Build model
+    # ------------------------------------------------------------------
+    if config.device == "auto":
+        device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+    else:
+        device = torch.device(config.device)
+    """backbone_ckpt = (
+        Path(config.backbone_checkpoint)
+        if config.backbone_checkpoint is not None
+        else None
+    )
+    model = GastroNetResNet50MultiLabel(
+        num_labels=num_labels_filtered,
+        backbone_checkpoint=backbone_ckpt,
+        freeze_backbone=True,  # start with head-only training
+    )
+    model.to(device)"""
+    backbone_ckpt = (
+        Path(config.backbone_checkpoint)
+        if config.backbone_checkpoint is not None
+        else None
+    )
+    model = create_multilabel_model(
+        backbone_name=config.backbone_name,
+        num_labels=num_labels_filtered,
+        backbone_checkpoint=backbone_ckpt,
+        freeze_backbone=config.freeze_backbone,
+    )
+    model.to(device)
+    # ------------------------------------------------------------------
+    # 7. Class weights from full (filtered) dataset
+    # ------------------------------------------------------------------
+    class_weights = compute_class_weights(full_ds.labels, full_ds.masks).to(device)
+    print("[TRAIN] Computed class weights per label:", class_weights.cpu().tolist())
+    print(
+        "[DEBUG] class_weights range: "
+        f"min={float(class_weights.min()):.6f}, max={float(class_weights.max()):.6f}"
+    )
+    # ------------------------------------------------------------------
+    # 8. Optimizer + LR SCHEDULER (warm-up + cosine)
+    # ------------------------------------------------------------------
+    head_params = list(model.classifier.parameters())
+    backbone_params = [p for p in model.backbone.parameters() if p.requires_grad]
+    optimizer = torch.optim.AdamW(
+        [
+            {"params": head_params, "lr": config.lr_head},
+            {"params": backbone_params, "lr": config.lr_backbone},
+        ]
+    )
+    # Store base LRs for warm-up
+    base_lrs = [config.lr_head, config.lr_backbone]
+    if config.use_scheduler:
+        total_epochs = config.num_epochs
+        warmup_epochs = max(config.warmup_epochs, 0)
+        # We apply cosine decay AFTER warm-up
+        t_max = max(total_epochs - warmup_epochs, 1)
+        scheduler = CosineAnnealingLR(
+            optimizer,
+            T_max=t_max,
+            eta_min=config.min_lr,
+        )
+        print(
+            f"[LR] Using warm-up + cosine decay: warmup_epochs={warmup_epochs}, "
+            f"T_max={t_max}, min_lr={config.min_lr}"
+        )
+    else:
+        scheduler = None
+        warmup_epochs = 0
+        print("[LR] No LR scheduler used (fixed learning rate).")
+    # ------------------------------------------------------------------
+    # 9. Training loop
+    # ------------------------------------------------------------------
+    history = {"train_loss": [], "val_loss": [], "test_loss": None}
+    # One-time debug of first batch
+    first_batch = next(iter(train_loader))
+    imgs_dbg, y_dbg, m_dbg = first_batch
+    print("[DEBUG] First training batch shapes:")
+    print("    imgs:", imgs_dbg.shape)
+    print("    y:   ", y_dbg.shape)
+    print("    m:   ", m_dbg.shape)
+    print("[DEBUG] First sample labels (y[0]):")
+    print(y_dbg[0].tolist())
+    print("[DEBUG] First sample mask (m[0]):")
+    print(m_dbg[0].tolist())
+    model.eval()
+    with torch.no_grad():
+        logits_dbg = model(imgs_dbg.to(device))
+        probs_dbg = torch.sigmoid(logits_dbg)
+    print("[DEBUG] First sample logits:")
+    print(logits_dbg[0].cpu().tolist())
+    print("[DEBUG] First sample probs (sigmoid):")
+    print(probs_dbg[0].cpu().tolist())
+    for epoch in range(1, config.num_epochs + 1):
+        # ----------------- LR SCHEDULER: warm-up + cosine ----------------
+        if scheduler is not None:
+            if warmup_epochs > 0 and epoch <= warmup_epochs:
+                # Linear warm-up: start from 0 → base_lr over warmup_epochs
+                warmup_factor = epoch / float(warmup_epochs)
+                for i, pg in enumerate(optimizer.param_groups):
+                    pg["lr"] = base_lrs[i] * warmup_factor
+            else:
+                # After warm-up, step cosine scheduler once per epoch
+                scheduler.step()
+            current_lrs = [pg["lr"] for pg in optimizer.param_groups]
+            print(
+                f"[LR] Epoch {epoch:03d}: "
+                f"head_lr={current_lrs[0]:.6g}, backbone_lr={current_lrs[1]:.6g}"
+            )
+        # ----------------- TRAIN PHASE -----------------------------------
+        model.train()
+        train_loss_sum = 0.0
+        train_batches = 0
+        for imgs, y, m in train_loader:
+            imgs = imgs.to(device, non_blocking=True)
+            y = y.to(device, non_blocking=True)
+            m = m.to(device, non_blocking=True)
+            optimizer.zero_grad()
+            logits = model(imgs)
+            loss = focal_loss_with_mask(
+                logits=logits,
+                targets=y,
+                masks=m,
+                class_weights=class_weights,
+                alpha=config.alpha_focal,
+                gamma=config.gamma_focal,
+            )
+            loss.backward()
+            optimizer.step()
+            train_loss_sum += loss.item()
+            train_batches += 1
+        train_loss = train_loss_sum / max(train_batches, 1)
+        history["train_loss"].append(train_loss)
+        # ----------------- VALIDATION PHASE ------------------------------
+        model.eval()
+        val_loss_sum = 0.0
+        val_batches = 0
+        all_val_logits = []
+        all_val_targets = []
+        all_val_masks = []
+        with torch.no_grad():
+            for imgs, y, m in val_loader:
+                imgs = imgs.to(device, non_blocking=True)
+                y = y.to(device, non_blocking=True)
+                m = m.to(device, non_blocking=True)
+                logits = model(imgs)
+                loss = focal_loss_with_mask(
+                    logits=logits,
+                    targets=y,
+                    masks=m,
+                    class_weights=class_weights,
+                    alpha=config.alpha_focal,
+                    gamma=config.gamma_focal,
+                )
+                val_loss_sum += loss.item()
+                val_batches += 1
+                all_val_logits.append(logits)
+                all_val_targets.append(y)
+                all_val_masks.append(m)
+        val_loss = val_loss_sum / max(val_batches, 1)
+        history["val_loss"].append(val_loss)
+        all_val_logits = torch.cat(all_val_logits, dim=0)
+        all_val_targets = torch.cat(all_val_targets, dim=0)
+        all_val_masks = torch.cat(all_val_masks, dim=0)
+        val_metrics = compute_metrics(
+            logits=all_val_logits,
+            targets=all_val_targets,
+            masks=all_val_masks,
+            threshold=0.5,
+        )
+        print(
+            f"[VAL METRICS] "
+            f"Precision={val_metrics['precision']:.4f} "
+            f"Recall={val_metrics['recall']:.4f} "
+            f"F1={val_metrics['f1']:.4f} "
+            f"Acc={val_metrics['accuracy']:.4f} "
+            f"TP={val_metrics['tp']} FP={val_metrics['fp']} "
+            f"TN={val_metrics['tn']} FN={val_metrics['fn']}"
+        )
+        print(
+            f"[EPOCH {epoch:03d}/{config.num_epochs:03d}] "
+            f"train_loss={train_loss:.4f}  val_loss={val_loss:.4f}"
+        )
+        # Print table of per-label metrics
+        print("\n[VAL PER-LABEL METRICS]")
+        print(f"{'Label':20s} {'Prec':>8s} {'Rec':>8s} {'F1':>8s} {'Support':>8s}")
+        print("-" * 60)
+        for j, stats in enumerate(val_metrics["per_label"]):
+            name = labels[j].name
+            p = stats["precision"]
+            r = stats["recall"]
+            f = stats["f1"]
+            sup = stats["support"]
+            if p is None:
+                print(f"{name:20s} {'N/A':>8} {'N/A':>8} {'N/A':>8} {sup:8d}")
+            else:
+                print(f"{name:20s} {p:8.4f} {r:8.4f} {f:8.4f} {sup:8d}")
+        print("-" * 60)
+    # ------------------------------------------------------------------
+    # 10. Final test loss + metrics
+    # ------------------------------------------------------------------
+    model.eval()
+    test_loss_sum = 0.0
+    test_batches = 0
+    all_test_logits = []
+    all_test_targets = []
+    all_test_masks = []
+    with torch.no_grad():
+        for imgs, y, m in test_loader:
+            imgs = imgs.to(device, non_blocking=True)
+            y = y.to(device, non_blocking=True)
+            m = m.to(device, non_blocking=True)
+            logits = model(imgs)
+            loss = focal_loss_with_mask(
+                logits=logits,
+                targets=y,
+                masks=m,
+                class_weights=class_weights,
+                alpha=config.alpha_focal,
+                gamma=config.gamma_focal,
+            )
+            test_loss_sum += loss.item()
+            test_batches += 1
+            all_test_logits.append(logits)
+            all_test_targets.append(y)
+            all_test_masks.append(m)
+    test_loss = test_loss_sum / max(test_batches, 1)
+    history["test_loss"] = test_loss
+    print(f"[TEST] test_loss={test_loss:.4f}")
+    all_test_logits = torch.cat(all_test_logits, dim=0)
+    all_test_targets = torch.cat(all_test_targets, dim=0)
+    all_test_masks = torch.cat(all_test_masks, dim=0)
+    test_metrics = compute_metrics(
+        logits=all_test_logits,
+        targets=all_test_targets,
+        masks=all_test_masks,
+        threshold=0.5,
+    )
+    print(
+        f"[TEST METRICS] "
+        f"Precision={test_metrics['precision']:.4f} "
+        f"Recall={test_metrics['recall']:.4f} "
+        f"F1={test_metrics['f1']:.4f} "
+        f"Acc={test_metrics['accuracy']:.4f} "
+        f"TP={test_metrics['tp']} FP={test_metrics['fp']} "
+        f"TN={test_metrics['tn']} FN={test_metrics['fn']}"
+    )
+    # Print table of per-label metrics
+    print("\n[VAL PER-LABEL METRICS]")
+    print(f"{'Label':20s} {'Prec':>8s} {'Rec':>8s} {'F1':>8s} {'Support':>8s}")
+    print("-" * 60)
+    for j, stats in enumerate(val_metrics["per_label"]):
+        name = labels[j].name
+        p = stats["precision"]
+        r = stats["recall"]
+        f = stats["f1"]
+        sup = stats["support"]
+    if p is None:
+        print(f"{name:20s} {'N/A':>8} {'N/A':>8} {'N/A':>8} {sup:8d}")
+    else:
+        print(f"{name:20s} {p:8.4f} {r:8.4f} {f:8.4f} {sup:8d}")
+    print("-" * 60)
+    # ------------------------------------------------------------------
+    # 11. Save model + metadata
+    # ------------------------------------------------------------------
+    backbone_tag = config.backbone_name.replace(" ", "_")
+    """'run_name = (
+        f"aidataset_{config.dataset_id}_"
+        f"RN50_GastroNet1M_DINO_v{config.labelset_version_to_train}_multilabel"
+    )"""
+    # Keep the old name for the GastroNet RN50 backbone
+    if getattr(config, "backbone_name", "gastro_rn50") == "gastro_rn50":
+        run_name = (
+            f"aidataset_{config.dataset_id}_"
+            f"RN50_GastroNet1M_DINO_v{config.labelset_version_to_train}_multilabel"
+        )
+    else:
+        # For all other backbones, use a generic name that includes backbone_name
+        backbone_tag = config.backbone_name.replace(" ", "_")
+        run_name = (
+            f"aidataset_{config.dataset_id}_"
+            f"{backbone_tag}_v{config.labelset_version_to_train}_multilabel"
+        )
+    model_path = RUNS_DIR / f"{run_name}.pth"
+    meta_path = RUNS_DIR / f"{run_name}_meta.json"
+    torch.save(model.state_dict(), model_path)
+    meta = {
+        "config": {
+            "dataset_id": config.dataset_id,
+            "labelset_version_to_train": config.labelset_version_to_train,
+            "backbone_checkpoint": config.backbone_checkpoint,
+            "num_epochs": config.num_epochs,
+            "batch_size": config.batch_size,
+            "val_split": config.val_split,
+            "test_split": config.test_split,
+            "lr_head": config.lr_head,
+            "lr_backbone": config.lr_backbone,
+            "gamma_focal": config.gamma_focal,
+            "alpha_focal": config.alpha_focal,
+            "device": config.device,
+            "random_seed": config.random_seed,
+            "treat_unlabeled_as_negative": config.treat_unlabeled_as_negative,
+            "use_scheduler": config.use_scheduler,
+            "warmup_epochs": config.warmup_epochs,
+            "min_lr": config.min_lr,
+        },
+        "original_labelset_id": labelset.id,
+        "original_labelset_name": labelset.name,
+        "original_labelset_version": labelset.version,
+        "used_label_names": [lbl.name for lbl in labels],
+        "used_label_indices_original": kept_indices,
+        "history": history,
+    }
+    with meta_path.open("w", encoding="utf-8") as f:
+        json.dump(meta, f, indent=2)
+    print("[TRAIN] Saved model to:", model_path)
+    print("[TRAIN] Saved metadata to:", meta_path)
+    return {
+        "model_path": str(model_path),
+        "meta_path": str(meta_path),
+        "history": history,
+    }

endoreg-db 0.8.9.2__py3-none-any.whl → 0.8.9.10__py3-none-any.whl

Potentially problematic release.

endoreg-db 0.8.9.2py3-none-any.whl → 0.8.9.10py3-none-any.whl