PyPI - endoreg-db - Versions diffs - 0.8.9.2__py3-none-any.whl → 0.8.9.10__py3-none-any.whl - Mend

endoreg-db 0.8.9.2py3-none-any.whl → 0.8.9.10py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of endoreg-db might be problematic. Click here for more details.

Files changed (450) hide show

endoreg_db/admin.py +10 -5
endoreg_db/apps.py +4 -7
endoreg_db/authz/auth.py +1 -0
endoreg_db/authz/backends.py +1 -1
endoreg_db/authz/management/commands/list_routes.py +2 -0
endoreg_db/authz/middleware.py +8 -7
endoreg_db/authz/permissions.py +21 -10
endoreg_db/authz/policy.py +14 -19
endoreg_db/authz/views_auth.py +14 -10
endoreg_db/codemods/rename_datetime_fields.py +8 -1
endoreg_db/exceptions.py +5 -2
endoreg_db/forms/__init__.py +0 -1
endoreg_db/forms/examination_form.py +4 -3
endoreg_db/forms/patient_finding_intervention_form.py +30 -8
endoreg_db/forms/patient_form.py +9 -13
endoreg_db/forms/questionnaires/__init__.py +1 -1
endoreg_db/forms/settings/__init__.py +4 -1
endoreg_db/forms/unit.py +2 -1
endoreg_db/helpers/count_db.py +17 -14
endoreg_db/helpers/default_objects.py +2 -1
endoreg_db/helpers/download_segmentation_model.py +4 -3
endoreg_db/helpers/interact.py +0 -5
endoreg_db/helpers/test_video_helper.py +33 -25
endoreg_db/import_files/__init__.py +1 -1
endoreg_db/import_files/context/__init__.py +1 -1
endoreg_db/import_files/context/default_sensitive_meta.py +11 -9
endoreg_db/import_files/context/ensure_center.py +4 -4
endoreg_db/import_files/context/file_lock.py +3 -3
endoreg_db/import_files/context/import_context.py +11 -12
endoreg_db/import_files/context/validate_directories.py +1 -0
endoreg_db/import_files/file_storage/create_report_file.py +57 -34
endoreg_db/import_files/file_storage/create_video_file.py +64 -35
endoreg_db/import_files/file_storage/sensitive_meta_storage.py +5 -2
endoreg_db/import_files/file_storage/state_management.py +89 -122
endoreg_db/import_files/file_storage/storage.py +5 -1
endoreg_db/import_files/processing/report_processing/report_anonymization.py +24 -19
endoreg_db/import_files/processing/sensitive_meta_adapter.py +3 -3
endoreg_db/import_files/processing/video_processing/video_anonymization.py +18 -18
endoreg_db/import_files/pseudonymization/k_anonymity.py +8 -9
endoreg_db/import_files/pseudonymization/k_pseudonymity.py +16 -5
endoreg_db/import_files/report_import_service.py +36 -30
endoreg_db/import_files/video_import_service.py +27 -23
endoreg_db/logger_conf.py +56 -40
endoreg_db/management/__init__.py +1 -1
endoreg_db/management/commands/__init__.py +1 -1
endoreg_db/management/commands/check_auth.py +45 -38
endoreg_db/management/commands/create_model_meta_from_huggingface.py +53 -2
endoreg_db/management/commands/create_multilabel_model_meta.py +54 -19
endoreg_db/management/commands/fix_missing_patient_data.py +105 -71
endoreg_db/management/commands/fix_video_paths.py +75 -54
endoreg_db/management/commands/import_report.py +1 -3
endoreg_db/management/commands/list_routes.py +2 -0
endoreg_db/management/commands/load_ai_model_data.py +8 -2
endoreg_db/management/commands/load_ai_model_label_data.py +0 -1
endoreg_db/management/commands/load_center_data.py +3 -3
endoreg_db/management/commands/load_distribution_data.py +35 -38
endoreg_db/management/commands/load_endoscope_data.py +0 -3
endoreg_db/management/commands/load_examination_data.py +20 -4
endoreg_db/management/commands/load_finding_data.py +18 -3
endoreg_db/management/commands/load_gender_data.py +17 -24
endoreg_db/management/commands/load_green_endoscopy_wuerzburg_data.py +95 -85
endoreg_db/management/commands/load_information_source.py +0 -3
endoreg_db/management/commands/load_lab_value_data.py +14 -3
endoreg_db/management/commands/load_legacy_data.py +303 -0
endoreg_db/management/commands/load_name_data.py +1 -2
endoreg_db/management/commands/load_pdf_type_data.py +4 -8
endoreg_db/management/commands/load_profession_data.py +0 -1
endoreg_db/management/commands/load_report_reader_flag_data.py +0 -4
endoreg_db/management/commands/load_requirement_data.py +6 -2
endoreg_db/management/commands/load_unit_data.py +0 -4
endoreg_db/management/commands/load_user_groups.py +5 -7
endoreg_db/management/commands/model_input.py +169 -0
endoreg_db/management/commands/register_ai_model.py +22 -16
endoreg_db/management/commands/setup_endoreg_db.py +110 -32
endoreg_db/management/commands/storage_management.py +14 -8
endoreg_db/management/commands/summarize_db_content.py +154 -63
endoreg_db/management/commands/train_image_multilabel_model.py +144 -0
endoreg_db/management/commands/validate_video_files.py +82 -50
endoreg_db/management/commands/video_validation.py +4 -6
endoreg_db/migrations/0001_initial.py +112 -63
endoreg_db/models/__init__.py +8 -0
endoreg_db/models/administration/ai/active_model.py +5 -5
endoreg_db/models/administration/ai/ai_model.py +41 -18
endoreg_db/models/administration/ai/model_type.py +1 -0
endoreg_db/models/administration/case/case.py +22 -22
endoreg_db/models/administration/center/__init__.py +5 -5
endoreg_db/models/administration/center/center.py +6 -2
endoreg_db/models/administration/center/center_resource.py +18 -4
endoreg_db/models/administration/center/center_shift.py +3 -1
endoreg_db/models/administration/center/center_waste.py +6 -2
endoreg_db/models/administration/person/__init__.py +1 -1
endoreg_db/models/administration/person/employee/__init__.py +1 -1
endoreg_db/models/administration/person/employee/employee_type.py +3 -1
endoreg_db/models/administration/person/examiner/__init__.py +1 -1
endoreg_db/models/administration/person/examiner/examiner.py +10 -2
endoreg_db/models/administration/person/names/first_name.py +6 -4
endoreg_db/models/administration/person/names/last_name.py +4 -3
endoreg_db/models/administration/person/patient/__init__.py +1 -1
endoreg_db/models/administration/person/patient/patient.py +0 -1
endoreg_db/models/administration/person/patient/patient_external_id.py +0 -1
endoreg_db/models/administration/person/person.py +1 -1
endoreg_db/models/administration/product/__init__.py +7 -6
endoreg_db/models/administration/product/product.py +6 -2
endoreg_db/models/administration/product/product_group.py +9 -7
endoreg_db/models/administration/product/product_material.py +9 -2
endoreg_db/models/administration/product/reference_product.py +64 -15
endoreg_db/models/administration/qualification/qualification.py +3 -1
endoreg_db/models/administration/shift/shift.py +3 -1
endoreg_db/models/administration/shift/shift_type.py +12 -4
endoreg_db/models/aidataset/__init__.py +5 -0
endoreg_db/models/aidataset/aidataset.py +193 -0
endoreg_db/models/label/__init__.py +1 -1
endoreg_db/models/label/label.py +10 -2
endoreg_db/models/label/label_set.py +3 -1
endoreg_db/models/label/label_video_segment/_create_from_video.py +6 -2
endoreg_db/models/label/label_video_segment/label_video_segment.py +148 -44
endoreg_db/models/media/__init__.py +12 -5
endoreg_db/models/media/frame/__init__.py +1 -1
endoreg_db/models/media/frame/frame.py +34 -8
endoreg_db/models/media/pdf/__init__.py +2 -1
endoreg_db/models/media/pdf/raw_pdf.py +11 -4
endoreg_db/models/media/pdf/report_file.py +6 -2
endoreg_db/models/media/pdf/report_reader/__init__.py +3 -3
endoreg_db/models/media/pdf/report_reader/report_reader_flag.py +15 -5
endoreg_db/models/media/video/create_from_file.py +20 -41
endoreg_db/models/media/video/pipe_1.py +75 -30
endoreg_db/models/media/video/pipe_2.py +37 -12
endoreg_db/models/media/video/video_file.py +36 -24
endoreg_db/models/media/video/video_file_ai.py +235 -70
endoreg_db/models/media/video/video_file_anonymize.py +240 -65
endoreg_db/models/media/video/video_file_frames/_bulk_create_frames.py +6 -1
endoreg_db/models/media/video/video_file_frames/_create_frame_object.py +3 -1
endoreg_db/models/media/video/video_file_frames/_delete_frames.py +30 -9
endoreg_db/models/media/video/video_file_frames/_extract_frames.py +95 -29
endoreg_db/models/media/video/video_file_frames/_get_frame.py +13 -3
endoreg_db/models/media/video/video_file_frames/_get_frame_path.py +4 -1
endoreg_db/models/media/video/video_file_frames/_get_frame_paths.py +15 -3
endoreg_db/models/media/video/video_file_frames/_get_frame_range.py +15 -3
endoreg_db/models/media/video/video_file_frames/_get_frames.py +7 -2
endoreg_db/models/media/video/video_file_frames/_initialize_frames.py +109 -23
endoreg_db/models/media/video/video_file_frames/_manage_frame_range.py +111 -27
endoreg_db/models/media/video/video_file_frames/_mark_frames_extracted_status.py +46 -13
endoreg_db/models/media/video/video_file_io.py +85 -33
endoreg_db/models/media/video/video_file_meta/__init__.py +6 -6
endoreg_db/models/media/video/video_file_meta/get_crop_template.py +17 -4
endoreg_db/models/media/video/video_file_meta/get_endo_roi.py +28 -7
endoreg_db/models/media/video/video_file_meta/get_fps.py +46 -13
endoreg_db/models/media/video/video_file_meta/initialize_video_specs.py +81 -20
endoreg_db/models/media/video/video_file_meta/text_meta.py +61 -20
endoreg_db/models/media/video/video_file_meta/video_meta.py +40 -12
endoreg_db/models/media/video/video_file_segments.py +118 -27
endoreg_db/models/media/video/video_metadata.py +25 -6
endoreg_db/models/media/video/video_processing.py +54 -15
endoreg_db/models/medical/__init__.py +3 -13
endoreg_db/models/medical/contraindication/__init__.py +3 -1
endoreg_db/models/medical/disease.py +18 -6
endoreg_db/models/medical/event.py +6 -2
endoreg_db/models/medical/examination/__init__.py +5 -1
endoreg_db/models/medical/examination/examination.py +22 -6
endoreg_db/models/medical/examination/examination_indication.py +23 -7
endoreg_db/models/medical/examination/examination_time.py +6 -2
endoreg_db/models/medical/finding/__init__.py +3 -1
endoreg_db/models/medical/finding/finding.py +37 -12
endoreg_db/models/medical/finding/finding_classification.py +27 -8
endoreg_db/models/medical/finding/finding_intervention.py +19 -6
endoreg_db/models/medical/finding/finding_type.py +3 -1
endoreg_db/models/medical/hardware/__init__.py +1 -1
endoreg_db/models/medical/hardware/endoscope.py +14 -2
endoreg_db/models/medical/laboratory/__init__.py +1 -1
endoreg_db/models/medical/laboratory/lab_value.py +139 -39
endoreg_db/models/medical/medication/__init__.py +7 -3
endoreg_db/models/medical/medication/medication.py +3 -1
endoreg_db/models/medical/medication/medication_indication.py +3 -1
endoreg_db/models/medical/medication/medication_indication_type.py +11 -3
endoreg_db/models/medical/medication/medication_intake_time.py +3 -1
endoreg_db/models/medical/medication/medication_schedule.py +3 -1
endoreg_db/models/medical/patient/__init__.py +2 -10
endoreg_db/models/medical/patient/medication_examples.py +3 -14
endoreg_db/models/medical/patient/patient_disease.py +17 -5
endoreg_db/models/medical/patient/patient_event.py +12 -4
endoreg_db/models/medical/patient/patient_examination.py +52 -15
endoreg_db/models/medical/patient/patient_examination_indication.py +15 -4
endoreg_db/models/medical/patient/patient_finding.py +105 -29
endoreg_db/models/medical/patient/patient_finding_classification.py +41 -12
endoreg_db/models/medical/patient/patient_finding_intervention.py +11 -3
endoreg_db/models/medical/patient/patient_lab_sample.py +6 -2
endoreg_db/models/medical/patient/patient_lab_value.py +42 -10
endoreg_db/models/medical/patient/patient_medication.py +25 -7
endoreg_db/models/medical/patient/patient_medication_schedule.py +34 -10
endoreg_db/models/metadata/model_meta.py +40 -12
endoreg_db/models/metadata/model_meta_logic.py +51 -16
endoreg_db/models/metadata/sensitive_meta.py +65 -28
endoreg_db/models/metadata/sensitive_meta_logic.py +28 -26
endoreg_db/models/metadata/video_meta.py +146 -39
endoreg_db/models/metadata/video_prediction_logic.py +70 -21
endoreg_db/models/metadata/video_prediction_meta.py +80 -27
endoreg_db/models/operation_log.py +63 -0
endoreg_db/models/other/__init__.py +10 -10
endoreg_db/models/other/distribution/__init__.py +9 -7
endoreg_db/models/other/distribution/base_value_distribution.py +3 -1
endoreg_db/models/other/distribution/date_value_distribution.py +19 -5
endoreg_db/models/other/distribution/multiple_categorical_value_distribution.py +3 -1
endoreg_db/models/other/distribution/numeric_value_distribution.py +34 -9
endoreg_db/models/other/emission/__init__.py +1 -1
endoreg_db/models/other/emission/emission_factor.py +9 -3
endoreg_db/models/other/information_source.py +15 -5
endoreg_db/models/other/material.py +3 -1
endoreg_db/models/other/transport_route.py +3 -1
endoreg_db/models/other/unit.py +6 -2
endoreg_db/models/report/report.py +0 -1
endoreg_db/models/requirement/requirement.py +84 -27
endoreg_db/models/requirement/requirement_error.py +5 -6
endoreg_db/models/requirement/requirement_evaluation/__init__.py +1 -1
endoreg_db/models/requirement/requirement_evaluation/evaluate_with_dependencies.py +8 -8
endoreg_db/models/requirement/requirement_evaluation/get_values.py +3 -3
endoreg_db/models/requirement/requirement_evaluation/requirement_type_parser.py +24 -8
endoreg_db/models/requirement/requirement_operator.py +28 -8
endoreg_db/models/requirement/requirement_set.py +34 -11
endoreg_db/models/state/__init__.py +1 -0
endoreg_db/models/state/audit_ledger.py +9 -2
endoreg_db/models/{media → state}/processing_history/__init__.py +1 -3
endoreg_db/models/state/processing_history/processing_history.py +136 -0
endoreg_db/models/state/raw_pdf.py +0 -1
endoreg_db/models/state/video.py +2 -4
endoreg_db/models/utils.py +4 -2
endoreg_db/queries/__init__.py +2 -6
endoreg_db/queries/annotations/__init__.py +1 -3
endoreg_db/queries/annotations/legacy.py +37 -26
endoreg_db/root_urls.py +3 -4
endoreg_db/schemas/examination_evaluation.py +3 -0
endoreg_db/serializers/Frames_NICE_and_PARIS_classifications.py +249 -163
endoreg_db/serializers/__init__.py +2 -8
endoreg_db/serializers/administration/__init__.py +1 -2
endoreg_db/serializers/administration/ai/__init__.py +0 -1
endoreg_db/serializers/administration/ai/active_model.py +3 -1
endoreg_db/serializers/administration/ai/ai_model.py +5 -3
endoreg_db/serializers/administration/ai/model_type.py +3 -1
endoreg_db/serializers/administration/center.py +7 -2
endoreg_db/serializers/administration/gender.py +4 -2
endoreg_db/serializers/anonymization.py +13 -13
endoreg_db/serializers/evaluation/examination_evaluation.py +0 -1
endoreg_db/serializers/examination/__init__.py +1 -1
endoreg_db/serializers/examination/base.py +12 -13
endoreg_db/serializers/examination/dropdown.py +6 -7
endoreg_db/serializers/examination_serializer.py +3 -6
endoreg_db/serializers/finding/__init__.py +1 -1
endoreg_db/serializers/finding/finding.py +14 -7
endoreg_db/serializers/finding_classification/__init__.py +3 -3
endoreg_db/serializers/finding_classification/choice.py +3 -3
endoreg_db/serializers/finding_classification/classification.py +2 -4
endoreg_db/serializers/label_video_segment/__init__.py +5 -3
endoreg_db/serializers/{label → label_video_segment}/image_classification_annotation.py +5 -5
endoreg_db/serializers/label_video_segment/label/__init__.py +6 -0
endoreg_db/serializers/{label → label_video_segment/label}/label.py +1 -1
endoreg_db/serializers/label_video_segment/label_video_segment.py +338 -228
endoreg_db/serializers/meta/__init__.py +1 -2
endoreg_db/serializers/meta/sensitive_meta_detail.py +28 -13
endoreg_db/serializers/meta/sensitive_meta_update.py +51 -46
endoreg_db/serializers/meta/sensitive_meta_verification.py +19 -16
endoreg_db/serializers/misc/__init__.py +2 -2
endoreg_db/serializers/misc/file_overview.py +11 -7
endoreg_db/serializers/misc/stats.py +10 -8
endoreg_db/serializers/misc/translatable_field_mix_in.py +6 -6
endoreg_db/serializers/misc/upload_job.py +32 -29
endoreg_db/serializers/patient/__init__.py +2 -1
endoreg_db/serializers/patient/patient.py +32 -15
endoreg_db/serializers/patient/patient_dropdown.py +11 -3
endoreg_db/serializers/patient_examination/__init__.py +1 -1
endoreg_db/serializers/patient_examination/patient_examination.py +67 -40
endoreg_db/serializers/patient_finding/__init__.py +1 -1
endoreg_db/serializers/patient_finding/patient_finding.py +2 -1
endoreg_db/serializers/patient_finding/patient_finding_classification.py +17 -9
endoreg_db/serializers/patient_finding/patient_finding_detail.py +26 -17
endoreg_db/serializers/patient_finding/patient_finding_intervention.py +7 -5
endoreg_db/serializers/patient_finding/patient_finding_list.py +10 -11
endoreg_db/serializers/patient_finding/patient_finding_write.py +36 -27
endoreg_db/serializers/pdf/__init__.py +1 -3
endoreg_db/serializers/requirements/requirement_schema.py +1 -6
endoreg_db/serializers/sensitive_meta_serializer.py +100 -81
endoreg_db/serializers/video/__init__.py +2 -2
endoreg_db/serializers/video/{segmentation.py → video_file.py} +66 -47
endoreg_db/serializers/video/video_file_brief.py +6 -2
endoreg_db/serializers/video/video_file_detail.py +36 -23
endoreg_db/serializers/video/video_file_list.py +4 -2
endoreg_db/serializers/video/video_processing_history.py +54 -50
endoreg_db/services/__init__.py +1 -1
endoreg_db/services/anonymization.py +2 -2
endoreg_db/services/examination_evaluation.py +40 -17
endoreg_db/services/model_meta_from_hf.py +76 -0
endoreg_db/services/polling_coordinator.py +101 -70
endoreg_db/services/pseudonym_service.py +27 -22
endoreg_db/services/report_import.py +6 -3
endoreg_db/services/segment_sync.py +75 -59
endoreg_db/services/video_import.py +6 -7
endoreg_db/urls/__init__.py +2 -2
endoreg_db/urls/ai.py +7 -25
endoreg_db/urls/anonymization.py +61 -15
endoreg_db/urls/auth.py +4 -4
endoreg_db/urls/classification.py +4 -9
endoreg_db/urls/examination.py +27 -18
endoreg_db/urls/media.py +27 -34
endoreg_db/urls/patient.py +11 -7
endoreg_db/urls/requirements.py +3 -1
endoreg_db/urls/root_urls.py +2 -3
endoreg_db/urls/stats.py +24 -16
endoreg_db/urls/upload.py +3 -11
endoreg_db/utils/__init__.py +14 -15
endoreg_db/utils/ai/__init__.py +1 -1
endoreg_db/utils/ai/data_loader_for_model_input.py +262 -0
endoreg_db/utils/ai/data_loader_for_model_training.py +262 -0
endoreg_db/utils/ai/get.py +2 -1
endoreg_db/utils/ai/inference_dataset.py +14 -15
endoreg_db/utils/ai/model_training/config.py +117 -0
endoreg_db/utils/ai/model_training/dataset.py +74 -0
endoreg_db/utils/ai/model_training/losses.py +68 -0
endoreg_db/utils/ai/model_training/metrics.py +78 -0
endoreg_db/utils/ai/model_training/model_backbones.py +155 -0
endoreg_db/utils/ai/model_training/model_gastronet_resnet.py +118 -0
endoreg_db/utils/ai/model_training/trainer_gastronet_multilabel.py +771 -0
endoreg_db/utils/ai/multilabel_classification_net.py +21 -6
endoreg_db/utils/ai/predict.py +4 -4
endoreg_db/utils/ai/preprocess.py +19 -11
endoreg_db/utils/calc_duration_seconds.py +4 -4
endoreg_db/utils/case_generator/lab_sample_factory.py +3 -4
endoreg_db/utils/check_video_files.py +74 -47
endoreg_db/utils/cropping.py +10 -9
endoreg_db/utils/dataloader.py +11 -3
endoreg_db/utils/dates.py +3 -4
endoreg_db/utils/defaults/set_default_center.py +7 -6
endoreg_db/utils/env.py +6 -2
endoreg_db/utils/extract_specific_frames.py +24 -9
endoreg_db/utils/file_operations.py +30 -18
endoreg_db/utils/fix_video_path_direct.py +57 -41
endoreg_db/utils/frame_anonymization_utils.py +157 -157
endoreg_db/utils/hashs.py +3 -18
endoreg_db/utils/links/requirement_link.py +96 -52
endoreg_db/utils/ocr.py +30 -25
endoreg_db/utils/operation_log.py +61 -0
endoreg_db/utils/parse_and_generate_yaml.py +12 -13
endoreg_db/utils/paths.py +6 -6
endoreg_db/utils/permissions.py +40 -24
endoreg_db/utils/pipelines/process_video_dir.py +50 -26
endoreg_db/utils/product/sum_emissions.py +5 -3
endoreg_db/utils/product/sum_weights.py +4 -2
endoreg_db/utils/pydantic_models/__init__.py +3 -4
endoreg_db/utils/requirement_operator_logic/_old/lab_value_operators.py +207 -107
endoreg_db/utils/requirement_operator_logic/_old/model_evaluators.py +252 -65
endoreg_db/utils/requirement_operator_logic/new_operator_logic.py +27 -10
endoreg_db/utils/setup_config.py +21 -5
endoreg_db/utils/storage.py +3 -1
endoreg_db/utils/translation.py +19 -15
endoreg_db/utils/uuid.py +1 -0
endoreg_db/utils/validate_endo_roi.py +12 -4
endoreg_db/utils/validate_subcategory_dict.py +26 -24
endoreg_db/utils/validate_video_detailed.py +207 -149
endoreg_db/utils/video/__init__.py +7 -3
endoreg_db/utils/video/extract_frames.py +30 -18
endoreg_db/utils/video/names.py +11 -6
endoreg_db/utils/video/streaming_processor.py +175 -101
endoreg_db/utils/video/video_splitter.py +30 -19
endoreg_db/views/Frames_NICE_and_PARIS_classifications_views.py +59 -50
endoreg_db/views/__init__.py +0 -20
endoreg_db/views/anonymization/__init__.py +6 -2
endoreg_db/views/anonymization/media_management.py +2 -6
endoreg_db/views/anonymization/overview.py +34 -1
endoreg_db/views/anonymization/validate.py +79 -18
endoreg_db/views/auth/__init__.py +1 -1
endoreg_db/views/auth/keycloak.py +16 -14
endoreg_db/views/examination/__init__.py +12 -15
endoreg_db/views/examination/examination.py +5 -5
endoreg_db/views/examination/examination_manifest_cache.py +5 -5
endoreg_db/views/examination/get_finding_classification_choices.py +8 -5
endoreg_db/views/examination/get_finding_classifications.py +9 -7
endoreg_db/views/examination/get_findings.py +8 -10
endoreg_db/views/examination/get_instruments.py +3 -2
endoreg_db/views/examination/get_interventions.py +1 -1
endoreg_db/views/finding/__init__.py +2 -2
endoreg_db/views/finding/finding.py +58 -54
endoreg_db/views/finding/get_classifications.py +1 -1
endoreg_db/views/finding/get_interventions.py +1 -1
endoreg_db/views/finding_classification/__init__.py +5 -5
endoreg_db/views/finding_classification/finding_classification.py +5 -6
endoreg_db/views/finding_classification/get_classification_choices.py +3 -4
endoreg_db/views/media/__init__.py +13 -13
endoreg_db/views/media/pdf_media.py +9 -9
endoreg_db/views/media/sensitive_metadata.py +10 -7
endoreg_db/views/media/video_media.py +4 -4
endoreg_db/views/meta/__init__.py +1 -1
endoreg_db/views/meta/sensitive_meta_list.py +20 -22
endoreg_db/views/meta/sensitive_meta_verification.py +14 -11
endoreg_db/views/misc/__init__.py +6 -34
endoreg_db/views/misc/center.py +2 -1
endoreg_db/views/misc/csrf.py +2 -1
endoreg_db/views/misc/gender.py +2 -1
endoreg_db/views/misc/stats.py +141 -106
endoreg_db/views/patient/__init__.py +1 -3
endoreg_db/views/patient/patient.py +141 -99
endoreg_db/views/patient_examination/__init__.py +5 -5
endoreg_db/views/patient_examination/patient_examination.py +43 -42
endoreg_db/views/patient_examination/patient_examination_create.py +10 -15
endoreg_db/views/patient_examination/patient_examination_detail.py +12 -15
endoreg_db/views/patient_examination/patient_examination_list.py +21 -17
endoreg_db/views/patient_examination/video.py +114 -80
endoreg_db/views/patient_finding/__init__.py +1 -1
endoreg_db/views/patient_finding/patient_finding.py +17 -10
endoreg_db/views/patient_finding/patient_finding_optimized.py +127 -95
endoreg_db/views/patient_finding_classification/__init__.py +1 -1
endoreg_db/views/patient_finding_classification/pfc_create.py +35 -27
endoreg_db/views/report/reimport.py +1 -1
endoreg_db/views/report/report_stream.py +5 -8
endoreg_db/views/requirement/__init__.py +2 -1
endoreg_db/views/requirement/evaluate.py +7 -9
endoreg_db/views/requirement/lookup.py +2 -3
endoreg_db/views/requirement/lookup_store.py +0 -1
endoreg_db/views/requirement/requirement_utils.py +2 -4
endoreg_db/views/stats/__init__.py +4 -4
endoreg_db/views/stats/stats_views.py +152 -115
endoreg_db/views/video/__init__.py +18 -27
endoreg_db/views/{ai → video/ai}/__init__.py +2 -2
endoreg_db/views/{ai → video/ai}/label.py +20 -16
endoreg_db/views/video/correction.py +5 -6
endoreg_db/views/video/reimport.py +134 -99
endoreg_db/views/video/segments_crud.py +134 -44
endoreg_db/views/video/video_apply_mask.py +13 -12
endoreg_db/views/video/video_correction.py +2 -1
endoreg_db/views/video/video_download_processed.py +15 -15
endoreg_db/views/video/video_meta_stats.py +7 -6
endoreg_db/views/video/video_processing_history.py +3 -2
endoreg_db/views/video/video_remove_frames.py +13 -12
endoreg_db/views/video/video_stream.py +110 -82
{endoreg_db-0.8.9.2.dist-info → endoreg_db-0.8.9.10.dist-info}/METADATA +9 -3
{endoreg_db-0.8.9.2.dist-info → endoreg_db-0.8.9.10.dist-info}/RECORD +434 -431
endoreg_db/management/commands/import_fallback_video.py +0 -203
endoreg_db/management/commands/import_video.py +0 -422
endoreg_db/management/commands/import_video_with_classification.py +0 -367
endoreg_db/models/media/processing_history/processing_history.py +0 -96
endoreg_db/serializers/label/__init__.py +0 -7
endoreg_db/serializers/label_video_segment/_lvs_create.py +0 -149
endoreg_db/serializers/label_video_segment/_lvs_update.py +0 -138
endoreg_db/serializers/label_video_segment/_lvs_validate.py +0 -149
endoreg_db/serializers/label_video_segment/label_video_segment_annotation.py +0 -99
endoreg_db/serializers/label_video_segment/label_video_segment_update.py +0 -163
endoreg_db/services/__old/pdf_import.py +0 -1487
endoreg_db/services/__old/video_import.py +0 -1306
endoreg_db/tasks/upload_tasks.py +0 -216
endoreg_db/tasks/video_ingest.py +0 -161
endoreg_db/tasks/video_processing_tasks.py +0 -327
endoreg_db/views/misc/translation.py +0 -182
{endoreg_db-0.8.9.2.dist-info → endoreg_db-0.8.9.10.dist-info}/WHEEL +0 -0
{endoreg_db-0.8.9.2.dist-info → endoreg_db-0.8.9.10.dist-info}/licenses/LICENSE +0 -0

endoreg_db/utils/ai/data_loader_for_model_training.py ADDED Viewed

@@ -0,0 +1,262 @@
+# endoreg_db/utils/ai/data_loader_for_model_training.py
+from __future__ import annotations
+from collections import defaultdict
+from pathlib import Path
+from typing import Dict, List, Optional, TypedDict
+from django.db import models
+from endoreg_db.models import (
+    AIDataSet,
+    Frame,
+    ImageClassificationAnnotation,
+    Label,
+    LabelSet,
+)
+class ImageMultilabelDataset(TypedDict):
+    """
+    In-memory representation of an image multi-label training dataset.
+    All lists are aligned by index:
+        image_paths[i]   -> path to image file for sample i
+        label_vectors[i] -> list[int|None] of length == len(labels)
+        label_masks[i]   -> list[int]       of length == len(labels)
+    Where:
+        - label_vectors[i][j] is:
+            1     -> positive annotation (value=True)
+            0     -> negative annotation (value=False)
+            None  -> UNKNOWN (no annotation for that (frame, label))
+        - label_masks[i][j] is:
+            1 -> this entry participates in the loss (0 or 1 is known)
+            0 -> IGNORE in the loss (value was None)
+    """
+    # type description of the returned dict.
+    image_paths: List[str]
+    label_vectors: List[List[Optional[int]]]
+    label_masks: List[List[int]]
+    labels: List[Label]
+    labelset: LabelSet
+    # New: keep track of which DB rows were used, and their legacy exam ids
+    frame_ids: List[int]  # Frame.pk for each sample
+    old_examination_ids: List[Optional[int]]  # may be None if not set
+def _infer_labelset_from_annotations(
+    annotations_qs: models.QuerySet[ImageClassificationAnnotation],
+) -> LabelSet:
+    """
+    Try to infer a unique LabelSet from the labels used in the annotations.
+    Strategy:
+        1. Collect all distinct label_ids from the annotations.
+        2. Fetch all Label objects + their label_sets.
+        3. Compute the intersection of all label_sets across all labels.
+        4. If there is exactly ONE common LabelSet, return it.
+           Otherwise, raise NotImplementedError for now.
+    """
+    label_ids = list(annotations_qs.values_list("label_id", flat=True).distinct())
+    if not label_ids:
+        raise ValueError("Cannot infer LabelSet: annotations queryset has no labels.")
+    labels_qs = Label.objects.filter(id__in=label_ids).prefetch_related("label_sets")
+    labelsets_for_each_label = []
+    for lbl in labels_qs:
+        # lbl.label_sets is the reverse of LabelSet.labels M2M
+        ls_ids = list(lbl.label_sets.values_list("id", flat=True))
+        if not ls_ids:
+            # This label is not part of any LabelSet -> ambiguous
+            raise NotImplementedError(
+                f"Label id={lbl.id}, name='{lbl.name}' is not part of any LabelSet. "
+                "Explicit LabelSet selection is required."
+            )
+        labelsets_for_each_label.append(set(ls_ids))
+    # Intersection of all labelset id sets
+    common_ids = set.intersection(*labelsets_for_each_label)
+    if not common_ids:
+        raise NotImplementedError(
+            "No common LabelSet across all labels in this AIDataSet. "
+            "Please specify a LabelSet explicitly."
+        )
+    if len(common_ids) > 1:
+        raise NotImplementedError(
+            "More than one common LabelSet found for the labels in this AIDataSet. "
+            "Please specify a LabelSet explicitly to disambiguate."
+        )
+    ls_id = next(iter(common_ids))
+    return LabelSet.objects.get(id=ls_id)
+def build_image_multilabel_dataset_from_db(
+    dataset: AIDataSet,
+    labelset: Optional[LabelSet] = None,
+) -> ImageMultilabelDataset:
+    """
+    Build an in-memory multilabel dataset for an IMAGE-based AIDataSet.
+    Steps:
+        1. Take all ImageClassificationAnnotation rows linked to this AIDataSet
+           (via dataset.image_annotations M2M).
+        2. Determine the LabelSet (either explicitly given or inferred).
+        3. For each used Frame, build:
+            - an image path
+            - a label vector (1, 0, or None for each label in LabelSet)
+            - a mask vector (1 where known, 0 where unknown)
+        4. Return a dict that can be wrapped in a torch/tf Dataset.
+    NOTE:
+        - This function does NOT write anything to the DB.
+        - It only reads DB rows and returns Python structures.
+    """
+    if dataset.dataset_type != AIDataSet.DATASET_TYPE_IMAGE:
+        raise ValueError(
+            f"build_image_multilabel_dataset_from_db expected dataset_type='image', "
+            f"got '{dataset.dataset_type}' for AIDataSet id={dataset.id}."
+        )
+    # Get the annotation relation dynamically (for future video/text types)
+    annotations_qs = dataset.get_annotations_queryset().select_related("frame", "label")
+    if annotations_qs.count() == 0:
+        raise ValueError(
+            f"AIDataSet id={dataset.id} has no annotations attached. "
+            "Make sure your import script populated image_annotations."
+        )
+    # Decide which LabelSet to use
+    if labelset is None:
+        labelset = _infer_labelset_from_annotations(annotations_qs)
+    # Fixed label order (= fixed column order for the label vectors)
+    labels_in_order: List[Label] = labelset.get_labels_in_order()
+    if not labels_in_order:
+        raise ValueError(
+            f"LabelSet id={labelset.id}, name='{labelset.name}' has no labels."
+        )
+    num_labels = len(labels_in_order)
+    label_index: Dict[int, int] = {
+        lbl.id: idx for idx, lbl in enumerate(labels_in_order)
+    }
+    # Group annotations by frame
+    anns_by_frame: Dict[int, List[ImageClassificationAnnotation]] = defaultdict(list)
+    frames_order: List[int] = []
+    for ann in annotations_qs:
+        frame_id = ann.frame_id
+        if frame_id not in anns_by_frame:
+            frames_order.append(frame_id)
+        anns_by_frame[frame_id].append(ann)
+    # Build vectors
+    image_paths: List[str] = []
+    label_vectors: List[List[Optional[int]]] = []
+    label_masks: List[List[int]] = []
+    # New: id tracking for splitting / logging
+    frame_ids: List[int] = []
+    old_examination_ids: List[Optional[int]] = []
+    # Cache frames to avoid repeated DB hits
+    frame_obj_by_id: Dict[int, Frame] = {}
+    for frame_id in frames_order:
+        frame_annotations = anns_by_frame[frame_id]
+        # Resolve frame object (from first annotation of this frame)
+        frame = frame_obj_by_id.get(frame_id)
+        if frame is None:
+            frame = frame_annotations[0].frame
+            frame_obj_by_id[frame_id] = frame
+            # New: remember DB ids for this sample
+        frame_ids.append(frame_id)
+        old_examination_ids.append(getattr(frame, "old_examination_id", None))
+        # Start with unknown for all labels
+        vec: List[Optional[int]] = [None] * num_labels
+        # Fill with 1/0 where we have annotations
+        for ann in frame_annotations:
+            idx = label_index.get(ann.label_id)
+            if idx is None:
+                # Label not part of this LabelSet: ignore
+                continue
+            vec[idx] = 1 if ann.value else 0
+        # Build mask: 1 where vec is known, 0 where unknown
+        mask: List[int] = [0 if v is None else 1 for v in vec]
+        # Resolve absolute image path from the Frame model
+        file_path: Path = frame.file_path
+        image_paths.append(str(file_path))
+        label_vectors.append(vec)
+        label_masks.append(mask)
+    return ImageMultilabelDataset(
+        image_paths=image_paths,
+        label_vectors=label_vectors,
+        label_masks=label_masks,
+        labels=labels_in_order,
+        labelset=labelset,
+        frame_ids=frame_ids,
+        old_examination_ids=old_examination_ids,
+    )
+def build_dataset_for_training(
+    dataset: AIDataSet,
+    labelset: Optional[LabelSet] = None,
+):
+    """
+    High-level entry point to build a training dataset from an AIDataSet row.
+    It inspects:
+        - dataset.dataset_type
+        - dataset.ai_model_type
+    and dispatches to the appropriate builder.
+    For now, we support:
+        - dataset_type = "image"
+        - ai_model_type = "image_multilabel_classification"
+    Later, you can extend this to:
+        - video segmentation
+        - text classification
+        etc.
+    """
+    # IMAGE MULTILABEL CASE
+    if (
+        dataset.dataset_type == AIDataSet.DATASET_TYPE_IMAGE
+        and dataset.ai_model_type == AIDataSet.AI_MODEL_TYPE_IMAGE_MULTILABEL
+    ):
+        return build_image_multilabel_dataset_from_db(dataset, labelset=labelset)
+    # FUTURE EXTENSIONS (example structure, not yet implemented):
+    # if dataset.dataset_type == AIDataSet.DATASET_TYPE_VIDEO and \
+    #    dataset.ai_model_type == AIDataSet.AI_MODEL_TYPE_VIDEO_SEGMENTATION:
+    #     return build_video_segmentation_dataset_from_db(dataset, labelset=labelset)
+    #
+    # if dataset.dataset_type == AIDataSet.DATASET_TYPE_TEXT and \
+    #    dataset.ai_model_type == AIDataSet.AI_MODEL_TYPE_TEXT_CLASSIFICATION:
+    #     return build_text_classification_dataset_from_db(dataset, labelset=labelset)
+    raise NotImplementedError(
+        f"No dataset builder implemented for "
+        f"dataset_type='{dataset.dataset_type}', "
+        f"ai_model_type='{dataset.ai_model_type}'."
+    )

endoreg_db/utils/ai/get.py CHANGED Viewed

@@ -1,5 +1,6 @@
 from endoreg_db.models import ModelMeta
 def get_latest_model_meta_by_model_name(model_name):
-    model_meta = ModelMeta.objects.filter(name=model_name).order_by('-version').first()
+    model_meta = ModelMeta.objects.filter(name=model_name).order_by("-version").first()
     return model_meta

endoreg_db/utils/ai/inference_dataset.py CHANGED Viewed

@@ -4,6 +4,7 @@ from PIL import Image
 from torchvision import transforms
 from .preprocess import Cropper
 class InferenceDataset(Dataset):
     def __init__(self, paths, crops, config):
         self.paths = paths
@@ -12,13 +13,15 @@ class InferenceDataset(Dataset):
         self.config = config
         # Initialize the image transformations using torchvision
-        self.transforms = transforms.Compose([
-            # Convert PIL image to PyTorch tensor
-            transforms.ToTensor(),
-            # Normalize the image using the provided mean and std
-            transforms.Normalize(mean=self.config["mean"], std=self.config["std"])
-        ])
+        self.transforms = transforms.Compose(
+            [
+                # Convert PIL image to PyTorch tensor
+                transforms.ToTensor(),
+                # Normalize the image using the provided mean and std
+                transforms.Normalize(mean=self.config["mean"], std=self.config["std"]),
+            ]
+        )
     def __len__(self):
         # Returns the total number of samples
         return len(self.paths)
@@ -27,7 +30,7 @@ class InferenceDataset(Dataset):
         # Open the image with Pillow
         with Image.open(self.paths[idx]) as pil_image:
             # Convert the image to RGB to ensure 3 channels
-            pil_image = pil_image.convert('RGB')
+            pil_image = pil_image.convert("RGB")
         # Get the corresponding crop for the current image
         crop = self.crops[idx]
@@ -36,17 +39,13 @@ class InferenceDataset(Dataset):
         cropped = self.cropper(
             np.array(pil_image),  # Convert PIL image to numpy array for cropping
             crop,
-            scale=[
-                self.config["size_x"],
-                self.config["size_y"]
-            ]
+            scale=[self.config["size_x"], self.config["size_y"]],
         )
         # Convert cropped numpy array back to PIL image for torchvision transforms
-        cropped_pil = Image.fromarray(cropped.astype('uint8'), 'RGB')
+        cropped_pil = Image.fromarray(cropped.astype("uint8"), "RGB")
         # Apply the transformations
         img = self.transforms(cropped_pil)
         return img

endoreg_db/utils/ai/model_training/config.py ADDED Viewed

@@ -0,0 +1,117 @@
+# endoreg_db/utils/ai/model_training/config.py
+from __future__ import annotations
+from dataclasses import dataclass
+from pathlib import Path
+from typing import Optional
+from django.conf import settings
+# ---------------------------------------------------------------------
+# PATHS
+# ---------------------------------------------------------------------
+# Base project directory (e.g. /home/admin/dev/endoreg-db)
+BASE_DIR = Path(getattr(settings, "BASE_DIR", Path(__file__).resolve().parents[4]))
+# All training artifacts go here:
+#   /home/admin/dev/endoreg-db/data/model_training/
+TRAINING_ROOT = BASE_DIR / "data" / "model_training"
+CHECKPOINTS_DIR = TRAINING_ROOT / "checkpoints"
+RUNS_DIR = TRAINING_ROOT / "runs"
+for d in (TRAINING_ROOT, CHECKPOINTS_DIR, RUNS_DIR):
+    d.mkdir(parents=True, exist_ok=True)
+# Which LabelSet.version we train on (for label filtering)
+DEFAULT_LABELSET_VERSION_TO_TRAIN: int = 2
+# ---------------------------------------------------------------------
+# TRAINING CONFIG
+# ---------------------------------------------------------------------
+@dataclass
+class TrainingConfig:
+    """
+    Configuration for GastroNet multi-label training.
+    Most important knobs:
+    - dataset_id: which AIDataSet row to use from the database
+    - labelset_version_to_train: only labels belonging to LabelSet.version == this
+      are used for training (e.g. 2).
+    - treat_unlabeled_as_negative:
+        True  -> Option A: for v2 labels, if not annotated in a frame, we
+                 assume "absent" (0) and include it in the loss.
+        False -> keep "unknown" semantics (mask = 0, ignored in loss/metrics).
+    Learning rate schedule:
+    - lr_head / lr_backbone: base learning rates
+    - use_scheduler: if True, we use warm-up + cosine decay
+    - warmup_epochs: how many epochs to linearly increase LR from 0 → base LR
+    - min_lr: lowest LR reached at the end of cosine schedule
+    """
+    # --- WHAT TO TRAIN ON -------------------------------------------------
+    dataset_id: int
+    # Train only on labels belonging to ANY LabelSet with this version.
+    labelset_version_to_train: int = DEFAULT_LABELSET_VERSION_TO_TRAIN
+    # Path to GastroNet RN50 checkpoint (.pth); if None, backbone is random.
+    backbone_checkpoint: Optional[str] = None
+    # --- EPOCHS / BATCHING -----------------------------------------------
+    num_epochs: int = 5
+    batch_size: int = 32
+    # Split ratios (by colonoscopy exam groups, not by individual frames)
+    val_split: float = 0.2
+    test_split: float = 0.1
+    # --- LEARNING RATES --------------------------------------------------
+    # Base learning rates for classifier head and backbone.
+    lr_head: float = 1e-3  # usually larger (newly initialized layer)
+    lr_backbone: float = 1e-4  # smaller (pretrained GastroNet backbone)
+    # --- FOCAL LOSS HYPERPARAMETERS -------------------------------------
+    gamma_focal: float = 2.0  # how strongly to focus on hard examples
+    alpha_focal: float = 0.25  # weight for positives vs negatives
+    # --- DEVICE & SEED ---------------------------------------------------
+    device: str = "auto"  # "auto", "cpu", or "cuda"
+    random_seed: int = 42
+    # --- LABEL SEMANTICS -------------------------------------------------
+    # For the filtered labels (LabelSet.version == labelset_version_to_train):
+    # True  -> Option A: unlabeled => negative (0) and mask=1 (supervised)
+    # False -> keep unlabeled as unknown (mask=0, ignored)
+    treat_unlabeled_as_negative: bool = True
+    # --- LR SCHEDULER: WARM-UP + COSINE DECAY ----------------------------
+    # If True, we apply:
+    #   - linear warm-up for 'warmup_epochs'
+    #   - then CosineAnnealingLR for the remaining epochs
+    use_scheduler: bool = True
+    # Number of warm-up epochs (can be 0 for "no warm-up").
+    warmup_epochs: int = 3
+    # Minimum learning rate at the end of cosine decay for all param groups.
+    # (Both head and backbone decay towards this value.)
+    min_lr: float = 1e-6
+    # which CNN backbone / weights to use
+    # "gastro_rn50"          → current behavior (ResNet50 + GastroNet checkpoint)
+    # "resnet50_imagenet"    → ResNet50 with ImageNet weights
+    # "resnet50_random"      → ResNet50 with random initialization
+    # (later) "efficientnet_b0_imagenet", etc.
+    backbone_name: str = "gastro_rn50"
+    # whether to freeze backbone (feature extractor)
+    freeze_backbone: bool = True
+    # backbone_name: str = "gastro_rn50"

endoreg_db/utils/ai/model_training/dataset.py ADDED Viewed

@@ -0,0 +1,74 @@
+# endoreg_db/utils/ai/model_training/dataset.py
+from __future__ import annotations
+from typing import Optional, Sequence, Tuple, List
+import numpy as np
+from PIL import Image
+import torch
+from torch.utils.data import Dataset
+class EndoMultiLabelDataset(Dataset):
+    """
+    PyTorch dataset wrapping the output of build_dataset_for_training.
+    Each item is:
+        image_tensor: FloatTensor [3, H, W]
+        labels:       FloatTensor [num_labels]   (0 or 1; unknown -> 0 but masked)
+        mask:         FloatTensor [num_labels]   (1 known, 0 unknown)
+    """
+    def __init__(
+        self,
+        image_paths: Sequence[str],
+        label_vectors: Sequence[Sequence[Optional[int]]],
+        label_masks: Sequence[Sequence[int]],
+        image_size: int = 224,
+    ) -> None:
+        assert len(image_paths) == len(label_vectors) == len(label_masks), (
+            "image_paths, label_vectors, label_masks must have same length"
+        )
+        self.image_paths: List[str] = list(image_paths)
+        # Convert vectors with None → 0, but mask will ensure they are ignored
+        label_vec_list = []
+        mask_list = []
+        for vec, mask in zip(label_vectors, label_masks):
+            v = [0 if (x is None) else int(x) for x in vec]
+            m = [int(x) for x in mask]
+            label_vec_list.append(v)
+            mask_list.append(m)
+        self.labels = torch.tensor(label_vec_list, dtype=torch.float32)  # [N, C]
+        self.masks = torch.tensor(mask_list, dtype=torch.float32)  # [N, C]
+        self.num_labels = self.labels.shape[1]
+        self.image_size = image_size
+        # ImageNet-style normalization
+        self.mean = torch.tensor([0.485, 0.456, 0.406]).view(3, 1, 1)
+        self.std = torch.tensor([0.229, 0.224, 0.225]).view(3, 1, 1)
+    def __len__(self) -> int:
+        return len(self.image_paths)
+    def _load_image(self, path: str) -> torch.Tensor:
+        """
+        Load image from disk, resize, convert to normalized tensor [3, H, W].
+        """
+        img = Image.open(path).convert("RGB")
+        img = img.resize((self.image_size, self.image_size))
+        arr = np.array(img, dtype=np.float32) / 255.0  # [H, W, C]
+        tensor = torch.from_numpy(arr).permute(2, 0, 1)  # [C, H, W]
+        tensor = (tensor - self.mean) / self.std
+        return tensor
+    def __getitem__(self, idx: int) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
+        path = self.image_paths[idx]
+        x = self._load_image(path)
+        y = self.labels[idx]
+        m = self.masks[idx]
+        return x, y, m

endoreg_db/utils/ai/model_training/losses.py ADDED Viewed

@@ -0,0 +1,68 @@
+# endoreg_db/utils/ai/model_training/losses.py
+from __future__ import annotations
+from typing import Optional
+import torch
+def compute_class_weights(
+    labels: torch.Tensor,
+    masks: torch.Tensor,
+    eps: float = 1e-6,
+) -> torch.Tensor:
+    """
+    Compute per-label weights based on positive counts.
+    labels: [N, C] in {0,1}
+    masks:  [N, C] in {0,1}, 1 = known, 0 = unknown
+    w_j = 1 / (pos_j + eps), normalized so that mean(w) ≈ 1.
+    """
+    known = masks > 0.5
+    pos_counts = (labels * known).sum(dim=0)  # [C]
+    raw_weights = 1.0 / (pos_counts + eps)
+    mean_w = raw_weights.mean().clamp(min=eps)
+    norm_weights = raw_weights / mean_w
+    return norm_weights  # [C]
+def focal_loss_with_mask(
+    logits: torch.Tensor,
+    targets: torch.Tensor,
+    masks: torch.Tensor,
+    class_weights: Optional[torch.Tensor] = None,
+    alpha: float = 0.25,
+    gamma: float = 2.0,
+    eps: float = 1e-6,
+) -> torch.Tensor:
+    """
+    Multi-label focal loss with:
+      - per-label class weights
+      - mask to ignore unknown labels.
+    logits: [B, C]  raw outputs
+    targets: [B, C] 0/1
+    masks: [B, C]   1 = known, 0 = unknown
+    class_weights: [C] or None
+    """
+    prob = torch.sigmoid(logits).clamp(eps, 1.0 - eps)  # [B, C]
+    # p_t: prob if y=1, (1-prob) if y=0
+    pt = prob * targets + (1.0 - prob) * (1.0 - targets)
+    alpha_factor = alpha * targets + (1.0 - alpha) * (1.0 - targets)
+    focal_factor = (1.0 - pt) ** gamma
+    loss = -alpha_factor * focal_factor * torch.log(pt)  # [B, C]
+    if class_weights is not None:
+        loss = loss * class_weights.view(1, -1)
+    # apply mask → ignore unknown labels
+    loss = loss * masks
+    denom = masks.sum().clamp(min=1.0)
+    return loss.sum() / denom

endoreg_db/utils/ai/model_training/metrics.py ADDED Viewed

@@ -0,0 +1,78 @@
+# endoreg_db/utils/ai/model_training/metrics.py
+from __future__ import annotations
+import torch
+def compute_metrics(logits, targets, masks, threshold=0.5):
+    """
+    Computes multi-label metrics:
+      - Global Precision/Recall/F1
+      - Per-label Precision/Recall/F1
+    """
+    probs = torch.sigmoid(logits)
+    preds = (probs >= threshold).int()
+    targets = targets.int()
+    masks = masks.int()
+    # Only evaluate where mask == 1
+    preds = preds * masks
+    targets = targets * masks
+    tp = (preds * targets).sum().item()
+    fp = (preds * (1 - targets)).sum().item()
+    fn = ((1 - preds) * targets).sum().item()
+    tn = ((1 - preds) * (1 - targets)).sum().item()
+    precision = tp / (tp + fp + 1e-6)
+    recall = tp / (tp + fn + 1e-6)
+    f1 = 2 * precision * recall / (precision + recall + 1e-6)
+    accuracy = (tp + tn) / (tp + tn + fp + fn + 1e-6)
+    # ------- PER-LABEL METRICS -------
+    per_label = []
+    num_labels = targets.shape[1]
+    for j in range(num_labels):
+        t = targets[:, j]
+        p = preds[:, j]
+        m = masks[:, j]
+        # consider only known labels
+        valid_idx = m == 1
+        if valid_idx.sum() == 0:
+            per_label.append(
+                {"precision": None, "recall": None, "f1": None, "support": 0}
+            )
+            continue
+        t = t[valid_idx]
+        p = p[valid_idx]
+        tp_j = ((p == 1) & (t == 1)).sum().item()
+        fp_j = ((p == 1) & (t == 0)).sum().item()
+        fn_j = ((p == 0) & (t == 1)).sum().item()
+        precision_j = tp_j / (tp_j + fp_j + 1e-6)
+        recall_j = tp_j / (tp_j + fn_j + 1e-6)
+        f1_j = 2 * precision_j * recall_j / (precision_j + recall_j + 1e-6)
+        per_label.append(
+            {
+                "precision": precision_j,
+                "recall": recall_j,
+                "f1": f1_j,
+                "support": t.sum().item(),
+            }
+        )
+    return {
+        "precision": precision,
+        "recall": recall,
+        "f1": f1,
+        "accuracy": accuracy,
+        "tp": tp,
+        "fp": fp,
+        "tn": tn,
+        "fn": fn,
+        "per_label": per_label,
+    }

endoreg-db 0.8.9.2__py3-none-any.whl → 0.8.9.10__py3-none-any.whl

Potentially problematic release.

endoreg-db 0.8.9.2py3-none-any.whl → 0.8.9.10py3-none-any.whl