PyPI - endoreg-db - Versions diffs - 0.5.3__py3-none-any.whl → 0.6.1__py3-none-any.whl - Mend

endoreg-db 0.5.3py3-none-any.whl → 0.6.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of endoreg-db might be problematic. Click here for more details.

Files changed (268) hide show

endoreg_db/admin.py +90 -1
endoreg_db/case_generator/case_generator.py +159 -0
endoreg_db/case_generator/lab_sample_factory.py +33 -0
endoreg_db/case_generator/utils.py +30 -0
endoreg_db/data/__init__.py +50 -4
endoreg_db/data/ai_model/data.yaml +7 -0
endoreg_db/data/{label → ai_model_label}/label/data.yaml +27 -1
endoreg_db/data/ai_model_label/label-set/data.yaml +21 -0
endoreg_db/data/ai_model_meta/default_multilabel_classification.yaml +5 -0
endoreg_db/data/ai_model_video_segmentation_label/base_segmentation.yaml +176 -0
endoreg_db/data/ai_model_video_segmentation_labelset/data.yaml +20 -0
endoreg_db/data/center/data.yaml +35 -5
endoreg_db/data/contraindication/bleeding.yaml +11 -0
endoreg_db/data/distribution/numeric/data.yaml +14 -0
endoreg_db/data/endoscope/data.yaml +93 -0
endoreg_db/data/examination_indication/endoscopy.yaml +8 -0
endoreg_db/data/examination_indication_classification/endoscopy.yaml +8 -0
endoreg_db/data/examination_indication_classification_choice/endoscopy.yaml +101 -0
endoreg_db/data/finding/data.yaml +141 -0
endoreg_db/data/finding_intervention/endoscopy.yaml +138 -0
endoreg_db/data/finding_intervention_type/endoscopy.yaml +15 -0
endoreg_db/data/finding_location_classification/colonoscopy.yaml +46 -0
endoreg_db/data/finding_location_classification_choice/colonoscopy.yaml +240 -0
endoreg_db/data/finding_morphology_classification/colonoscopy.yaml +48 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_circularity_default.yaml +34 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_nice.yaml +20 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_paris.yaml +65 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_planarity_default.yaml +56 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_surface_intact_default.yaml +39 -0
endoreg_db/data/finding_morphology_classification_choice/colonoscopy_size.yaml +57 -0
endoreg_db/data/finding_morphology_classification_type/colonoscopy.yaml +79 -0
endoreg_db/data/finding_type/data.yaml +30 -0
endoreg_db/data/gender/data.yaml +17 -0
endoreg_db/data/lab_value/cardiac_enzymes.yaml +7 -1
endoreg_db/data/lab_value/coagulation.yaml +6 -1
endoreg_db/data/lab_value/electrolytes.yaml +39 -1
endoreg_db/data/lab_value/gastrointestinal_function.yaml +12 -0
endoreg_db/data/lab_value/hematology.yaml +17 -2
endoreg_db/data/lab_value/hormones.yaml +6 -0
endoreg_db/data/lab_value/lipids.yaml +12 -3
endoreg_db/data/lab_value/misc.yaml +5 -2
endoreg_db/data/lab_value/renal_function.yaml +2 -1
endoreg_db/data/lx_client_tag/base.yaml +54 -0
endoreg_db/data/lx_client_type/base.yaml +30 -0
endoreg_db/data/lx_permission/base.yaml +24 -0
endoreg_db/data/lx_permission/endoreg.yaml +52 -0
endoreg_db/data/medication_indication/anticoagulation.yaml +44 -49
endoreg_db/data/names_first/first_names.yaml +51 -0
endoreg_db/data/names_last/last_names.yaml +51 -0
endoreg_db/data/network_device/data.yaml +30 -0
endoreg_db/data/organ/data.yaml +29 -0
endoreg_db/data/pdf_type/data.yaml +2 -1
endoreg_db/data/report_reader_flag/ukw-examination-generic.yaml +4 -0
endoreg_db/forms/__init__.py +3 -1
endoreg_db/forms/examination_form.py +11 -0
endoreg_db/forms/patient_finding_intervention_form.py +19 -0
endoreg_db/forms/patient_form.py +26 -0
endoreg_db/management/commands/__init__.py +0 -0
endoreg_db/management/commands/load_ai_model_data.py +57 -23
endoreg_db/management/commands/load_ai_model_label_data.py +59 -0
endoreg_db/management/commands/load_base_db_data.py +160 -118
endoreg_db/management/commands/{load_endoscope_type_data.py → load_contraindication_data.py} +3 -7
endoreg_db/management/commands/load_disease_data.py +29 -7
endoreg_db/management/commands/load_endoscope_data.py +68 -0
endoreg_db/management/commands/load_examination_indication_data.py +65 -0
endoreg_db/management/commands/load_finding_data.py +171 -0
endoreg_db/management/commands/load_lab_value_data.py +3 -3
endoreg_db/management/commands/load_lx_data.py +64 -0
endoreg_db/management/commands/load_medication_data.py +83 -21
endoreg_db/management/commands/load_name_data.py +37 -0
endoreg_db/management/commands/{load_endoscopy_processor_data.py → load_organ_data.py} +7 -9
endoreg_db/migrations/0001_initial.py +1206 -728
endoreg_db/migrations/0002_alter_frame_image_alter_rawframe_image.py +23 -0
endoreg_db/migrations/0003_alter_frame_image_alter_rawframe_image.py +23 -0
endoreg_db/migrations/0004_alter_rawvideofile_file_alter_video_file.py +25 -0
endoreg_db/migrations/0005_rawvideofile_frame_count_and_more.py +33 -0
endoreg_db/migrations/0006_frame_extracted_rawframe_extracted.py +23 -0
endoreg_db/migrations/0007_rename_pseudo_patient_video_patient_and_more.py +24 -0
endoreg_db/migrations/0008_remove_reportfile_patient_examination_and_more.py +48 -0
endoreg_db/models/__init__.py +331 -28
endoreg_db/models/ai_model/__init__.py +1 -0
endoreg_db/models/ai_model/ai_model.py +103 -0
endoreg_db/models/ai_model/lightning/__init__.py +3 -0
endoreg_db/models/ai_model/lightning/inference_dataset.py +53 -0
endoreg_db/models/ai_model/lightning/multilabel_classification_net.py +155 -0
endoreg_db/models/ai_model/lightning/postprocess.py +53 -0
endoreg_db/models/ai_model/lightning/predict.py +172 -0
endoreg_db/models/ai_model/lightning/prediction_visualizer.py +55 -0
endoreg_db/models/ai_model/lightning/preprocess.py +68 -0
endoreg_db/models/ai_model/lightning/run_visualizer.py +21 -0
endoreg_db/models/ai_model/model_meta.py +232 -6
endoreg_db/models/ai_model/model_type.py +13 -3
endoreg_db/models/annotation/__init__.py +31 -2
endoreg_db/models/annotation/anonymized_image_annotation.py +73 -18
endoreg_db/models/annotation/binary_classification_annotation_task.py +94 -57
endoreg_db/models/annotation/image_classification.py +73 -14
endoreg_db/models/annotation/video_segmentation_annotation.py +52 -0
endoreg_db/models/annotation/video_segmentation_labelset.py +20 -0
endoreg_db/models/case/__init__.py +1 -0
endoreg_db/models/{persons/patient/case → case}/case.py +4 -0
endoreg_db/models/case_template/__init__.py +10 -1
endoreg_db/models/case_template/case_template.py +57 -13
endoreg_db/models/case_template/case_template_rule.py +5 -5
endoreg_db/models/case_template/case_template_rule_value.py +19 -4
endoreg_db/models/center/__init__.py +7 -0
endoreg_db/models/center/center.py +31 -5
endoreg_db/models/center/center_product.py +0 -1
endoreg_db/models/center/center_resource.py +16 -2
endoreg_db/models/center/center_waste.py +6 -1
endoreg_db/models/contraindication/__init__.py +21 -0
endoreg_db/models/data_file/__init__.py +38 -5
endoreg_db/models/data_file/base_classes/__init__.py +6 -1
endoreg_db/models/data_file/base_classes/abstract_frame.py +64 -15
endoreg_db/models/data_file/base_classes/abstract_pdf.py +136 -0
endoreg_db/models/data_file/base_classes/abstract_video.py +744 -138
endoreg_db/models/data_file/base_classes/frame_helpers.py +17 -0
endoreg_db/models/data_file/base_classes/prepare_bulk_frames.py +19 -0
endoreg_db/models/data_file/base_classes/utils.py +80 -0
endoreg_db/models/data_file/frame.py +22 -38
endoreg_db/models/data_file/import_classes/__init__.py +4 -18
endoreg_db/models/data_file/import_classes/raw_pdf.py +162 -90
endoreg_db/models/data_file/import_classes/raw_video.py +239 -294
endoreg_db/models/data_file/metadata/__init__.py +10 -0
endoreg_db/models/data_file/metadata/pdf_meta.py +4 -0
endoreg_db/models/data_file/metadata/sensitive_meta.py +265 -6
endoreg_db/models/data_file/metadata/video_meta.py +116 -50
endoreg_db/models/data_file/report_file.py +30 -63
endoreg_db/models/data_file/video/__init__.py +6 -2
endoreg_db/models/data_file/video/video.py +187 -16
endoreg_db/models/data_file/video_segment.py +162 -55
endoreg_db/models/disease.py +25 -2
endoreg_db/models/emission/__init__.py +5 -1
endoreg_db/models/emission/emission_factor.py +71 -6
endoreg_db/models/event.py +51 -0
endoreg_db/models/examination/__init__.py +6 -1
endoreg_db/models/examination/examination.py +53 -12
endoreg_db/models/examination/examination_indication.py +170 -0
endoreg_db/models/examination/examination_time.py +31 -5
endoreg_db/models/examination/examination_time_type.py +28 -4
endoreg_db/models/examination/examination_type.py +28 -6
endoreg_db/models/finding/__init__.py +11 -0
endoreg_db/models/finding/finding.py +75 -0
endoreg_db/models/finding/finding_intervention.py +60 -0
endoreg_db/models/finding/finding_location_classification.py +94 -0
endoreg_db/models/finding/finding_morphology_classification.py +89 -0
endoreg_db/models/finding/finding_type.py +22 -0
endoreg_db/models/hardware/endoscope.py +16 -0
endoreg_db/models/hardware/endoscopy_processor.py +31 -19
endoreg_db/models/label/label.py +35 -7
endoreg_db/models/laboratory/lab_value.py +12 -3
endoreg_db/models/logging/__init__.py +8 -1
endoreg_db/models/lx/__init__.py +4 -0
endoreg_db/models/lx/client.py +57 -0
endoreg_db/models/lx/identity.py +34 -0
endoreg_db/models/lx/permission.py +18 -0
endoreg_db/models/lx/user.py +16 -0
endoreg_db/models/medication/__init__.py +19 -1
endoreg_db/models/medication/medication.py +7 -122
endoreg_db/models/medication/medication_indication.py +50 -0
endoreg_db/models/medication/medication_indication_type.py +34 -0
endoreg_db/models/medication/medication_intake_time.py +26 -0
endoreg_db/models/medication/medication_schedule.py +37 -0
endoreg_db/models/network/__init__.py +7 -1
endoreg_db/models/network/network_device.py +13 -8
endoreg_db/models/organ/__init__.py +38 -0
endoreg_db/models/other/__init__.py +19 -1
endoreg_db/models/other/distribution/__init__.py +44 -0
endoreg_db/models/other/distribution/base_value_distribution.py +20 -0
endoreg_db/models/other/distribution/date_value_distribution.py +91 -0
endoreg_db/models/other/distribution/multiple_categorical_value_distribution.py +32 -0
endoreg_db/models/other/distribution/numeric_value_distribution.py +97 -0
endoreg_db/models/other/distribution/single_categorical_value_distribution.py +22 -0
endoreg_db/models/other/distribution.py +1 -211
endoreg_db/models/other/material.py +4 -0
endoreg_db/models/other/transport_route.py +2 -1
endoreg_db/models/patient/__init__.py +24 -0
endoreg_db/models/patient/patient_examination.py +182 -0
endoreg_db/models/patient/patient_finding.py +143 -0
endoreg_db/models/patient/patient_finding_intervention.py +26 -0
endoreg_db/models/patient/patient_finding_location.py +120 -0
endoreg_db/models/patient/patient_finding_morphology.py +166 -0
endoreg_db/models/persons/__init__.py +29 -2
endoreg_db/models/persons/examiner/examiner.py +48 -4
endoreg_db/models/persons/patient/__init__.py +1 -1
endoreg_db/models/persons/patient/patient.py +227 -54
endoreg_db/models/persons/patient/patient_disease.py +6 -0
endoreg_db/models/persons/patient/patient_event.py +31 -1
endoreg_db/models/persons/patient/patient_examination_indication.py +32 -0
endoreg_db/models/persons/patient/patient_lab_sample.py +4 -2
endoreg_db/models/persons/patient/patient_lab_value.py +37 -16
endoreg_db/models/persons/patient/patient_medication.py +27 -12
endoreg_db/models/persons/patient/patient_medication_schedule.py +62 -2
endoreg_db/models/prediction/__init__.py +7 -1
endoreg_db/models/prediction/image_classification.py +20 -6
endoreg_db/models/prediction/video_prediction_meta.py +151 -89
endoreg_db/models/product/__init__.py +10 -1
endoreg_db/models/product/product.py +15 -2
endoreg_db/models/product/product_group.py +8 -0
endoreg_db/models/product/product_material.py +4 -0
endoreg_db/models/product/product_weight.py +12 -0
endoreg_db/models/product/reference_product.py +19 -3
endoreg_db/models/quiz/__init__.py +8 -1
endoreg_db/models/report_reader/__init__.py +6 -1
endoreg_db/serializers/__init__.py +1 -1
endoreg_db/serializers/annotation.py +2 -5
endoreg_db/serializers/frame.py +1 -5
endoreg_db/serializers/patient.py +26 -3
endoreg_db/serializers/prediction.py +2 -7
endoreg_db/serializers/raw_video_meta_validation.py +13 -0
endoreg_db/serializers/video.py +6 -13
endoreg_db/serializers/video_segmentation.py +492 -0
endoreg_db/templates/admin/patient_finding_intervention.html +253 -0
endoreg_db/templates/admin/start_examination.html +12 -0
endoreg_db/templates/timeline.html +176 -0
endoreg_db/urls.py +173 -0
endoreg_db/utils/__init__.py +36 -1
endoreg_db/utils/dataloader.py +45 -19
endoreg_db/utils/dates.py +39 -0
endoreg_db/utils/hashs.py +122 -4
endoreg_db/utils/names.py +74 -0
endoreg_db/utils/parse_and_generate_yaml.py +46 -0
endoreg_db/utils/pydantic_models/__init__.py +6 -0
endoreg_db/utils/pydantic_models/db_config.py +57 -0
endoreg_db/utils/validate_endo_roi.py +19 -0
endoreg_db/utils/validate_subcategory_dict.py +91 -0
endoreg_db/utils/video/__init__.py +13 -0
endoreg_db/utils/video/extract_frames.py +121 -0
endoreg_db/utils/video/transcode_videofile.py +111 -0
endoreg_db/views/__init__.py +2 -0
endoreg_db/views/csrf.py +7 -0
endoreg_db/views/patient_views.py +90 -0
endoreg_db/views/raw_video_meta_validation_views.py +38 -0
endoreg_db/views/report_views.py +96 -0
endoreg_db/views/video_segmentation_views.py +149 -0
endoreg_db/views/views_for_timeline.py +46 -0
endoreg_db/views.py +0 -3
endoreg_db-0.6.1.dist-info/METADATA +151 -0
endoreg_db-0.6.1.dist-info/RECORD +420 -0
{endoreg_db-0.5.3.dist-info → endoreg_db-0.6.1.dist-info}/WHEEL +1 -1
endoreg_db/data/active_model/data.yaml +0 -3
endoreg_db/data/label/label-set/data.yaml +0 -18
endoreg_db/management/commands/delete_legacy_images.py +0 -19
endoreg_db/management/commands/delete_legacy_videos.py +0 -17
endoreg_db/management/commands/extract_legacy_video_frames.py +0 -18
endoreg_db/management/commands/import_legacy_images.py +0 -94
endoreg_db/management/commands/import_legacy_videos.py +0 -76
endoreg_db/management/commands/load_label_data.py +0 -67
endoreg_db/migrations/0002_anonymizedimagelabel_anonymousimageannotation_and_more.py +0 -55
endoreg_db/migrations/0003_anonymousimageannotation_original_image_url_and_more.py +0 -39
endoreg_db/migrations/0004_alter_rawpdffile_file.py +0 -20
endoreg_db/migrations/0005_uploadedfile_alter_rawpdffile_file_anonymizedfile.py +0 -40
endoreg_db/migrations/0006_alter_rawpdffile_file.py +0 -20
endoreg_db/migrations/0007_networkdevicelogentry_datetime_and_more.py +0 -43
endoreg_db/migrations/0008_networkdevicelogentry_aglnet_ip_and_more.py +0 -28
endoreg_db/migrations/0009_alter_networkdevicelogentry_vpn_service_status.py +0 -18
endoreg_db/migrations/0010_remove_networkdevicelogentry_hostname.py +0 -17
endoreg_db/models/legacy_data/__init__.py +0 -3
endoreg_db/models/legacy_data/image.py +0 -34
endoreg_db/models/patient_examination/__init__.py +0 -35
endoreg_db/utils/video_metadata.py +0 -87
endoreg_db-0.5.3.dist-info/METADATA +0 -28
endoreg_db-0.5.3.dist-info/RECORD +0 -319
/endoreg_db/{models/persons/patient/case → case_generator}/__init__.py +0 -0
/endoreg_db/data/{label → ai_model_label}/label-type/data.yaml +0 -0
/endoreg_db/data/{model_type → ai_model_type}/data.yaml +0 -0
/endoreg_db/{data/distribution/numeric/.init → management/__init__.py} +0 -0
/endoreg_db/management/commands/{load_report_reader_flag.py → load_report_reader_flag_data.py} +0 -0
{endoreg_db-0.5.3.dist-info → endoreg_db-0.6.1.dist-info}/licenses/LICENSE +0 -0

endoreg_db/models/data_file/import_classes/raw_video.py CHANGED Viewed

@@ -1,46 +1,70 @@
-from django.db import models
+import shutil
+import subprocess
 from pathlib import Path
-from collections import defaultdict, Counter
+from django.db import models
+from typing import TYPE_CHECKING, List, Tuple
+from icecream import ic
+from tqdm import tqdm
+import cv2
+from django.core.validators import FileExtensionValidator
+from django.core.files.storage import FileSystemStorage
+from endoreg_db.utils.validate_endo_roi import validate_endo_roi
+from ..base_classes.utils import (
+    anonymize_frame,
+    RAW_VIDEO_DIR_NAME,
+    VIDEO_DIR,
+    STORAGE_LOCATION,
+)
+from ..base_classes.abstract_video import AbstractVideoFile
+if TYPE_CHECKING:
+    # import Queryset
+    from django.db.models import QuerySet
+    from endoreg_db.models import (
+        SensitiveMeta,
+        LabelVideoSegment,
+    )
-from endoreg_db.utils.hashs import get_video_hash
-from endoreg_db.utils.file_operations import get_uuid_filename
-from endoreg_db.utils.ocr import extract_text_from_rois
-import shutil
-import os
-import subprocess
+# pylint: disable=attribute-defined-outside-init,no-member
+class RawVideoFile(AbstractVideoFile):
+    """ """
-from ..metadata import VideoMeta, SensitiveMeta
+    file = models.FileField(
+        upload_to=RAW_VIDEO_DIR_NAME,
+        validators=[FileExtensionValidator(allowed_extensions=["mp4"])],  # FIXME
+        storage=FileSystemStorage(location=STORAGE_LOCATION.resolve().as_posix()),
+    )
-class RawVideoFile(models.Model):
-    uuid = models.UUIDField()
-    file = models.FileField(upload_to="raw_data/")
-    sensitive_meta = models.OneToOneField(
-        "SensitiveMeta", on_delete=models.CASCADE, blank=True, null=True
-    )
+    patient = models.ForeignKey(
+        "Patient", on_delete=models.SET_NULL, blank=True, null=True
+    )
-    center = models.ForeignKey("Center", on_delete=models.CASCADE)
-    processor = models.ForeignKey(
-        "EndoscopyProcessor", on_delete=models.CASCADE, blank=True, null=True
+    sensitive_meta = models.ForeignKey(
+        "SensitiveMeta",
+        on_delete=models.SET_NULL,
+        related_name="raw_videos",
+        null=True,
+        blank=True,
     )
-    video_meta = models.OneToOneField(
-        "VideoMeta", on_delete=models.CASCADE, blank=True, null=True
+    video = models.ForeignKey(
+        "Video",
+        on_delete=models.SET_NULL,
+        related_name="raw_videos",
+        null=True,
+        blank=True,
     )
-    original_file_name = models.CharField(max_length=255)
-    video_hash = models.CharField(max_length=255, unique=True)
-    uploaded_at = models.DateTimeField(auto_now_add=True)
-    # Frame Extraction States
-    state_frames_required = models.BooleanField(default=True)
-    state_frames_extracted = models.BooleanField(default=False)
-    # Video
-    ## Prediction
-    state_initial_prediction_required = models.BooleanField(default=True)
-    state_initial_prediction_completed = models.BooleanField(default=False)
-    state_initial_prediction_import_required = models.BooleanField(default=True)
-    state_initial_prediction_import_completed = models.BooleanField(default=False)
+    if TYPE_CHECKING:
+        sensitive_meta: "SensitiveMeta"
+        label_video_segments: "QuerySet[LabelVideoSegment]"
+    # Crop Frames
+    state_anonymized_frames_generated = models.BooleanField(default=False)
     ## OCR
     state_ocr_required = models.BooleanField(default=True)
     state_ocr_completed = models.BooleanField(default=False)
@@ -50,294 +74,215 @@ class RawVideoFile(models.Model):
     state_sensitive_data_retrieved = models.BooleanField(default=False)
-    # Dataset complete?
-    state_histology_required = models.BooleanField(blank=True, null=True)
-    state_histology_available = models.BooleanField(default=False)
-    state_follow_up_intervention_required = models.BooleanField(blank=True, null=True)
-    state_follow_up_intervention_available = models.BooleanField(default=False)
-    state_dataset_complete = models.BooleanField(default=False)
-    # Finalizing for Upload
-    state_anonym_video_required = models.BooleanField(default=True)
-    state_anonym_video_performed = models.BooleanField(default=False)
-    state_original_reports_deleted = models.BooleanField(default=False)
-    state_original_video_deleted = models.BooleanField(default=False)
-    state_finalized = models.BooleanField(default=False)
-    frame_dir = models.CharField(max_length=255)
-    prediction_dir = models.CharField(max_length=255)
-    @classmethod
-    def create_from_file(
-        cls,
-        file_path: Path,
-        video_dir: Path,
-        center_name: str,
-        processor_name: str,
-        frame_dir_parent: Path,
-        save: bool = True,
-    ):
-        from endoreg_db.models import Center, EndoscopyProcessor
-        print(f"Creating RawVideoFile from {file_path}")
-        original_file_name = file_path.name
-        # Rename and and move
-        new_file_name, uuid = get_uuid_filename(file_path)
-        framedir: Path = frame_dir_parent / str(uuid)
-        if not framedir.exists():
-            framedir.mkdir(parents=True, exist_ok=True)
-        if not video_dir.exists():
-            video_dir.mkdir(parents=True, exist_ok=True)
-        video_hash = get_video_hash(file_path)
-        center = Center.objects.get(name=center_name)
-        assert center is not None, "Center must exist"
-        processor = EndoscopyProcessor.objects.get(name=processor_name)
-        assert processor is not None, "Processor must exist"
-        new_filepath = video_dir / new_file_name
-        print(f"Moving {file_path} to {new_filepath}")
-        shutil.move(file_path.resolve().as_posix(), new_filepath.resolve().as_posix())
-        print(f"Moved to {new_filepath}")
-        # Make sure file was transferred correctly and hash is correct
-        if not new_filepath.exists():
-            print(f"File {file_path} was not transferred correctly to {new_filepath}")
-            return None
-        new_hash = get_video_hash(new_filepath)
-        if new_hash != video_hash:
-            print(f"Hash of file {file_path} is not correct")
-            return None
-        # make sure that no other file with the same hash exists
-        if cls.objects.filter(video_hash=video_hash).exists():
-            # log and print warnint
-            print(f"File with hash {video_hash} already exists")
-            return None
-        else:
-            print(center)
-            # Create a new instance of RawVideoFile
-            raw_video_file = cls(
-                uuid=uuid,
-                file=new_filepath.resolve().as_posix(),
-                center=center,
-                processor=processor,
-                original_file_name=original_file_name,
-                video_hash=video_hash,
-                frame_dir=framedir.as_posix(),
-            )
-            # Save the instance to the database
-            raw_video_file.save()
+    # Censor Outside
+    state_censor_outside_required = models.BooleanField(default=True)
+    state_censor_outside_completed = models.BooleanField(default=False)
+    state_make_anonymized_video_required = models.BooleanField(default=True)
+    state_make_anonymized_video_completed = models.BooleanField(default=False)
+    def get_anonymized_video_path(self):
+        video_dir = VIDEO_DIR
+        video_suffix = Path(self.file.path).suffix
+        video_name = f"{self.uuid}{video_suffix}"
+        anonymized_video_name = f"TMP_anonymized_{video_name}"
+        anonymized_video_path = video_dir / anonymized_video_name
+        return anonymized_video_path
+    def censor_outside_frames(self):
+        assert self.state_frames_extracted, "Frames not extracted"
+        assert self.state_initial_prediction_completed, (
+            "Initial prediction not completed"
+        )
+        assert self.state_sensitive_data_retrieved, "Sensitive data not retrieved"
+        ic(
+            "WARNING: Outside validation is not yet implemented and automatically set to true in this function"
+        )
+        self.state_outside_validated = True
+        self.save()
-            return raw_video_file
+        assert self.state_outside_validated, "Outside validation not completed"
-    def __str__(self):
-        return self.file.name
+        outside_frame_paths = self.get_outside_frame_paths()
-    def get_endo_roi(self):
-        endo_roi = self.video_meta.get_endo_roi()
-        return endo_roi
+        if not outside_frame_paths:
+            ic("No outside frames found")
-    # video meta should be created when video file is created
-    def save(self, *args, **kwargs):
-        if self.video_meta is None:
-            center = self.center
-            processor = self.processor
-            self.video_meta = VideoMeta.objects.create(
-                center=center, processor=processor
-            )
-            self.video_meta.initialize_ffmpeg_meta(self.file.path)
-        super(RawVideoFile, self).save(*args, **kwargs)
-    def extract_frames(
-        self,
-        quality: int = 2,
-        frame_dir: Path = None,
-        overwrite: bool = False,
-        ext="jpg",
-    ):
-        """
-        Extract frames from the video file and save them to the frame_dir.
-        For this, ffmpeg must be available in in the current environment.
-        """
-        if frame_dir is None:
-            frame_dir = Path(self.frame_dir)
         else:
-            frame_dir = Path(frame_dir)
+            ic(f"Found {len(outside_frame_paths)} outside frames")
+            # use cv2 to replace all outside frames with completely black frames
-        if not frame_dir.exists():
-            frame_dir.mkdir(parents=True, exist_ok=True)
+            for frame_path in tqdm(outside_frame_paths):
+                frame = cv2.imread(frame_path.as_posix())
+                frame.fill(0)
+                cv2.imwrite(frame_path.as_posix(), frame)
-        if not overwrite and len(list(frame_dir.glob("*.jpg"))) > 0:
-            print(f"Frames already extracted for {self.file.name}")
-            return
+        self.state_censor_outside_required = False
+        self.state_censor_outside_completed = True
+        self.save()
-        video_path = Path(self.file.path).resolve().as_posix()
+    def get_anonymized_frame_dir(self):
+        anonymized_frame_dir = Path(self.frame_dir).parent / f"tmp_{self.uuid}"
+        return anonymized_frame_dir
-        frame_path_string = frame_dir.resolve().as_posix()
-        command = [
-            "ffmpeg",
-            "-i",
-            video_path,  #
-            "-q:v",
-            str(quality),
-            os.path.join(frame_path_string, f"frame_%07d.{ext}"),
-        ]
+    def make_temporary_anonymized_frames(self) -> Tuple[Path, List[Path]]:
+        anonymized_frame_dir = self.get_anonymized_frame_dir()
-        # Ensure FFmpeg is available
-        if not shutil.which("ffmpeg"):
-            raise EnvironmentError(
-                "FFmpeg could not be found. Ensure it is installed and in your PATH."
-            )
+        assert self.state_frames_extracted, "Frames not extracted"
+        assert self.processor, "Processor not set"
-        # Extract frames from the video file
-        # Execute the command
-        result = subprocess.run(command, capture_output=True, text=True)
-        if result.returncode != 0:
-            raise Exception(f"Error extracting frames: {result.stderr}")
+        anonymized_frame_dir.mkdir(parents=True, exist_ok=True)
+        endo_roi = self.get_endo_roi()
+        assert validate_endo_roi(endo_roi), "Endoscope ROI is not valid"
+        generated_frame_paths = []
-        self.state_frames_extracted = True
+        all_frames = self.frames.all()
+        outside_frames = self.get_outside_frames()  #
+        outside_frame_numbers = [frame.frame_number for frame in outside_frames]
-        return f"Frames extracted to {frame_dir} ({frame_path_string}) with quality {quality}"
+        # anonymize frames: copy endo-roi content while making other pixels black. (frames are Path objects to jpgs or pngs)
+        for frame in tqdm(all_frames):
+            frame_path = Path(frame.image.path)
+            frame_name = frame_path.name
+            frame_number = frame.frame_number
-    def delete_frames(self):
-        """
-        Delete frames extracted from the video file.
-        """
-        frame_dir = Path(self.frame_dir)
-        if frame_dir.exists():
-            shutil.rmtree(frame_dir)
-            self.state_frames_extracted = False
-            self.save()
-            return f"Frames deleted from {frame_dir}"
-        else:
-            return f"No frames to delete for {self.file.name}"
+            if frame_number in outside_frame_numbers:
+                all_black = True
+            else:
+                all_black = False
-    def get_frame_path(self, n: int = 0):
-        """
-        Get the path to the n-th frame extracted from the video file.
-        Note that the frame numbering starts at 1 in our naming convention.
-        """
-        # Adjust index
-        n = n + 1
+            target_frame_path = anonymized_frame_dir / frame_name
+            anonymize_frame(
+                frame_path, target_frame_path, endo_roi, all_black=all_black
+            )
+            generated_frame_paths.append(target_frame_path)
-        frame_dir = Path(self.frame_dir)
-        return frame_dir / f"frame_{n:07d}.jpg"
-    def get_frame_paths(self):
-        if not self.state_frames_extracted:
-            return None
-        frame_dir = Path(self.frame_dir)
-        paths = [p for p in frame_dir.glob('*')]
-        indices = [int(p.stem.split("_")[1]) for p in paths]
-        path_index_tuples = list(zip(paths, indices))
-        # sort ascending by index
-        path_index_tuples.sort(key=lambda x: x[1])
-        paths, indices = zip(*path_index_tuples)
-        return paths
-    def get_prediction_dir(self):
-        return Path(self.prediction_dir)
-    def get_predictions_path(self, suffix = ".json"):
-        pred_dir = self.get_prediction_dir()
-        return pred_dir.joinpath("predictions").with_suffix(suffix)
-    def get_smooth_predictions_path(self, suffix = ".json"):
-        pred_dir = self.get_prediction_dir()
-        return pred_dir.joinpath("smooth_predictions").with_suffix(suffix)
-    def get_binary_predictions_path(self, suffix = ".json"):
-        pred_dir = self.get_prediction_dir()
-        return pred_dir.joinpath("binary_predictions").with_suffix(suffix)
-    def get_raw_sequences_path(self, suffix = ".json"):
-        pred_dir = self.get_prediction_dir()
-        return pred_dir.joinpath("raw_sequences").with_suffix(suffix)
-    def get_filtered_sequences_path(self, suffix=".json"):
-        pred_dir = self.get_prediction_dir()
-        return pred_dir.joinpath("filtered_sequences").with_suffix(suffix)
-    def extract_text_information(self, frame_fraction: float = 0.001):
+        return anonymized_frame_dir, generated_frame_paths
+    def make_anonymized_video(self):
         """
-        Extract text information from the video file.
-        Makes sure that frames are extracted and then processes the frames.
-        gets all frames from frame_dir and selects a fraction of them to process (at least 1)
+        Make an anonymized video from the anonymized frames.
         """
-        if not self.state_frames_extracted:
-            print(f"Frames not extracted for {self.file.name}")
-            return None
-        processor = self.processor
+        assert self.state_initial_prediction_completed, (
+            "Initial prediction not completed"
+        )
+        assert self.state_sensitive_data_retrieved, "Sensitive data not retrieved"
-        frame_dir = Path(self.frame_dir)
-        frames = list(frame_dir.glob("*"))
-        n_frames = len(frames)
-        n_frames_to_process = max(1, int(frame_fraction * n_frames))
-        # Select evenly spaced frames
-        frames = frames[:: n_frames // n_frames_to_process]
+        ic(
+            "WARNING: Outside validation is not yet implemented and automatically set to true in this function"
+        )
+        self.state_outside_validated = True
+        self.save()
-        # extract text from each frame and store the value to
-        # defaultdict of lists.
-        # Then, extract the most frequent value from each list
-        # Finally, return the dictionary of most frequent values
+        assert self.state_outside_validated, "Outside validation not completed"
-        # Create a defaultdict to store the extracted text from each ROI
-        rois_texts = defaultdict(list)
+        _anonymized_frame_dir, generated_frame_paths = (
+            self.make_temporary_anonymized_frames()
+        )
-        print(f"Processing {n_frames_to_process} frames from {self.file.name}")
-        # Process frames
-        for frame_path in frames[:n_frames_to_process]:
-            extracted_texts = extract_text_from_rois(frame_path, processor)
-            for roi, text in extracted_texts.items():
-                rois_texts[roi].append(text)
+        anonymized_video_path = self.get_anonymized_video_path()
+        # if anonymized video already exists, delete it
+        if anonymized_video_path.exists():
+            anonymized_video_path.unlink()
-        # Get the most frequent text values for each ROI using Counter
-        for key in rois_texts.keys():
-            counter = Counter([text for text in rois_texts[key] if text])
-            rois_texts[key] = counter.most_common(1)[0][0] if counter else None
+        # Use ffmpeg and the frame paths to create a video
+        fps = self.get_fps()
+        height, width = cv2.imread(generated_frame_paths[0].as_posix()).shape[:2]
+        ic("Assembling anonymized video")
+        ic(f"Frame width: {width}, height: {height}")
+        ic(f"FPS: {fps}")
-        return rois_texts
+        command = [
+            "ffmpeg",
+            "-y",
+            "-pattern_type",
+            "glob",
+            "-f",
+            "image2",
+            "-framerate",
+            str(fps),
+            "-i",
+            f"{generated_frame_paths[0].parent.as_posix()}/frame_[0-9]*.jpg",
+            "-c:v",
+            "libx264",
+            "-pix_fmt",
+            "yuv420p",
+            "-vf",
+            f"scale={width}:{height}",
+            anonymized_video_path.as_posix(),
+        ]
-    def update_text_metadata(self, ocr_frame_fraction=0.001):
-        print(f"Updating metadata for {self.file.name}")
-        texts = self.extract_text_information(ocr_frame_fraction)
+        subprocess.run(command, check=True)
+        ic(f"Anonymized video saved at {anonymized_video_path}")
-        self.sensitive_meta = SensitiveMeta.create_from_dict(texts)
-        self.state_sensitive_data_retrieved = True
+        self.state_make_anonymized_video_required = False
+        self.state_make_anonymized_video_completed = True
         self.save()
-        # Resulting dict depends on defined ROIs for this processor type!
-    def update_video_meta(self):
-        video_meta = self.video_meta
-        video_path = Path(self.file.path)
-        if video_meta is None:
-            video_meta = VideoMeta.create_from_video(video_path)
-            self.video_meta = video_meta
-            self.save()
+        return anonymized_video_path, generated_frame_paths
+    def delete_frames_anonymized(self):
+        """
+        Delete anonymized frames extracted from the video file.
+        """
+        frame_dir = Path(self.frame_dir)
+        anonymized_frame_dir = frame_dir.parent / f"anonymized_{self.uuid}"
+        if anonymized_frame_dir.exists():
+            shutil.rmtree(anonymized_frame_dir)
+            return f"Anonymized frames deleted from {anonymized_frame_dir}"
         else:
-            video_meta.update_meta(video_path)
-    def get_fps(self):
-        if self.video_meta is None:
-            self.update_video_meta()
-        if self.video_meta.ffmpeg_meta is None:
-            self.video_meta.initialize_ffmpeg_meta(self.file.path)
+            return f"No anonymized frames to delete for {self.file.name}"
+    def get_or_create_video(self):
+        from endoreg_db.models import Video, Patient, PatientExamination
+        video = self.video
+        expected_path = self.get_anonymized_video_path()
+        if not video:
+            video_hash = self.video_hash
+            if Video.objects.filter(video_hash=video_hash).exists():
+                video = Video.objects.filter(video_hash=video_hash).first()
+            else:
+                if not expected_path.exists():
+                    ic(
+                        f"No anonymized video found at {expected_path}, Creating new one"
+                    )
+                    video_path, frame_paths = self.make_anonymized_video()
+                else:
+                    ic(f"Anonymized video found at {expected_path}")
+                    video_path = expected_path
+                    frame_dir = self.get_anonymized_frame_dir()
+                    ic(f"Frame dir: {frame_dir}")
+                    frame_paths = list(frame_dir.glob("*.jpg"))
+                    ic(f"Found {len(frame_paths)} frames")
+                video_object = Video.create_from_file(
+                    video_path,
+                    self.center,
+                    self.processor,
+                    video_dir=VIDEO_DIR,
+                    frame_paths=frame_paths,
+                )
+                ex: PatientExamination = self.sensitive_meta.pseudo_examination
+                pat: Patient = self.sensitive_meta.pseudo_patient
+                video_object.examination = ex
+                video_object.patient = pat
+                self.video = video_object
+                self.save()
+                video_object.sync_from_raw_video()
+                ic(f"Video object created: {video_object}")
+                return video_object
+            self.video = video
+            self.save()
-        return self.video_meta.get_fps()
+        # self.vi
+        return video

endoreg_db/models/data_file/metadata/__init__.py CHANGED Viewed

@@ -1,3 +1,13 @@
 from .sensitive_meta import SensitiveMeta
 from .pdf_meta import PdfMeta, PdfType
 from .video_meta import VideoMeta, FFMpegMeta, VideoImportMeta
+__all__ = [
+    "SensitiveMeta",
+    "PdfMeta",
+    "PdfType",
+    "VideoMeta",
+    "FFMpegMeta",
+    "VideoImportMeta",
+]

endoreg_db/models/data_file/metadata/pdf_meta.py CHANGED Viewed

@@ -52,6 +52,10 @@ class PdfType(models.Model):
         return summary
+    @classmethod
+    def default_pdf_type(cls):
+        return PdfType.objects.get(name="ukw-endoscopy-examination-report-generic")
 class PdfMeta(models.Model):
     pdf_type = models.ForeignKey(PdfType, on_delete=models.CASCADE)
     date = models.DateField()

endoreg-db 0.5.3__py3-none-any.whl → 0.6.1__py3-none-any.whl

Potentially problematic release.

endoreg-db 0.5.3py3-none-any.whl → 0.6.1py3-none-any.whl