PyPI - endoreg-db - Versions diffs - 0.5.3__py3-none-any.whl → 0.6.1__py3-none-any.whl - Mend

endoreg-db 0.5.3py3-none-any.whl → 0.6.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of endoreg-db might be problematic. Click here for more details.

Files changed (268) hide show

endoreg_db/admin.py +90 -1
endoreg_db/case_generator/case_generator.py +159 -0
endoreg_db/case_generator/lab_sample_factory.py +33 -0
endoreg_db/case_generator/utils.py +30 -0
endoreg_db/data/__init__.py +50 -4
endoreg_db/data/ai_model/data.yaml +7 -0
endoreg_db/data/{label → ai_model_label}/label/data.yaml +27 -1
endoreg_db/data/ai_model_label/label-set/data.yaml +21 -0
endoreg_db/data/ai_model_meta/default_multilabel_classification.yaml +5 -0
endoreg_db/data/ai_model_video_segmentation_label/base_segmentation.yaml +176 -0
endoreg_db/data/ai_model_video_segmentation_labelset/data.yaml +20 -0
endoreg_db/data/center/data.yaml +35 -5
endoreg_db/data/contraindication/bleeding.yaml +11 -0
endoreg_db/data/distribution/numeric/data.yaml +14 -0
endoreg_db/data/endoscope/data.yaml +93 -0
endoreg_db/data/examination_indication/endoscopy.yaml +8 -0
endoreg_db/data/examination_indication_classification/endoscopy.yaml +8 -0
endoreg_db/data/examination_indication_classification_choice/endoscopy.yaml +101 -0
endoreg_db/data/finding/data.yaml +141 -0
endoreg_db/data/finding_intervention/endoscopy.yaml +138 -0
endoreg_db/data/finding_intervention_type/endoscopy.yaml +15 -0
endoreg_db/data/finding_location_classification/colonoscopy.yaml +46 -0
endoreg_db/data/finding_location_classification_choice/colonoscopy.yaml +240 -0
endoreg_db/data/finding_morphology_classification/colonoscopy.yaml +48 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_circularity_default.yaml +34 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_nice.yaml +20 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_paris.yaml +65 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_planarity_default.yaml +56 -0
endoreg_db/data/finding_morphology_classification_choice/colon_lesion_surface_intact_default.yaml +39 -0
endoreg_db/data/finding_morphology_classification_choice/colonoscopy_size.yaml +57 -0
endoreg_db/data/finding_morphology_classification_type/colonoscopy.yaml +79 -0
endoreg_db/data/finding_type/data.yaml +30 -0
endoreg_db/data/gender/data.yaml +17 -0
endoreg_db/data/lab_value/cardiac_enzymes.yaml +7 -1
endoreg_db/data/lab_value/coagulation.yaml +6 -1
endoreg_db/data/lab_value/electrolytes.yaml +39 -1
endoreg_db/data/lab_value/gastrointestinal_function.yaml +12 -0
endoreg_db/data/lab_value/hematology.yaml +17 -2
endoreg_db/data/lab_value/hormones.yaml +6 -0
endoreg_db/data/lab_value/lipids.yaml +12 -3
endoreg_db/data/lab_value/misc.yaml +5 -2
endoreg_db/data/lab_value/renal_function.yaml +2 -1
endoreg_db/data/lx_client_tag/base.yaml +54 -0
endoreg_db/data/lx_client_type/base.yaml +30 -0
endoreg_db/data/lx_permission/base.yaml +24 -0
endoreg_db/data/lx_permission/endoreg.yaml +52 -0
endoreg_db/data/medication_indication/anticoagulation.yaml +44 -49
endoreg_db/data/names_first/first_names.yaml +51 -0
endoreg_db/data/names_last/last_names.yaml +51 -0
endoreg_db/data/network_device/data.yaml +30 -0
endoreg_db/data/organ/data.yaml +29 -0
endoreg_db/data/pdf_type/data.yaml +2 -1
endoreg_db/data/report_reader_flag/ukw-examination-generic.yaml +4 -0
endoreg_db/forms/__init__.py +3 -1
endoreg_db/forms/examination_form.py +11 -0
endoreg_db/forms/patient_finding_intervention_form.py +19 -0
endoreg_db/forms/patient_form.py +26 -0
endoreg_db/management/commands/__init__.py +0 -0
endoreg_db/management/commands/load_ai_model_data.py +57 -23
endoreg_db/management/commands/load_ai_model_label_data.py +59 -0
endoreg_db/management/commands/load_base_db_data.py +160 -118
endoreg_db/management/commands/{load_endoscope_type_data.py → load_contraindication_data.py} +3 -7
endoreg_db/management/commands/load_disease_data.py +29 -7
endoreg_db/management/commands/load_endoscope_data.py +68 -0
endoreg_db/management/commands/load_examination_indication_data.py +65 -0
endoreg_db/management/commands/load_finding_data.py +171 -0
endoreg_db/management/commands/load_lab_value_data.py +3 -3
endoreg_db/management/commands/load_lx_data.py +64 -0
endoreg_db/management/commands/load_medication_data.py +83 -21
endoreg_db/management/commands/load_name_data.py +37 -0
endoreg_db/management/commands/{load_endoscopy_processor_data.py → load_organ_data.py} +7 -9
endoreg_db/migrations/0001_initial.py +1206 -728
endoreg_db/migrations/0002_alter_frame_image_alter_rawframe_image.py +23 -0
endoreg_db/migrations/0003_alter_frame_image_alter_rawframe_image.py +23 -0
endoreg_db/migrations/0004_alter_rawvideofile_file_alter_video_file.py +25 -0
endoreg_db/migrations/0005_rawvideofile_frame_count_and_more.py +33 -0
endoreg_db/migrations/0006_frame_extracted_rawframe_extracted.py +23 -0
endoreg_db/migrations/0007_rename_pseudo_patient_video_patient_and_more.py +24 -0
endoreg_db/migrations/0008_remove_reportfile_patient_examination_and_more.py +48 -0
endoreg_db/models/__init__.py +331 -28
endoreg_db/models/ai_model/__init__.py +1 -0
endoreg_db/models/ai_model/ai_model.py +103 -0
endoreg_db/models/ai_model/lightning/__init__.py +3 -0
endoreg_db/models/ai_model/lightning/inference_dataset.py +53 -0
endoreg_db/models/ai_model/lightning/multilabel_classification_net.py +155 -0
endoreg_db/models/ai_model/lightning/postprocess.py +53 -0
endoreg_db/models/ai_model/lightning/predict.py +172 -0
endoreg_db/models/ai_model/lightning/prediction_visualizer.py +55 -0
endoreg_db/models/ai_model/lightning/preprocess.py +68 -0
endoreg_db/models/ai_model/lightning/run_visualizer.py +21 -0
endoreg_db/models/ai_model/model_meta.py +232 -6
endoreg_db/models/ai_model/model_type.py +13 -3
endoreg_db/models/annotation/__init__.py +31 -2
endoreg_db/models/annotation/anonymized_image_annotation.py +73 -18
endoreg_db/models/annotation/binary_classification_annotation_task.py +94 -57
endoreg_db/models/annotation/image_classification.py +73 -14
endoreg_db/models/annotation/video_segmentation_annotation.py +52 -0
endoreg_db/models/annotation/video_segmentation_labelset.py +20 -0
endoreg_db/models/case/__init__.py +1 -0
endoreg_db/models/{persons/patient/case → case}/case.py +4 -0
endoreg_db/models/case_template/__init__.py +10 -1
endoreg_db/models/case_template/case_template.py +57 -13
endoreg_db/models/case_template/case_template_rule.py +5 -5
endoreg_db/models/case_template/case_template_rule_value.py +19 -4
endoreg_db/models/center/__init__.py +7 -0
endoreg_db/models/center/center.py +31 -5
endoreg_db/models/center/center_product.py +0 -1
endoreg_db/models/center/center_resource.py +16 -2
endoreg_db/models/center/center_waste.py +6 -1
endoreg_db/models/contraindication/__init__.py +21 -0
endoreg_db/models/data_file/__init__.py +38 -5
endoreg_db/models/data_file/base_classes/__init__.py +6 -1
endoreg_db/models/data_file/base_classes/abstract_frame.py +64 -15
endoreg_db/models/data_file/base_classes/abstract_pdf.py +136 -0
endoreg_db/models/data_file/base_classes/abstract_video.py +744 -138
endoreg_db/models/data_file/base_classes/frame_helpers.py +17 -0
endoreg_db/models/data_file/base_classes/prepare_bulk_frames.py +19 -0
endoreg_db/models/data_file/base_classes/utils.py +80 -0
endoreg_db/models/data_file/frame.py +22 -38
endoreg_db/models/data_file/import_classes/__init__.py +4 -18
endoreg_db/models/data_file/import_classes/raw_pdf.py +162 -90
endoreg_db/models/data_file/import_classes/raw_video.py +239 -294
endoreg_db/models/data_file/metadata/__init__.py +10 -0
endoreg_db/models/data_file/metadata/pdf_meta.py +4 -0
endoreg_db/models/data_file/metadata/sensitive_meta.py +265 -6
endoreg_db/models/data_file/metadata/video_meta.py +116 -50
endoreg_db/models/data_file/report_file.py +30 -63
endoreg_db/models/data_file/video/__init__.py +6 -2
endoreg_db/models/data_file/video/video.py +187 -16
endoreg_db/models/data_file/video_segment.py +162 -55
endoreg_db/models/disease.py +25 -2
endoreg_db/models/emission/__init__.py +5 -1
endoreg_db/models/emission/emission_factor.py +71 -6
endoreg_db/models/event.py +51 -0
endoreg_db/models/examination/__init__.py +6 -1
endoreg_db/models/examination/examination.py +53 -12
endoreg_db/models/examination/examination_indication.py +170 -0
endoreg_db/models/examination/examination_time.py +31 -5
endoreg_db/models/examination/examination_time_type.py +28 -4
endoreg_db/models/examination/examination_type.py +28 -6
endoreg_db/models/finding/__init__.py +11 -0
endoreg_db/models/finding/finding.py +75 -0
endoreg_db/models/finding/finding_intervention.py +60 -0
endoreg_db/models/finding/finding_location_classification.py +94 -0
endoreg_db/models/finding/finding_morphology_classification.py +89 -0
endoreg_db/models/finding/finding_type.py +22 -0
endoreg_db/models/hardware/endoscope.py +16 -0
endoreg_db/models/hardware/endoscopy_processor.py +31 -19
endoreg_db/models/label/label.py +35 -7
endoreg_db/models/laboratory/lab_value.py +12 -3
endoreg_db/models/logging/__init__.py +8 -1
endoreg_db/models/lx/__init__.py +4 -0
endoreg_db/models/lx/client.py +57 -0
endoreg_db/models/lx/identity.py +34 -0
endoreg_db/models/lx/permission.py +18 -0
endoreg_db/models/lx/user.py +16 -0
endoreg_db/models/medication/__init__.py +19 -1
endoreg_db/models/medication/medication.py +7 -122
endoreg_db/models/medication/medication_indication.py +50 -0
endoreg_db/models/medication/medication_indication_type.py +34 -0
endoreg_db/models/medication/medication_intake_time.py +26 -0
endoreg_db/models/medication/medication_schedule.py +37 -0
endoreg_db/models/network/__init__.py +7 -1
endoreg_db/models/network/network_device.py +13 -8
endoreg_db/models/organ/__init__.py +38 -0
endoreg_db/models/other/__init__.py +19 -1
endoreg_db/models/other/distribution/__init__.py +44 -0
endoreg_db/models/other/distribution/base_value_distribution.py +20 -0
endoreg_db/models/other/distribution/date_value_distribution.py +91 -0
endoreg_db/models/other/distribution/multiple_categorical_value_distribution.py +32 -0
endoreg_db/models/other/distribution/numeric_value_distribution.py +97 -0
endoreg_db/models/other/distribution/single_categorical_value_distribution.py +22 -0
endoreg_db/models/other/distribution.py +1 -211
endoreg_db/models/other/material.py +4 -0
endoreg_db/models/other/transport_route.py +2 -1
endoreg_db/models/patient/__init__.py +24 -0
endoreg_db/models/patient/patient_examination.py +182 -0
endoreg_db/models/patient/patient_finding.py +143 -0
endoreg_db/models/patient/patient_finding_intervention.py +26 -0
endoreg_db/models/patient/patient_finding_location.py +120 -0
endoreg_db/models/patient/patient_finding_morphology.py +166 -0
endoreg_db/models/persons/__init__.py +29 -2
endoreg_db/models/persons/examiner/examiner.py +48 -4
endoreg_db/models/persons/patient/__init__.py +1 -1
endoreg_db/models/persons/patient/patient.py +227 -54
endoreg_db/models/persons/patient/patient_disease.py +6 -0
endoreg_db/models/persons/patient/patient_event.py +31 -1
endoreg_db/models/persons/patient/patient_examination_indication.py +32 -0
endoreg_db/models/persons/patient/patient_lab_sample.py +4 -2
endoreg_db/models/persons/patient/patient_lab_value.py +37 -16
endoreg_db/models/persons/patient/patient_medication.py +27 -12
endoreg_db/models/persons/patient/patient_medication_schedule.py +62 -2
endoreg_db/models/prediction/__init__.py +7 -1
endoreg_db/models/prediction/image_classification.py +20 -6
endoreg_db/models/prediction/video_prediction_meta.py +151 -89
endoreg_db/models/product/__init__.py +10 -1
endoreg_db/models/product/product.py +15 -2
endoreg_db/models/product/product_group.py +8 -0
endoreg_db/models/product/product_material.py +4 -0
endoreg_db/models/product/product_weight.py +12 -0
endoreg_db/models/product/reference_product.py +19 -3
endoreg_db/models/quiz/__init__.py +8 -1
endoreg_db/models/report_reader/__init__.py +6 -1
endoreg_db/serializers/__init__.py +1 -1
endoreg_db/serializers/annotation.py +2 -5
endoreg_db/serializers/frame.py +1 -5
endoreg_db/serializers/patient.py +26 -3
endoreg_db/serializers/prediction.py +2 -7
endoreg_db/serializers/raw_video_meta_validation.py +13 -0
endoreg_db/serializers/video.py +6 -13
endoreg_db/serializers/video_segmentation.py +492 -0
endoreg_db/templates/admin/patient_finding_intervention.html +253 -0
endoreg_db/templates/admin/start_examination.html +12 -0
endoreg_db/templates/timeline.html +176 -0
endoreg_db/urls.py +173 -0
endoreg_db/utils/__init__.py +36 -1
endoreg_db/utils/dataloader.py +45 -19
endoreg_db/utils/dates.py +39 -0
endoreg_db/utils/hashs.py +122 -4
endoreg_db/utils/names.py +74 -0
endoreg_db/utils/parse_and_generate_yaml.py +46 -0
endoreg_db/utils/pydantic_models/__init__.py +6 -0
endoreg_db/utils/pydantic_models/db_config.py +57 -0
endoreg_db/utils/validate_endo_roi.py +19 -0
endoreg_db/utils/validate_subcategory_dict.py +91 -0
endoreg_db/utils/video/__init__.py +13 -0
endoreg_db/utils/video/extract_frames.py +121 -0
endoreg_db/utils/video/transcode_videofile.py +111 -0
endoreg_db/views/__init__.py +2 -0
endoreg_db/views/csrf.py +7 -0
endoreg_db/views/patient_views.py +90 -0
endoreg_db/views/raw_video_meta_validation_views.py +38 -0
endoreg_db/views/report_views.py +96 -0
endoreg_db/views/video_segmentation_views.py +149 -0
endoreg_db/views/views_for_timeline.py +46 -0
endoreg_db/views.py +0 -3
endoreg_db-0.6.1.dist-info/METADATA +151 -0
endoreg_db-0.6.1.dist-info/RECORD +420 -0
{endoreg_db-0.5.3.dist-info → endoreg_db-0.6.1.dist-info}/WHEEL +1 -1
endoreg_db/data/active_model/data.yaml +0 -3
endoreg_db/data/label/label-set/data.yaml +0 -18
endoreg_db/management/commands/delete_legacy_images.py +0 -19
endoreg_db/management/commands/delete_legacy_videos.py +0 -17
endoreg_db/management/commands/extract_legacy_video_frames.py +0 -18
endoreg_db/management/commands/import_legacy_images.py +0 -94
endoreg_db/management/commands/import_legacy_videos.py +0 -76
endoreg_db/management/commands/load_label_data.py +0 -67
endoreg_db/migrations/0002_anonymizedimagelabel_anonymousimageannotation_and_more.py +0 -55
endoreg_db/migrations/0003_anonymousimageannotation_original_image_url_and_more.py +0 -39
endoreg_db/migrations/0004_alter_rawpdffile_file.py +0 -20
endoreg_db/migrations/0005_uploadedfile_alter_rawpdffile_file_anonymizedfile.py +0 -40
endoreg_db/migrations/0006_alter_rawpdffile_file.py +0 -20
endoreg_db/migrations/0007_networkdevicelogentry_datetime_and_more.py +0 -43
endoreg_db/migrations/0008_networkdevicelogentry_aglnet_ip_and_more.py +0 -28
endoreg_db/migrations/0009_alter_networkdevicelogentry_vpn_service_status.py +0 -18
endoreg_db/migrations/0010_remove_networkdevicelogentry_hostname.py +0 -17
endoreg_db/models/legacy_data/__init__.py +0 -3
endoreg_db/models/legacy_data/image.py +0 -34
endoreg_db/models/patient_examination/__init__.py +0 -35
endoreg_db/utils/video_metadata.py +0 -87
endoreg_db-0.5.3.dist-info/METADATA +0 -28
endoreg_db-0.5.3.dist-info/RECORD +0 -319
/endoreg_db/{models/persons/patient/case → case_generator}/__init__.py +0 -0
/endoreg_db/data/{label → ai_model_label}/label-type/data.yaml +0 -0
/endoreg_db/data/{model_type → ai_model_type}/data.yaml +0 -0
/endoreg_db/{data/distribution/numeric/.init → management/__init__.py} +0 -0
/endoreg_db/management/commands/{load_report_reader_flag.py → load_report_reader_flag_data.py} +0 -0
{endoreg_db-0.5.3.dist-info → endoreg_db-0.6.1.dist-info}/licenses/LICENSE +0 -0

endoreg_db/models/data_file/base_classes/frame_helpers.py ADDED Viewed

@@ -0,0 +1,17 @@
+from django.core.files import File
+import io
+from pathlib import Path
+from typing import List
+def prepare_bulk_frames(frame_paths: List[Path]):
+    """
+    Reads the frame paths into memory as Django File objects.
+    This avoids 'seek of closed file' errors by using BytesIO for each frame.
+    """
+    for path in frame_paths:
+        frame_number = int(path.stem.split("_")[1])
+        with open(path, "rb") as f:
+            content = f.read()
+        file_obj = File(io.BytesIO(content), name=path.name)
+        yield frame_number, file_obj

endoreg_db/models/data_file/base_classes/prepare_bulk_frames.py ADDED Viewed

@@ -0,0 +1,19 @@
+from django.core.files import File
+import io
+from pathlib import Path
+from typing import List
+def prepare_bulk_frames(frame_paths: List[Path]):
+    """
+    Reads the frame paths into memory as Django File objects.
+    This avoids 'seek of closed file' errors by using BytesIO for each frame.
+    """
+    for path in frame_paths:
+        frame_number = int(path.stem.split("_")[1])
+        with open(path, "rb") as f:
+            content = f.read()
+        file_obj = File(io.BytesIO(content), name=path.name)
+        yield frame_number, file_obj

endoreg_db/models/data_file/base_classes/utils.py ADDED Viewed

@@ -0,0 +1,80 @@
+"""
+Utility functions for data file classes.
+"""
+import os
+from pathlib import Path
+import cv2
+import numpy as np
+DJANGO_NAME_SALT = os.environ.get("DJANGO_NAME_SALT", "default_salt")
+# Directory stuff
+PSEUDO_DIR = Path(os.environ.get("DJANGO_PSEUDO_DIR", Path("./erc_data")))
+STORAGE_LOCATION = PSEUDO_DIR
+FRAME_DIR_NAME = os.environ.get("DJANGO_FRAME_DIR_NAME", "db_frames")
+RAW_FRAME_DIR_NAME = os.environ.get("DJANGO_RAW_FRAME_DIR_NAME", "db_raw_frames")
+VIDEO_DIR_NAME = os.environ.get("DJANGO_VIDEO_DIR_NAME", "db_videos")
+RAW_VIDEO_DIR_NAME = os.environ.get("DJANGO_RAW_VIDEO_DIR_NAME", "db_raw_videos")
+FRAME_DIR = STORAGE_LOCATION / FRAME_DIR_NAME
+VIDEO_DIR = STORAGE_LOCATION / VIDEO_DIR_NAME
+RAW_VIDEO_DIR = STORAGE_LOCATION / RAW_VIDEO_DIR_NAME
+TEST_RUN = os.environ.get("TEST_RUN", False)
+TEST_RUN_FRAME_NUMBER = os.environ.get("TEST_RUN_FRAME_NUMBER", 1000)
+VIDEO_DIR.mkdir(parents=True, exist_ok=True)
+RAW_VIDEO_DIR.mkdir(parents=True, exist_ok=True)
+# AI Stuff
+FRAME_PROCESSING_BATCH_SIZE = os.environ.get("DJANGO_FRAME_PROCESSING_BATCH_SIZE", 10)
+def anonymize_frame(
+    raw_frame_path: Path, target_frame_path: Path, endo_roi, all_black: bool = False
+):
+    """
+    Anonymize the frame by blacking out all pixels that are not in the endoscope ROI.
+    """
+    frame = cv2.imread(raw_frame_path.as_posix())  # pylint: disable=no-member
+    # make black frame with same size as original frame
+    new_frame = np.zeros_like(frame)
+    if not all_black:
+        # endo_roi is dict with keys "x", "y", "width", "heigth"
+        x = endo_roi["x"]
+        y = endo_roi["y"]
+        width = endo_roi["width"]
+        height = endo_roi["height"]
+        # copy endoscope roi to black frame
+        new_frame[y : y + height, x : x + width] = frame[y : y + height, x : x + width]
+    cv2.imwrite(target_frame_path.as_posix(), new_frame)  # pylint: disable=no-member
+    return frame
+def copy_with_progress(src: str, dst: str, buffer_size=1024 * 1024):
+    """
+    Make a copy of a file with progress bar.
+    Args:
+        src (str): Source file path.
+        dst (str): Destination file path.
+        buffer_size (int): Buffer size for copying.
+    """
+    total_size = os.path.getsize(src)
+    copied_size = 0
+    with open(src, "rb") as fsrc, open(dst, "wb") as fdst:
+        while True:
+            buf = fsrc.read(buffer_size)
+            if not buf:
+                break
+            fdst.write(buf)
+            copied_size += len(buf)
+            progress = copied_size / total_size * 100
+            print(f"\rProgress: {progress:.2f}%", end="")

endoreg_db/models/data_file/frame.py CHANGED Viewed

@@ -1,45 +1,29 @@
-from endoreg_db.models.annotation.image_classification import ImageClassificationAnnotation
+from typing import TYPE_CHECKING
 from endoreg_db.models.label.label import Label
 from .base_classes import AbstractFrame
 from django.db import models
+from .base_classes.utils import FRAME_DIR_NAME, RAW_FRAME_DIR_NAME
+if TYPE_CHECKING:
+    from endoreg_db.models import RawVideoFile, Video
+class RawFrame(AbstractFrame):
+    image = models.ImageField(upload_to=RAW_FRAME_DIR_NAME, blank=True, null=True)
+    video = models.ForeignKey(
+        "RawVideoFile", on_delete=models.CASCADE, related_name="frames"
+    )
+    if TYPE_CHECKING:
+        video: "RawVideoFile"
+        label: "Label"
 class Frame(AbstractFrame):
+    image = models.ImageField(upload_to=FRAME_DIR_NAME, blank=True, null=True)
     video = models.ForeignKey("Video", on_delete=models.CASCADE, related_name="frames")
-class LegacyFrame(AbstractFrame):
-    video = models.ForeignKey("LegacyVideo", on_delete=models.CASCADE, related_name='frames')
-    image = models.ImageField(upload_to="legacy_frames", blank=True, null=True)
-    suffix = models.CharField(max_length=255)
-    # ImageClassificationAnnotation has a foreign key to this model (related name: image_classification_annotations)
-    class Meta:
-        unique_together = ('video', 'frame_number')
-        indexes = [
-            models.Index(fields=['video', 'frame_number']),
-        ]
-    def get_classification_annotations(self):
-        """
-        Get all image classification annotations for this frame.
-        """
-        return ImageClassificationAnnotation.objects.filter(legacy_frame=self)
-    def get_classification_annotations_by_label(self, label:Label):
-        """
-        Get all image classification annotations for this frame with the given label.
-        """
-        return ImageClassificationAnnotation.objects.filter(legacy_frame=self, label=label)
-    def get_classification_annotations_by_value(self, value:bool):
-        """
-        Get all image classification annotations for this frame with the given value.
-        """
-        return ImageClassificationAnnotation.objects.filter(legacy_frame=self, value=value)
-    def get_classification_annotations_by_label_and_value(self, label:Label, value:bool):
-        """
-        Get all image classification annotations for this frame with the given label and value.
-        """
-        return ImageClassificationAnnotation.objects.filter(legacy_frame=self, label=label, value=value)
+    if TYPE_CHECKING:
+        video: "Video"

endoreg_db/models/data_file/import_classes/__init__.py CHANGED Viewed

@@ -1,6 +1,3 @@
-import os
-from pathlib import Path
 from .raw_video import RawVideoFile
 from .raw_pdf import RawPdfFile
@@ -14,19 +11,8 @@ from .raw_pdf import RawPdfFile
 # main method is import_files which expects a path to a directory containing files to import.
 # creates correct import file object depending on file type by checking the file extension
-class FileImporter:
-    def __init__(self, directory):
-        self.directory = directory
-    def import_files(self):
-        directory_path = Path(self.directory)
-        for file in directory_path.iterdir():
-            if file.is_file():
-                if file.suffix.lower() in ['.mov', '.mp4']:
-                    RawVideoFile.create_from_file(file)
-                else:
-                    raise ValueError(f"File type {file.suffix} not supported")
-            else:
-                raise ValueError(f"{file} is not a file")
+__all__ = [
+    "RawPdfFile",
+    "RawVideoFile",
+]

endoreg_db/models/data_file/import_classes/raw_pdf.py CHANGED Viewed

@@ -7,182 +7,254 @@
 from django.db import models
 from django.core.files.storage import FileSystemStorage
-from django.core.files import File
 from django.conf import settings
-from django.utils import timezone
 from django.core.exceptions import ValidationError
 from django.core.validators import FileExtensionValidator
 from endoreg_db.utils.file_operations import get_uuid_filename
+from icecream import ic
 from agl_report_reader.report_reader import ReportReader
 from endoreg_db.utils.hashs import get_pdf_hash
 from ..metadata import SensitiveMeta
+from ..base_classes.abstract_pdf import AbstractPdfFile
 # setup logging to pdf_import.log
 import logging
-logger = logging.getLogger('pdf_import')
 import shutil
+from pathlib import Path
-# get pdf location from settings, default to ~/erc_data/raw_pdf and create if not exists
-PSEUDO_DIR_RAW_PDF = getattr(settings, 'PSEUDO_DIR_RAW_PDF', settings.BASE_DIR / 'erc_data/raw_pdf')
+from ..base_classes.utils import (
+    STORAGE_LOCATION,
+)
-class RawPdfFile(models.Model):
+logger = logging.getLogger("pdf_import")
+RAW_PDF_DIR_NAME = "raw_pdf"
+RAW_PDF_DIR = STORAGE_LOCATION / RAW_PDF_DIR_NAME
+if not RAW_PDF_DIR.exists():
+    RAW_PDF_DIR.mkdir(parents=True)
+class RawPdfFile(AbstractPdfFile):
     file = models.FileField(
-        upload_to='raw_pdf/',
-        validators=[FileExtensionValidator(allowed_extensions=['pdf'])],
-        storage=FileSystemStorage(location=PSEUDO_DIR_RAW_PDF.resolve().as_posix()),
+        upload_to=f"{RAW_PDF_DIR_NAME}/",
+        validators=[FileExtensionValidator(allowed_extensions=["pdf"])],
+        storage=FileSystemStorage(location=STORAGE_LOCATION.resolve().as_posix()),
     )
-    pdf_hash = models.CharField(max_length=255, unique=True)
-    pdf_type = models.ForeignKey('PdfType', on_delete=models.CASCADE)
-    center = models.ForeignKey('Center', on_delete=models.CASCADE)
+    patient = models.ForeignKey(
+        "Patient",
+        on_delete=models.SET_NULL,
+        blank=True,
+        null=True,
+        related_name="raw_pdf_files",
+    )
-    state_report_processing_required = models.BooleanField(default = True)
+    state_report_processing_required = models.BooleanField(default=True)
     state_report_processed = models.BooleanField(default=False)
+    raw_meta = models.JSONField(blank=True, null=True)
     # report_file = models.OneToOneField("ReportFile", on_delete=models.CASCADE, null=True, blank=True)
-    sensitive_meta = models.OneToOneField(
-        'SensitiveMeta',
-        on_delete=models.CASCADE,
-        related_name='raw_pdf_file',
+    sensitive_meta = models.ForeignKey(
+        "SensitiveMeta",
+        on_delete=models.SET_NULL,
+        related_name="raw_pdf_files",
         null=True,
         blank=True,
     )
-    text = models.TextField(blank=True, null=True)
-    anonymized_text = models.TextField(blank=True, null=True)
-    raw_meta = models.JSONField(blank=True, null=True)
-    created_at = models.DateTimeField(auto_now_add=True)
+    report_file = models.ForeignKey(
+        "ReportFile",
+        on_delete=models.SET_NULL,
+        related_name="raw_pdf_files",
+        null=True,
+        blank=True,
+    )
-    def __str__(self):
-        str_repr = f"RawPdfFile: {self.file.name}"
-        return str_repr
+    anonymized_text = models.TextField(blank=True, null=True)
     @classmethod
     def create_from_file(
         cls,
-        file_path,
+        file_path: Path,
         center_name,
-        pdf_type_name, # to be depreceated / changed since we now import all pdfs from same directory
-        destination_dir,
         save=True,
+        delete_source=True,
     ):
-        from endoreg_db.models import PdfType, Center
+        from endoreg_db.models import Center
         logger.info(f"Creating RawPdfFile object from file: {file_path}")
-        original_file_name = file_path.name
+        ic(f"Creating RawPdfFile object from file: {file_path}")
         new_file_name, uuid = get_uuid_filename(file_path)
-        if not destination_dir.exists():
-            destination_dir.mkdir(parents=True)
         pdf_hash = get_pdf_hash(file_path)
+        ic(pdf_hash)
+        new_file_path = RAW_PDF_DIR / new_file_name
         # check if pdf file already exists
         if cls.objects.filter(pdf_hash=pdf_hash).exists():
+            existing_pdf_file = cls.objects.filter(pdf_hash=pdf_hash).get()
             logger.warning(f"RawPdfFile with hash {pdf_hash} already exists")
-            return None
-        assert pdf_type_name is not None, "pdf_type_name is required"
+            ic(f"RawPdfFile with hash {pdf_hash} already exists")
+            existing_pdf_file.verify_existing_file(fallback_file=file_path)
+            return existing_pdf_file
+        else:
+            ic(f"No existing pdf file found for hash {pdf_hash}")
+        # assert pdf_type_name is not None, "pdf_type_name is required"
         assert center_name is not None, "center_name is required"
-        pdf_type = PdfType.objects.get(name=pdf_type_name)
+        # pdf_type = PdfType.objects.get(name=pdf_type_name)
         center = Center.objects.get(name=center_name)
-        new_file_path = destination_dir / new_file_name
         logger.info(f"Copying file to {new_file_path}")
-        success = shutil.copy(file_path, new_file_path)
+        ic(f"Copying file to {new_file_path}")
+        _success = shutil.copy(file_path, new_file_path)
         # validate copy operation by comparing hashs
         assert get_pdf_hash(new_file_path) == pdf_hash, "Copy operation failed"
         raw_pdf = cls(
             file=new_file_path.resolve().as_posix(),
             pdf_hash=pdf_hash,
-            pdf_type=pdf_type,
+            # pdf_type=pdf_type,
             center=center,
         )
+        raw_pdf.save()
         logger.info(f"RawPdfFile object created: {raw_pdf}")
+        ic(f"RawPdfFile object created: {raw_pdf}")
         # remove source file
-        file_path.unlink()
-        logger.info(f"Source file removed: {file_path}")
+        if delete_source:
+            file_path.unlink()
+            logger.info(f"Source file removed: {file_path}")
+            ic(f"Source file removed: {file_path}")
         if save:
             raw_pdf.save()
         return raw_pdf
-    def process_file(self, verbose = False):
+    def save(self, *args, **kwargs):
+        if not self.file.name.endswith(".pdf"):
+            raise ValidationError("Only PDF files are allowed")
+        if not self.pdf_hash:
+            self.pdf_hash = get_pdf_hash(self.file.path)
+        super().save(*args, **kwargs)
+    def verify_existing_file(self, fallback_file):
+        if not Path(self.file.path).exists():
+            logger.warning(f"File not found: {self.file.path}")
+            logger.warning(f"Using fallback file: {fallback_file}")
+            ic(f"File not found: {self.file.path}")
+            ic(f"Copy fallback file: {fallback_file} to existing filepath")
+            shutil.copy(fallback_file, self.file.path)
+            self.save()
+    def process_file(self, verbose=False):
         pdf_path = self.file.path
         rr_config = self.get_report_reader_config()
-        rr = ReportReader(**rr_config) #FIXME In future we need to pass a configuration file
-        # This configuration file should be associated with pdf type
+        rr = ReportReader(
+            **rr_config
+        )  # FIXME In future we need to pass a configuration file
+        # This configuration file should be associated with pdf type
+        text, anonymized_text, report_meta = rr.process_report(
+            pdf_path, verbose=verbose
+        )
-        text, anonymized_text, report_meta = rr.process_report(pdf_path, verbose=verbose)
+        self.text = text
+        self.anonymized_text = anonymized_text
+        report_meta["center_name"] = self.center.name
         if not self.sensitive_meta:
             sensitive_meta = SensitiveMeta.create_from_dict(report_meta)
-            sensitive_meta.save()
             self.sensitive_meta = sensitive_meta
-        else:
+        else:
             # update existing sensitive meta
             sensitive_meta = self.sensitive_meta
             sensitive_meta.update_from_dict(report_meta)
-        return text, anonymized_text, report_meta
-    def update(self, save=True, verbose = True):
-        try:
-            self.text, self.anonymized_text, self.raw_meta = self.process_file(verbose = verbose)
-            self.state_report_processed = True
-            self.state_report_processing_required = False
-            if save:
-                self.save()
-            return True
-        except:
-            logger.error(f"Error processing file: {self.file.path}")
-            return False
+        self.raw_meta = report_meta
-    def save(self, *args, **kwargs):
-        if not self.file.name.endswith('.pdf'):
-            raise ValidationError('Only PDF files are allowed')
-        if not self.pdf_hash:
-            self.pdf_hash = get_pdf_hash(self.file.path)
-        super().save(*args, **kwargs)
+        sensitive_meta.save()
+        self.save()
+        return text, anonymized_text, report_meta
     def get_report_reader_config(self):
-        if self.pdf_type.endoscope_info_line:
-            endoscope_info_line = self.pdf_type.endoscope_info_line.value
+        from endoreg_db.models import PdfType, Center
+        from warnings import warn
+        if not self.pdf_type:
+            warn("PdfType not set, using default settings")
+            pdf_type = PdfType.default_pdf_type()
+        else:
+            pdf_type: PdfType = self.pdf_type
+        center: Center = self.center
+        if pdf_type.endoscope_info_line:
+            endoscope_info_line = pdf_type.endoscope_info_line.value
         else:
             endoscope_info_line = None
         settings_dict = {
             "locale": "de_DE",
-            "employee_first_names": [_.name for _ in self.center.first_names.all()],
-            "employee_last_names": [_.name for _ in self.center.last_names.all()],
-            "text_date_format":'%d.%m.%Y',
+            "employee_first_names": [_.name for _ in center.first_names.all()],
+            "employee_last_names": [_.name for _ in center.last_names.all()],
+            "text_date_format": "%d.%m.%Y",
             "flags": {
-                "patient_info_line": self.pdf_type.patient_info_line.value,
+                "patient_info_line": pdf_type.patient_info_line.value,
                 "endoscope_info_line": endoscope_info_line,
-                "examiner_info_line": self.pdf_type.examiner_info_line.value,
-                "cut_off_below": [_.value for _ in self.pdf_type.cut_off_below_lines.all()],
-                "cut_off_above": [_.value for _ in self.pdf_type.cut_off_above_lines.all()],
-            }
+                "examiner_info_line": pdf_type.examiner_info_line.value,
+                "cut_off_below": [_.value for _ in pdf_type.cut_off_below_lines.all()],
+                "cut_off_above": [_.value for _ in pdf_type.cut_off_above_lines.all()],
+            },
         }
         return settings_dict
+    def get_or_create_report_file(self):
+        from endoreg_db.models import ReportFile
+        if self.report_file:
+            report_file = self.report_file
+        elif ReportFile.objects.filter(pdf_hash=self.pdf_hash).exists():
+            report_file = ReportFile.objects.filter(pdf_hash=self.pdf_hash).get()
+            self.report_file = report_file
+            self.save()
+        else:
+            # TODO  Make sure all required states are set
+            patient = self.sensitive_meta.get_or_create_pseudo_patient()
+            examiner = self.sensitive_meta.get_or_create_pseudo_examiner()
+            patient_examination = (
+                self.sensitive_meta.get_or_create_pseudo_patient_examination()
+            )
+            report_file = ReportFile.objects.create(
+                pdf_hash=self.pdf_hash,
+                center=self.center,
+                sensitive_meta=self.sensitive_meta,
+                patient=patient,
+                examiner=examiner,
+                examination=patient_examination,
+                text=self.anonymized_text,
+            )
+            report_file.save()
+            self.report_file = report_file
+            self.save()
+        return report_file

endoreg-db 0.5.3__py3-none-any.whl → 0.6.1__py3-none-any.whl

Potentially problematic release.

endoreg-db 0.5.3py3-none-any.whl → 0.6.1py3-none-any.whl