PyPI - megadetector - Versions diffs - 5.0.28__py3-none-any.whl → 10.0.0__py3-none-any.whl - Mend

megadetector 5.0.28py3-none-any.whl → 10.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of megadetector might be problematic. Click here for more details.

Files changed (197) hide show

megadetector/api/batch_processing/integration/digiKam/xmp_integration.py +2 -2
megadetector/api/batch_processing/integration/eMammal/test_scripts/push_annotations_to_emammal.py +1 -1
megadetector/api/batch_processing/integration/eMammal/test_scripts/select_images_for_testing.py +1 -1
megadetector/classification/aggregate_classifier_probs.py +3 -3
megadetector/classification/analyze_failed_images.py +5 -5
megadetector/classification/cache_batchapi_outputs.py +5 -5
megadetector/classification/create_classification_dataset.py +11 -12
megadetector/classification/crop_detections.py +10 -10
megadetector/classification/csv_to_json.py +8 -8
megadetector/classification/detect_and_crop.py +13 -15
megadetector/classification/efficientnet/model.py +8 -8
megadetector/classification/efficientnet/utils.py +6 -5
megadetector/classification/evaluate_model.py +7 -7
megadetector/classification/identify_mislabeled_candidates.py +6 -6
megadetector/classification/json_to_azcopy_list.py +1 -1
megadetector/classification/json_validator.py +29 -32
megadetector/classification/map_classification_categories.py +9 -9
megadetector/classification/merge_classification_detection_output.py +12 -9
megadetector/classification/prepare_classification_script.py +19 -19
megadetector/classification/prepare_classification_script_mc.py +26 -26
megadetector/classification/run_classifier.py +4 -4
megadetector/classification/save_mislabeled.py +6 -6
megadetector/classification/train_classifier.py +1 -1
megadetector/classification/train_classifier_tf.py +9 -9
megadetector/classification/train_utils.py +10 -10
megadetector/data_management/annotations/annotation_constants.py +1 -2
megadetector/data_management/camtrap_dp_to_coco.py +79 -46
megadetector/data_management/cct_json_utils.py +103 -103
megadetector/data_management/cct_to_md.py +49 -49
megadetector/data_management/cct_to_wi.py +33 -33
megadetector/data_management/coco_to_labelme.py +75 -75
megadetector/data_management/coco_to_yolo.py +210 -193
megadetector/data_management/databases/add_width_and_height_to_db.py +86 -12
megadetector/data_management/databases/combine_coco_camera_traps_files.py +40 -40
megadetector/data_management/databases/integrity_check_json_db.py +228 -200
megadetector/data_management/databases/subset_json_db.py +33 -33
megadetector/data_management/generate_crops_from_cct.py +88 -39
megadetector/data_management/get_image_sizes.py +54 -49
megadetector/data_management/labelme_to_coco.py +133 -125
megadetector/data_management/labelme_to_yolo.py +159 -73
megadetector/data_management/lila/create_lila_blank_set.py +81 -83
megadetector/data_management/lila/create_lila_test_set.py +32 -31
megadetector/data_management/lila/create_links_to_md_results_files.py +18 -18
megadetector/data_management/lila/download_lila_subset.py +21 -24
megadetector/data_management/lila/generate_lila_per_image_labels.py +365 -107
megadetector/data_management/lila/get_lila_annotation_counts.py +35 -33
megadetector/data_management/lila/get_lila_image_counts.py +22 -22
megadetector/data_management/lila/lila_common.py +73 -70
megadetector/data_management/lila/test_lila_metadata_urls.py +28 -19
megadetector/data_management/mewc_to_md.py +344 -340
megadetector/data_management/ocr_tools.py +262 -255
megadetector/data_management/read_exif.py +249 -227
megadetector/data_management/remap_coco_categories.py +90 -28
megadetector/data_management/remove_exif.py +81 -21
megadetector/data_management/rename_images.py +187 -187
megadetector/data_management/resize_coco_dataset.py +588 -120
megadetector/data_management/speciesnet_to_md.py +41 -41
megadetector/data_management/wi_download_csv_to_coco.py +55 -55
megadetector/data_management/yolo_output_to_md_output.py +248 -122
megadetector/data_management/yolo_to_coco.py +333 -191
megadetector/detection/change_detection.py +832 -0
megadetector/detection/process_video.py +340 -337
megadetector/detection/pytorch_detector.py +358 -278
megadetector/detection/run_detector.py +399 -186
megadetector/detection/run_detector_batch.py +404 -377
megadetector/detection/run_inference_with_yolov5_val.py +340 -327
megadetector/detection/run_tiled_inference.py +257 -249
megadetector/detection/tf_detector.py +24 -24
megadetector/detection/video_utils.py +332 -295
megadetector/postprocessing/add_max_conf.py +19 -11
megadetector/postprocessing/categorize_detections_by_size.py +45 -45
megadetector/postprocessing/classification_postprocessing.py +468 -433
megadetector/postprocessing/combine_batch_outputs.py +23 -23
megadetector/postprocessing/compare_batch_results.py +590 -525
megadetector/postprocessing/convert_output_format.py +106 -102
megadetector/postprocessing/create_crop_folder.py +347 -147
megadetector/postprocessing/detector_calibration.py +173 -168
megadetector/postprocessing/generate_csv_report.py +508 -499
megadetector/postprocessing/load_api_results.py +48 -27
megadetector/postprocessing/md_to_coco.py +133 -102
megadetector/postprocessing/md_to_labelme.py +107 -90
megadetector/postprocessing/md_to_wi.py +40 -40
megadetector/postprocessing/merge_detections.py +92 -114
megadetector/postprocessing/postprocess_batch_results.py +319 -301
megadetector/postprocessing/remap_detection_categories.py +91 -38
megadetector/postprocessing/render_detection_confusion_matrix.py +214 -205
megadetector/postprocessing/repeat_detection_elimination/find_repeat_detections.py +57 -57
megadetector/postprocessing/repeat_detection_elimination/remove_repeat_detections.py +27 -28
megadetector/postprocessing/repeat_detection_elimination/repeat_detections_core.py +704 -679
megadetector/postprocessing/separate_detections_into_folders.py +226 -211
megadetector/postprocessing/subset_json_detector_output.py +265 -262
megadetector/postprocessing/top_folders_to_bottom.py +45 -45
megadetector/postprocessing/validate_batch_results.py +70 -70
megadetector/taxonomy_mapping/map_lila_taxonomy_to_wi_taxonomy.py +52 -52
megadetector/taxonomy_mapping/map_new_lila_datasets.py +18 -19
megadetector/taxonomy_mapping/prepare_lila_taxonomy_release.py +54 -33
megadetector/taxonomy_mapping/preview_lila_taxonomy.py +67 -67
megadetector/taxonomy_mapping/retrieve_sample_image.py +16 -16
megadetector/taxonomy_mapping/simple_image_download.py +8 -8
megadetector/taxonomy_mapping/species_lookup.py +156 -74
megadetector/taxonomy_mapping/taxonomy_csv_checker.py +14 -14
megadetector/taxonomy_mapping/taxonomy_graph.py +10 -10
megadetector/taxonomy_mapping/validate_lila_category_mappings.py +13 -13
megadetector/utils/ct_utils.py +1049 -211
megadetector/utils/directory_listing.py +21 -77
megadetector/utils/gpu_test.py +22 -22
megadetector/utils/md_tests.py +632 -529
megadetector/utils/path_utils.py +1520 -431
megadetector/utils/process_utils.py +41 -41
megadetector/utils/split_locations_into_train_val.py +62 -62
megadetector/utils/string_utils.py +148 -27
megadetector/utils/url_utils.py +489 -176
megadetector/utils/wi_utils.py +2658 -2526
megadetector/utils/write_html_image_list.py +137 -137
megadetector/visualization/plot_utils.py +34 -30
megadetector/visualization/render_images_with_thumbnails.py +39 -74
megadetector/visualization/visualization_utils.py +487 -435
megadetector/visualization/visualize_db.py +232 -198
megadetector/visualization/visualize_detector_output.py +82 -76
{megadetector-5.0.28.dist-info → megadetector-10.0.0.dist-info}/METADATA +5 -2
megadetector-10.0.0.dist-info/RECORD +139 -0
{megadetector-5.0.28.dist-info → megadetector-10.0.0.dist-info}/WHEEL +1 -1
megadetector/api/batch_processing/api_core/__init__.py +0 -0
megadetector/api/batch_processing/api_core/batch_service/__init__.py +0 -0
megadetector/api/batch_processing/api_core/batch_service/score.py +0 -439
megadetector/api/batch_processing/api_core/server.py +0 -294
megadetector/api/batch_processing/api_core/server_api_config.py +0 -97
megadetector/api/batch_processing/api_core/server_app_config.py +0 -55
megadetector/api/batch_processing/api_core/server_batch_job_manager.py +0 -220
megadetector/api/batch_processing/api_core/server_job_status_table.py +0 -149
megadetector/api/batch_processing/api_core/server_orchestration.py +0 -360
megadetector/api/batch_processing/api_core/server_utils.py +0 -88
megadetector/api/batch_processing/api_core_support/__init__.py +0 -0
megadetector/api/batch_processing/api_core_support/aggregate_results_manually.py +0 -46
megadetector/api/batch_processing/api_support/__init__.py +0 -0
megadetector/api/batch_processing/api_support/summarize_daily_activity.py +0 -152
megadetector/api/batch_processing/data_preparation/__init__.py +0 -0
megadetector/api/synchronous/__init__.py +0 -0
megadetector/api/synchronous/api_core/animal_detection_api/__init__.py +0 -0
megadetector/api/synchronous/api_core/animal_detection_api/api_backend.py +0 -151
megadetector/api/synchronous/api_core/animal_detection_api/api_frontend.py +0 -263
megadetector/api/synchronous/api_core/animal_detection_api/config.py +0 -35
megadetector/api/synchronous/api_core/tests/__init__.py +0 -0
megadetector/api/synchronous/api_core/tests/load_test.py +0 -110
megadetector/data_management/importers/add_nacti_sizes.py +0 -52
megadetector/data_management/importers/add_timestamps_to_icct.py +0 -79
megadetector/data_management/importers/animl_results_to_md_results.py +0 -158
megadetector/data_management/importers/auckland_doc_test_to_json.py +0 -373
megadetector/data_management/importers/auckland_doc_to_json.py +0 -201
megadetector/data_management/importers/awc_to_json.py +0 -191
megadetector/data_management/importers/bellevue_to_json.py +0 -272
megadetector/data_management/importers/cacophony-thermal-importer.py +0 -793
megadetector/data_management/importers/carrizo_shrubfree_2018.py +0 -269
megadetector/data_management/importers/carrizo_trail_cam_2017.py +0 -289
megadetector/data_management/importers/cct_field_adjustments.py +0 -58
megadetector/data_management/importers/channel_islands_to_cct.py +0 -913
megadetector/data_management/importers/eMammal/copy_and_unzip_emammal.py +0 -180
megadetector/data_management/importers/eMammal/eMammal_helpers.py +0 -249
megadetector/data_management/importers/eMammal/make_eMammal_json.py +0 -223
megadetector/data_management/importers/ena24_to_json.py +0 -276
megadetector/data_management/importers/filenames_to_json.py +0 -386
megadetector/data_management/importers/helena_to_cct.py +0 -283
megadetector/data_management/importers/idaho-camera-traps.py +0 -1407
megadetector/data_management/importers/idfg_iwildcam_lila_prep.py +0 -294
megadetector/data_management/importers/import_desert_lion_conservation_camera_traps.py +0 -387
megadetector/data_management/importers/jb_csv_to_json.py +0 -150
megadetector/data_management/importers/mcgill_to_json.py +0 -250
megadetector/data_management/importers/missouri_to_json.py +0 -490
megadetector/data_management/importers/nacti_fieldname_adjustments.py +0 -79
megadetector/data_management/importers/noaa_seals_2019.py +0 -181
megadetector/data_management/importers/osu-small-animals-to-json.py +0 -364
megadetector/data_management/importers/pc_to_json.py +0 -365
megadetector/data_management/importers/plot_wni_giraffes.py +0 -123
megadetector/data_management/importers/prepare_zsl_imerit.py +0 -131
megadetector/data_management/importers/raic_csv_to_md_results.py +0 -416
megadetector/data_management/importers/rspb_to_json.py +0 -356
megadetector/data_management/importers/save_the_elephants_survey_A.py +0 -320
megadetector/data_management/importers/save_the_elephants_survey_B.py +0 -329
megadetector/data_management/importers/snapshot_safari_importer.py +0 -758
megadetector/data_management/importers/snapshot_serengeti_lila.py +0 -1067
megadetector/data_management/importers/snapshotserengeti/make_full_SS_json.py +0 -150
megadetector/data_management/importers/snapshotserengeti/make_per_season_SS_json.py +0 -153
megadetector/data_management/importers/sulross_get_exif.py +0 -65
megadetector/data_management/importers/timelapse_csv_set_to_json.py +0 -490
megadetector/data_management/importers/ubc_to_json.py +0 -399
megadetector/data_management/importers/umn_to_json.py +0 -507
megadetector/data_management/importers/wellington_to_json.py +0 -263
megadetector/data_management/importers/wi_to_json.py +0 -442
megadetector/data_management/importers/zamba_results_to_md_results.py +0 -180
megadetector/data_management/lila/add_locations_to_island_camera_traps.py +0 -101
megadetector/data_management/lila/add_locations_to_nacti.py +0 -151
megadetector/utils/azure_utils.py +0 -178
megadetector/utils/sas_blob_utils.py +0 -509
megadetector-5.0.28.dist-info/RECORD +0 -209
/megadetector/{api/batch_processing/__init__.py → __init__.py} +0 -0
{megadetector-5.0.28.dist-info → megadetector-10.0.0.dist-info}/licenses/LICENSE +0 -0
{megadetector-5.0.28.dist-info → megadetector-10.0.0.dist-info}/top_level.txt +0 -0

megadetector/data_management/importers/umn_to_json.py DELETED Viewed

@@ -1,507 +0,0 @@
-"""
- umn_to_json.py
- Prepare images and metadata for the Orinoquía Camera Traps dataset.
-"""
-#%% Imports and constants
-import os
-import json
-import pandas as pd
-import shutil
-import uuid
-import datetime
-import dateutil.parser
-from collections import defaultdict
-from tqdm import tqdm
-from pathlib import Path
-from multiprocessing.pool import ThreadPool
-input_base = "f:\\"
-image_base = os.path.join(input_base,'2021.11.24-images\jan2020')
-ground_truth_file = os.path.join(input_base,'images_hv_jan2020_reviewed_force_nonblank.csv')
-# For two deployments, we're only processing imagse in the "detections" subfolder
-detection_only_deployments = ['N23','N32']
-deployments_to_ignore = ['N18','N28']
-MISSING_COMMON_NAME_TOKEN = 'MISSING'
-assert os.path.isfile(ground_truth_file)
-assert os.path.isdir(image_base)
-#%% Enumerate deployment folders
-deployment_folders = os.listdir(image_base)
-deployment_folders = [s for s in deployment_folders if os.path.isdir(os.path.join(image_base,s))]
-deployment_folders = set(deployment_folders)
-print('Listed {} deployment folders'.format(len(deployment_folders)))
-#%% Load ground truth
-ground_truth_df = pd.read_csv(ground_truth_file)
-print('Loaded {} ground truth annotations'.format(
-    len(ground_truth_df)))
-# i_row = 0; row = ground_truth_df.iloc[i_row]
-for i_row,row in tqdm(ground_truth_df.iterrows()):
-    if not isinstance(row['common_name'],str):
-        print('Warning: missing common name for {}'.format(row['filename']))
-        row['common_name'] = MISSING_COMMON_NAME_TOKEN
-#%% Create relative paths for ground truth data
-# Some deployment folders have no subfolders, e.g. this is a valid file name:
-#
-# M00/01010132.JPG
-#
-# But some deployment folders have subfolders, e.g. this is also a valid file name:
-#
-# N17/100EK113/07160020.JPG
-#
-# So we can't find files by just concatenating folder and file names, we have to enumerate and explicitly
-# map what will appear in the ground truth as "folder/filename" to complete relative paths.
-deployment_name_to_file_mappings = {}
-n_filenames_ignored = 0
-n_deployments_ignored = 0
-# deployment_name = list(deployment_folders)[0]
-for deployment_name in tqdm(deployment_folders):
-    file_mappings = {}
-    if deployment_name in deployments_to_ignore:
-        print('Ignoring deployment {}'.format(deployment_name))
-        n_deployments_ignored += 1
-        continue
-    # Enumerate all files in this folder
-    absolute_deployment_folder = os.path.join(image_base,deployment_name)
-    assert os.path.isdir(absolute_deployment_folder)
-    files = list(Path(absolute_deployment_folder).rglob('*'))
-    files = [p for p in files if not p.is_dir()]
-    files = [str(s) for s in files]
-    files = [s.replace('\\','/') for s in files]
-    # print('Enumerated {} files for deployment {}'.format(len(files),deployment_name))
-    # filename = files[100]
-    for filename in files:
-        if deployment_name in detection_only_deployments and 'detection' not in filename:
-            n_filenames_ignored += 1
-            continue
-        if '.DS_Store' in filename:
-            n_filenames_ignored += 1
-            continue
-        relative_path = os.path.relpath(filename,absolute_deployment_folder).replace('\\','/')
-        image_name = relative_path.split('/')[-1]
-        assert image_name not in file_mappings, 'Redundant image name {} in deployment {}'.format(
-            image_name,deployment_name)
-        assert '\\' not in relative_path
-        file_mappings[image_name] = relative_path
-    # ...for each file in this deployment
-    deployment_name_to_file_mappings[deployment_name] = file_mappings
-# ...for each deployment
-print('Processed deployments, ignored {} deployments and {} files'.format(
-    n_deployments_ignored,n_filenames_ignored))
-#%% Add relative paths to our ground truth table
-ground_truth_df['relative_path'] = None
-# i_row = 0; row = ground_truth_df.iloc[i_row]
-for i_row,row in tqdm(ground_truth_df.iterrows(),total=len(ground_truth_df)):
-    # row['filename'] looks like, e.g. A01/01080001.JPG.  This is not actually a path, it's
-    # just the deployment ID and the image name, separated by a slash.
-    deployment_name = row['filename'].split('/')[0]
-    assert deployment_name in deployment_folders, 'Could not find deployment folder {}'.format(deployment_name)
-    assert deployment_name in deployment_name_to_file_mappings, 'Could not find deployment folder {}'.format(deployment_name)
-    file_mappings = deployment_name_to_file_mappings[deployment_name]
-    # Find the relative path for this image
-    image_name = row['filename'].split('/')[-1]
-    assert image_name in file_mappings, 'No mappings for image {} in deployment {}'.format(
-        image_name,deployment_name)
-    relative_path = os.path.join(deployment_name,file_mappings[image_name]).replace('\\','/')
-    # Make sure this image file exists
-    absolute_path = os.path.join(image_base,relative_path)
-    assert os.path.isfile(absolute_path), 'Could not find file {}'.format(absolute_path)
-    ground_truth_df.loc[i_row,'relative_path'] = relative_path
-# ...for each row in the ground truth table
-#%% Take everything out of Pandas
-ground_truth_dicts = ground_truth_df.to_dict('records')
-#%% Convert string timestamps to Python datetimes
-all_locations = set()
-# im = ground_truth_dicts[0]
-for im in tqdm(ground_truth_dicts):
-    dt = dateutil.parser.isoparse(im['timestamp'])
-    assert dt.year == 2020
-    im['datetime'] = dt
-    # Filenames look like, e.g., N36/100EK113/06040726.JPG
-    im['location'] = im['relative_path'].split('/')[0]
-    assert len(im['location']) == 3
-    all_locations.add(im['location'])
-#%% Synthesize sequence information
-locations = all_locations
-print('Found {} locations'.format(len(locations)))
-locations = list(locations)
-sequences = set()
-sequence_to_images = defaultdict(list)
-images = ground_truth_dicts
-max_seconds_within_sequence = 10
-# Sort images by time within each location
-# i_location=0; location = locations[i_location]
-for i_location,location in tqdm(enumerate(locations)):
-    images_this_location = [im for im in images if im['location'] == location]
-    sorted_images_this_location = sorted(images_this_location, key = lambda im: im['datetime'])
-    current_sequence_id = None
-    next_frame_number = 0
-    previous_datetime = None
-    # previous_datetime = sorted_images_this_location[0]['datetime']
-    # im = sorted_images_this_camera[1]
-    for i_image,im in enumerate(sorted_images_this_location):
-        # Timestamp for this image, may be None
-        dt = im['datetime']
-        # Start a new sequence if:
-        #
-        # * This image has no timestamp
-        # * This image has a frame number of zero
-        # * We have no previous image timestamp
-        #
-        if dt is None:
-            delta = None
-        elif previous_datetime is None:
-            delta = None
-        else:
-            assert isinstance(dt,datetime.datetime)
-            delta = (dt - previous_datetime).total_seconds()
-        # Start a new sequence if necessary
-        if delta is None or delta > max_seconds_within_sequence:
-            next_frame_number = 0
-            current_sequence_id = str(uuid.uuid1())
-            sequences.add(current_sequence_id)
-        assert current_sequence_id is not None
-        im['seq_id'] = current_sequence_id
-        im['synthetic_frame_number'] = next_frame_number
-        next_frame_number = next_frame_number + 1
-        previous_datetime = dt
-        sequence_to_images[im['seq_id']].append(im)
-    # ...for each image in this location
-# ...for each location
-#%% Create category dict and category IDs
-categories_to_counts = defaultdict(int)
-category_mappings = {'blank':'empty',
-                     'mammal':'unknown_mammal',
-                     'dasypus_species':'unknown_armadillo',
-                     'bird':'unknown_bird',
-                     'bos_species':'cattle',
-                     'possum_family':'unknown_possum',
-                     'cervidae_family':'unknown_cervid',
-                     'unknown_species':'unknown',
-                     'lizards_and_snakes':'unknown_reptile',
-                     'caprimulgidae_family':'unknown_nightjar',
-                     'turtle_order':'unknown_turtle',
-                     'ornate_tití_monkey':'ornate_titi_monkey',
-                     'saimiri_species':'unknown_squirrel_monkey',
-                     'peccary_family':'unknown_peccary',
-                     'pecari_species':'unknown_peccary',
-                     'alouatta_species':'unknown_howler_monkey',
-                     'human-camera_trapper':'human',
-                     'weasel_family':'unknown_weasel',
-                     'motorcycle':'human',
-                     'eira_species':'unknown_tayra',
-                     'sapajus_species':'unknown_capuchin_monkey',
-                     'red_brocket':'red_brocket_deer'
-                     }
-for c in category_mappings.values():
-    assert ' ' not in c
-# im = images[0]
-for im in tqdm(images):
-    category_name = im['common_name'].lower().replace("'",'').replace(' ','_')
-    if category_name in category_mappings:
-        category_name = category_mappings[category_name]
-    categories_to_counts[category_name] += 1
-    im['category_name'] = category_name
-categories_to_counts_sorted = {k: v for k, v in sorted(categories_to_counts.items(),
-                                                       key=lambda item: item[1],reverse=True)}
-for s in categories_to_counts_sorted.keys():
-    print('{}: {}'.format(s,categories_to_counts_sorted[s]))
-#%% Imports and constants (.json generation)
-import os
-import uuid
-import datetime
-from tqdm import tqdm
-from megadetector.data_management.databases import integrity_check_json_db
-output_base = 'f:\orinoquia_camera_traps'
-output_image_base = os.path.join(output_base,'images')
-os.makedirs(output_image_base,exist_ok=True)
-output_json_filename = os.path.join(output_base, 'orinoquia_camera_traps.json')
-output_encoding = 'utf-8'
-read_image_sizes = False
-info = {}
-info['year'] = 2020
-info['version'] = '1.0'
-info['description'] = 'Orinoquia Camera Traps'
-info['contributor'] = 'University of Minnesota'
-info['date_created'] = str(datetime.date.today())
-#%% Count frames in each sequence
-sequence_id_to_n_frames = defaultdict(int)
-for im in tqdm(images):
-    seq_id = im['seq_id']
-    sequence_id_to_n_frames[seq_id] = sequence_id_to_n_frames[seq_id] + 1
-for im in tqdm(images):
-    seq_id = im['seq_id']
-    im['seq_num_frames'] = sequence_id_to_n_frames[seq_id]
-#%% Double check images with multiple annotations
-filename_to_images = defaultdict(list)
-# im = images[0]
-for im in tqdm(images):
-    fn = im['relative_path']
-    filename_to_images[fn].append(im)
-filenames_with_multiple_annotations = [fn for fn in filename_to_images.keys() if len(filename_to_images[fn]) > 1]
-print('Found {} filenames with multiple annotations'.format(len(filenames_with_multiple_annotations)))
-for fn in filenames_with_multiple_annotations:
-    images_this_file = filename_to_images[fn]
-    print(fn + ': ')
-    for im in images_this_file:
-        print(im['category_name'])
-    print('')
-#%% Assemble dictionaries
-images_out = []
-image_id_to_image = {}
-annotations = []
-categories = []
-category_name_to_category = {}
-category_id_to_category = {}
-# Force the empty category to be ID 0
-empty_category = {}
-empty_category['name'] = 'empty'
-empty_category['id'] = 0
-empty_category['count'] = 0
-category_id_to_category[0] = empty_category
-category_name_to_category['empty'] = empty_category
-categories.append(empty_category)
-next_id = 1
-# input_im = images[0]
-for input_im in tqdm(images):
-    category_name = input_im['category_name'].lower().strip()
-    if category_name not in category_name_to_category:
-        category_id = next_id
-        next_id += 1
-        category = {}
-        category['id'] = category_id
-        category['name'] = category_name
-        category['count'] = 0
-        categories.append(category)
-        category_name_to_category[category_name] = category
-        category_id_to_category[category_id] = category
-    else:
-        category = category_name_to_category[category_name]
-    category_id = category['id']
-    category['count'] += 1
-    im = {}
-    im['id'] = input_im['relative_path'].replace('/','_')
-    im['datetime'] = str(input_im['datetime'])
-    im['file_name'] = input_im['relative_path']
-    im['seq_id'] = input_im['seq_id']
-    im['frame_num'] = input_im['synthetic_frame_number']
-    im['seq_num_frames'] = input_im['seq_num_frames']
-    im['location'] = input_im['location']
-    if im['id'] in image_id_to_image:
-        print('Warning: image ID {} ({}) has multiple annotations'.format(im['id'],im['id'].replace('_','/')))
-    else:
-        image_id_to_image[im['id']] = im
-        images_out.append(im)
-    ann = {}
-    ann['id'] = str(uuid.uuid1())
-    ann['image_id'] = im['id']
-    ann['category_id'] = category_id
-    ann['sequence_level_annotation'] = False
-    annotations.append(ann)
-# ...for each image
-#%% Write output .json
-data = {}
-data['info'] = info
-data['images'] = images_out
-data['annotations'] = annotations
-data['categories'] = categories
-with open(output_json_filename, 'w') as f:
-    json.dump(data, f, indent=1)
-print('Finished writing json to {}'.format(output_json_filename))
-#%% Validate .json file
-options = integrity_check_json_db.IntegrityCheckOptions()
-options.baseDir = output_base
-options.bCheckImageSizes = False
-options.bCheckImageExistence = False
-options.bFindUnusedImages = False
-_, _, _ = integrity_check_json_db.integrity_check_json_db(output_json_filename, options)
-#%% Map relative paths to annotation categories
-category_id_to_category_names = {c['id']:c['name'] for c in data['categories']}
-image_id_to_category_names = defaultdict(list)
-# ann = data['annotations'][0]
-for ann in data['annotations']:
-    category_name = category_id_to_category_names[ann['category_id']]
-    image_id_to_category_names[ann['image_id']].append(category_name)
-#%% Copy images to output
-# EXCLUDE HUMAN AND MISSING
-# im = data['images'][0]
-def copy_image(im):
-    image_id = im['id']
-    category_names_this_image = image_id_to_category_names[image_id]
-    assert len(category_names_this_image) > 0
-    if ('human' in category_names_this_image) or ('missing' in category_names_this_image):
-        prefix = 'private'
-    else:
-        prefix = 'public'
-    input_fn_absolute = os.path.join(image_base,im['file_name'])
-    output_fn_absolute = os.path.join(output_image_base,prefix,im['file_name'])
-    dirname = os.path.dirname(output_fn_absolute)
-    os.makedirs(dirname,exist_ok=True)
-    shutil.copy(input_fn_absolute,output_fn_absolute)
-n_threads = 10
-# im = images[0]
-if n_threads == 1:
-    for im in tqdm(data['images']):
-        copy_image(im)
-else:
-    pool = ThreadPool(n_threads)
-    with tqdm(total=len(data['images'])) as pbar:
-        for i,_ in enumerate(pool.imap_unordered(copy_image,data['images'])):
-            pbar.update()
-#%% Preview labels
-from megadetector.visualization import visualize_db
-viz_options = visualize_db.DbVizOptions()
-viz_options.num_to_visualize = 100
-viz_options.trim_to_images_with_bboxes = False
-viz_options.add_search_links = False
-viz_options.sort_by_filename = False
-viz_options.parallelize_rendering = True
-viz_options.include_filename_links = True
-# viz_options.classes_to_exclude = ['test']
-html_output_file, _ = visualize_db.visualize_db(db_path=output_json_filename,
-                                                         output_dir=os.path.join(
-                                                         output_base,'preview'),
-                                                         image_base_dir=os.path.join(output_image_base,'public'),
-                                                         options=viz_options)
-os.startfile(html_output_file)

megadetector 5.0.28__py3-none-any.whl → 10.0.0__py3-none-any.whl

Potentially problematic release.

megadetector 5.0.28py3-none-any.whl → 10.0.0py3-none-any.whl