PyPI - megadetector - Versions diffs - 5.0.28__py3-none-any.whl → 10.0.0__py3-none-any.whl - Mend

megadetector 5.0.28py3-none-any.whl → 10.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of megadetector might be problematic. Click here for more details.

Files changed (197) hide show

megadetector/api/batch_processing/integration/digiKam/xmp_integration.py +2 -2
megadetector/api/batch_processing/integration/eMammal/test_scripts/push_annotations_to_emammal.py +1 -1
megadetector/api/batch_processing/integration/eMammal/test_scripts/select_images_for_testing.py +1 -1
megadetector/classification/aggregate_classifier_probs.py +3 -3
megadetector/classification/analyze_failed_images.py +5 -5
megadetector/classification/cache_batchapi_outputs.py +5 -5
megadetector/classification/create_classification_dataset.py +11 -12
megadetector/classification/crop_detections.py +10 -10
megadetector/classification/csv_to_json.py +8 -8
megadetector/classification/detect_and_crop.py +13 -15
megadetector/classification/efficientnet/model.py +8 -8
megadetector/classification/efficientnet/utils.py +6 -5
megadetector/classification/evaluate_model.py +7 -7
megadetector/classification/identify_mislabeled_candidates.py +6 -6
megadetector/classification/json_to_azcopy_list.py +1 -1
megadetector/classification/json_validator.py +29 -32
megadetector/classification/map_classification_categories.py +9 -9
megadetector/classification/merge_classification_detection_output.py +12 -9
megadetector/classification/prepare_classification_script.py +19 -19
megadetector/classification/prepare_classification_script_mc.py +26 -26
megadetector/classification/run_classifier.py +4 -4
megadetector/classification/save_mislabeled.py +6 -6
megadetector/classification/train_classifier.py +1 -1
megadetector/classification/train_classifier_tf.py +9 -9
megadetector/classification/train_utils.py +10 -10
megadetector/data_management/annotations/annotation_constants.py +1 -2
megadetector/data_management/camtrap_dp_to_coco.py +79 -46
megadetector/data_management/cct_json_utils.py +103 -103
megadetector/data_management/cct_to_md.py +49 -49
megadetector/data_management/cct_to_wi.py +33 -33
megadetector/data_management/coco_to_labelme.py +75 -75
megadetector/data_management/coco_to_yolo.py +210 -193
megadetector/data_management/databases/add_width_and_height_to_db.py +86 -12
megadetector/data_management/databases/combine_coco_camera_traps_files.py +40 -40
megadetector/data_management/databases/integrity_check_json_db.py +228 -200
megadetector/data_management/databases/subset_json_db.py +33 -33
megadetector/data_management/generate_crops_from_cct.py +88 -39
megadetector/data_management/get_image_sizes.py +54 -49
megadetector/data_management/labelme_to_coco.py +133 -125
megadetector/data_management/labelme_to_yolo.py +159 -73
megadetector/data_management/lila/create_lila_blank_set.py +81 -83
megadetector/data_management/lila/create_lila_test_set.py +32 -31
megadetector/data_management/lila/create_links_to_md_results_files.py +18 -18
megadetector/data_management/lila/download_lila_subset.py +21 -24
megadetector/data_management/lila/generate_lila_per_image_labels.py +365 -107
megadetector/data_management/lila/get_lila_annotation_counts.py +35 -33
megadetector/data_management/lila/get_lila_image_counts.py +22 -22
megadetector/data_management/lila/lila_common.py +73 -70
megadetector/data_management/lila/test_lila_metadata_urls.py +28 -19
megadetector/data_management/mewc_to_md.py +344 -340
megadetector/data_management/ocr_tools.py +262 -255
megadetector/data_management/read_exif.py +249 -227
megadetector/data_management/remap_coco_categories.py +90 -28
megadetector/data_management/remove_exif.py +81 -21
megadetector/data_management/rename_images.py +187 -187
megadetector/data_management/resize_coco_dataset.py +588 -120
megadetector/data_management/speciesnet_to_md.py +41 -41
megadetector/data_management/wi_download_csv_to_coco.py +55 -55
megadetector/data_management/yolo_output_to_md_output.py +248 -122
megadetector/data_management/yolo_to_coco.py +333 -191
megadetector/detection/change_detection.py +832 -0
megadetector/detection/process_video.py +340 -337
megadetector/detection/pytorch_detector.py +358 -278
megadetector/detection/run_detector.py +399 -186
megadetector/detection/run_detector_batch.py +404 -377
megadetector/detection/run_inference_with_yolov5_val.py +340 -327
megadetector/detection/run_tiled_inference.py +257 -249
megadetector/detection/tf_detector.py +24 -24
megadetector/detection/video_utils.py +332 -295
megadetector/postprocessing/add_max_conf.py +19 -11
megadetector/postprocessing/categorize_detections_by_size.py +45 -45
megadetector/postprocessing/classification_postprocessing.py +468 -433
megadetector/postprocessing/combine_batch_outputs.py +23 -23
megadetector/postprocessing/compare_batch_results.py +590 -525
megadetector/postprocessing/convert_output_format.py +106 -102
megadetector/postprocessing/create_crop_folder.py +347 -147
megadetector/postprocessing/detector_calibration.py +173 -168
megadetector/postprocessing/generate_csv_report.py +508 -499
megadetector/postprocessing/load_api_results.py +48 -27
megadetector/postprocessing/md_to_coco.py +133 -102
megadetector/postprocessing/md_to_labelme.py +107 -90
megadetector/postprocessing/md_to_wi.py +40 -40
megadetector/postprocessing/merge_detections.py +92 -114
megadetector/postprocessing/postprocess_batch_results.py +319 -301
megadetector/postprocessing/remap_detection_categories.py +91 -38
megadetector/postprocessing/render_detection_confusion_matrix.py +214 -205
megadetector/postprocessing/repeat_detection_elimination/find_repeat_detections.py +57 -57
megadetector/postprocessing/repeat_detection_elimination/remove_repeat_detections.py +27 -28
megadetector/postprocessing/repeat_detection_elimination/repeat_detections_core.py +704 -679
megadetector/postprocessing/separate_detections_into_folders.py +226 -211
megadetector/postprocessing/subset_json_detector_output.py +265 -262
megadetector/postprocessing/top_folders_to_bottom.py +45 -45
megadetector/postprocessing/validate_batch_results.py +70 -70
megadetector/taxonomy_mapping/map_lila_taxonomy_to_wi_taxonomy.py +52 -52
megadetector/taxonomy_mapping/map_new_lila_datasets.py +18 -19
megadetector/taxonomy_mapping/prepare_lila_taxonomy_release.py +54 -33
megadetector/taxonomy_mapping/preview_lila_taxonomy.py +67 -67
megadetector/taxonomy_mapping/retrieve_sample_image.py +16 -16
megadetector/taxonomy_mapping/simple_image_download.py +8 -8
megadetector/taxonomy_mapping/species_lookup.py +156 -74
megadetector/taxonomy_mapping/taxonomy_csv_checker.py +14 -14
megadetector/taxonomy_mapping/taxonomy_graph.py +10 -10
megadetector/taxonomy_mapping/validate_lila_category_mappings.py +13 -13
megadetector/utils/ct_utils.py +1049 -211
megadetector/utils/directory_listing.py +21 -77
megadetector/utils/gpu_test.py +22 -22
megadetector/utils/md_tests.py +632 -529
megadetector/utils/path_utils.py +1520 -431
megadetector/utils/process_utils.py +41 -41
megadetector/utils/split_locations_into_train_val.py +62 -62
megadetector/utils/string_utils.py +148 -27
megadetector/utils/url_utils.py +489 -176
megadetector/utils/wi_utils.py +2658 -2526
megadetector/utils/write_html_image_list.py +137 -137
megadetector/visualization/plot_utils.py +34 -30
megadetector/visualization/render_images_with_thumbnails.py +39 -74
megadetector/visualization/visualization_utils.py +487 -435
megadetector/visualization/visualize_db.py +232 -198
megadetector/visualization/visualize_detector_output.py +82 -76
{megadetector-5.0.28.dist-info → megadetector-10.0.0.dist-info}/METADATA +5 -2
megadetector-10.0.0.dist-info/RECORD +139 -0
{megadetector-5.0.28.dist-info → megadetector-10.0.0.dist-info}/WHEEL +1 -1
megadetector/api/batch_processing/api_core/__init__.py +0 -0
megadetector/api/batch_processing/api_core/batch_service/__init__.py +0 -0
megadetector/api/batch_processing/api_core/batch_service/score.py +0 -439
megadetector/api/batch_processing/api_core/server.py +0 -294
megadetector/api/batch_processing/api_core/server_api_config.py +0 -97
megadetector/api/batch_processing/api_core/server_app_config.py +0 -55
megadetector/api/batch_processing/api_core/server_batch_job_manager.py +0 -220
megadetector/api/batch_processing/api_core/server_job_status_table.py +0 -149
megadetector/api/batch_processing/api_core/server_orchestration.py +0 -360
megadetector/api/batch_processing/api_core/server_utils.py +0 -88
megadetector/api/batch_processing/api_core_support/__init__.py +0 -0
megadetector/api/batch_processing/api_core_support/aggregate_results_manually.py +0 -46
megadetector/api/batch_processing/api_support/__init__.py +0 -0
megadetector/api/batch_processing/api_support/summarize_daily_activity.py +0 -152
megadetector/api/batch_processing/data_preparation/__init__.py +0 -0
megadetector/api/synchronous/__init__.py +0 -0
megadetector/api/synchronous/api_core/animal_detection_api/__init__.py +0 -0
megadetector/api/synchronous/api_core/animal_detection_api/api_backend.py +0 -151
megadetector/api/synchronous/api_core/animal_detection_api/api_frontend.py +0 -263
megadetector/api/synchronous/api_core/animal_detection_api/config.py +0 -35
megadetector/api/synchronous/api_core/tests/__init__.py +0 -0
megadetector/api/synchronous/api_core/tests/load_test.py +0 -110
megadetector/data_management/importers/add_nacti_sizes.py +0 -52
megadetector/data_management/importers/add_timestamps_to_icct.py +0 -79
megadetector/data_management/importers/animl_results_to_md_results.py +0 -158
megadetector/data_management/importers/auckland_doc_test_to_json.py +0 -373
megadetector/data_management/importers/auckland_doc_to_json.py +0 -201
megadetector/data_management/importers/awc_to_json.py +0 -191
megadetector/data_management/importers/bellevue_to_json.py +0 -272
megadetector/data_management/importers/cacophony-thermal-importer.py +0 -793
megadetector/data_management/importers/carrizo_shrubfree_2018.py +0 -269
megadetector/data_management/importers/carrizo_trail_cam_2017.py +0 -289
megadetector/data_management/importers/cct_field_adjustments.py +0 -58
megadetector/data_management/importers/channel_islands_to_cct.py +0 -913
megadetector/data_management/importers/eMammal/copy_and_unzip_emammal.py +0 -180
megadetector/data_management/importers/eMammal/eMammal_helpers.py +0 -249
megadetector/data_management/importers/eMammal/make_eMammal_json.py +0 -223
megadetector/data_management/importers/ena24_to_json.py +0 -276
megadetector/data_management/importers/filenames_to_json.py +0 -386
megadetector/data_management/importers/helena_to_cct.py +0 -283
megadetector/data_management/importers/idaho-camera-traps.py +0 -1407
megadetector/data_management/importers/idfg_iwildcam_lila_prep.py +0 -294
megadetector/data_management/importers/import_desert_lion_conservation_camera_traps.py +0 -387
megadetector/data_management/importers/jb_csv_to_json.py +0 -150
megadetector/data_management/importers/mcgill_to_json.py +0 -250
megadetector/data_management/importers/missouri_to_json.py +0 -490
megadetector/data_management/importers/nacti_fieldname_adjustments.py +0 -79
megadetector/data_management/importers/noaa_seals_2019.py +0 -181
megadetector/data_management/importers/osu-small-animals-to-json.py +0 -364
megadetector/data_management/importers/pc_to_json.py +0 -365
megadetector/data_management/importers/plot_wni_giraffes.py +0 -123
megadetector/data_management/importers/prepare_zsl_imerit.py +0 -131
megadetector/data_management/importers/raic_csv_to_md_results.py +0 -416
megadetector/data_management/importers/rspb_to_json.py +0 -356
megadetector/data_management/importers/save_the_elephants_survey_A.py +0 -320
megadetector/data_management/importers/save_the_elephants_survey_B.py +0 -329
megadetector/data_management/importers/snapshot_safari_importer.py +0 -758
megadetector/data_management/importers/snapshot_serengeti_lila.py +0 -1067
megadetector/data_management/importers/snapshotserengeti/make_full_SS_json.py +0 -150
megadetector/data_management/importers/snapshotserengeti/make_per_season_SS_json.py +0 -153
megadetector/data_management/importers/sulross_get_exif.py +0 -65
megadetector/data_management/importers/timelapse_csv_set_to_json.py +0 -490
megadetector/data_management/importers/ubc_to_json.py +0 -399
megadetector/data_management/importers/umn_to_json.py +0 -507
megadetector/data_management/importers/wellington_to_json.py +0 -263
megadetector/data_management/importers/wi_to_json.py +0 -442
megadetector/data_management/importers/zamba_results_to_md_results.py +0 -180
megadetector/data_management/lila/add_locations_to_island_camera_traps.py +0 -101
megadetector/data_management/lila/add_locations_to_nacti.py +0 -151
megadetector/utils/azure_utils.py +0 -178
megadetector/utils/sas_blob_utils.py +0 -509
megadetector-5.0.28.dist-info/RECORD +0 -209
/megadetector/{api/batch_processing/__init__.py → __init__.py} +0 -0
{megadetector-5.0.28.dist-info → megadetector-10.0.0.dist-info}/licenses/LICENSE +0 -0
{megadetector-5.0.28.dist-info → megadetector-10.0.0.dist-info}/top_level.txt +0 -0

megadetector/data_management/importers/missouri_to_json.py DELETED Viewed

@@ -1,490 +0,0 @@
-"""
- missouri_to_json.py
- Create .json files from the original source files for the Missouri Camera Traps
- data set.  Metadata was provided here in two formats:
- 1) In one subset of the data, folder names indicated species names.  In Set 1,
-    there are no empty sequences.  Set 1 has a metadata file to indicate image-level
-    bounding boxes.
- 2) A subset of the data (overlapping with (1)) was annotated with bounding
-    boxes, specified in a whitespace-delimited text file.  In set 2, there are
-    some sequences omitted from the metadata file, which implied emptiness.
- In the end, set 2 labels were not reliable enough to publish, so LILA includes only set 1.
-"""
-#%% Constants and imports
-import json
-import os
-import uuid
-import time
-import humanfriendly
-import warnings
-import ntpath
-import datetime
-from PIL import Image
-# ignoring all "PIL cannot read EXIF metainfo for the images" warnings
-warnings.filterwarnings("ignore", "(Possibly )?corrupt EXIF data", UserWarning)
-# Metadata Warning, tag 256 had too many entries: 42, expected 1
-warnings.filterwarnings("ignore", "Metadata warning", UserWarning)
-baseDir = os.path.expanduser('~/tmp/mct')
-imageDir = os.path.join(baseDir,'images')
-outputJsonFilenameSet1 = os.path.join(baseDir,'missouri_camera_traps_set1.json')
-outputEncoding = 'utf-8'
-fileListJsonFilename = os.path.join(baseDir,'images.json')
-# This will be a list of filenames that need re-annotation due to redundant boxes
-set1RedundantBoxListFilename = os.path.join(baseDir,'mct_images_with_redundant_boxes.txt')
-set1BaseDir = os.path.join(imageDir,'Set1')
-metadataFilenameSet1 = os.path.join(set1BaseDir,'labels.txt')
-assert(os.path.isdir(baseDir))
-assert(os.path.isfile(metadataFilenameSet1))
-info = {}
-info['year'] = 2019
-info['version'] = '1.21'
-info['description'] = 'Missouri Camera Traps (set 1)'
-info['contributor'] = ''
-info['date_created'] = str(datetime.date.today())
-infoSet1 = info
-maxFiles = -1
-emptyCategoryId = 0
-emptyCategoryName = 'empty'
-#%% Enumerate files, read image sizes
-# Takes a few minutes, since we're reading image sizes.
-# Each element will be a list of relative path/full path/width/height
-fileInfo = []
-nonImages = []
-nFiles = 0
-relPathToIm = {}
-imageIdToImage = {}
-set1ImageIDs = []
-sequenceIDtoCount = {}
-print('Enumerating files from {} to {}'.format(imageDir,fileListJsonFilename))
-startTime = time.time()
-for root, subdirs, files in os.walk(imageDir):
-    if root == imageDir:
-        continue
-    bn = ntpath.basename(root)
-    # Only process leaf nodes corresponding to sequences, which look like:
-    #
-    # Set1/1.02-Agouti/SEQ75583
-    #
-    if ('Set1' in root and 'SEQ' in bn):
-        sequenceID = bn
-        assert sequenceID not in sequenceIDtoCount
-        sequenceIDtoCount[sequenceID] = 0
-    else:
-        print('Skipping folder {}:{}'.format(root,bn))
-        continue
-        # assert len(files) <= 2
-    for fname in files:
-        nFiles = nFiles + 1
-        if maxFiles >= 0 and nFiles > maxFiles:
-            print('Warning: early break at {} files'.format(maxFiles))
-            break
-        fullPath = os.path.join(root,fname)
-        relativePath = os.path.relpath(fullPath,imageDir)
-        if maxFiles >= 0:
-            print(relativePath)
-        h = -1
-        w = -1
-        # Read the image
-        try:
-            im = Image.open(fullPath)
-            h = im.height
-            w = im.width
-        except:
-            # Not an image...
-            continue
-        # Store file info
-        im = {}
-        im['id'] = str(uuid.uuid1())
-        im['file_name'] = relativePath
-        im['height'] = h
-        im['width'] = w
-        im['location'] = 'missouri_camera_traps'
-        im['seq_id'] = sequenceID
-        im['seq_num_frames'] = -1
-        frame_number = sequenceIDtoCount[sequenceID]
-        im['frame_num'] = frame_number
-        sequenceIDtoCount[sequenceID] = sequenceIDtoCount[sequenceID] + 1
-        imageIdToImage[im['id']] = im
-        relPathToIm[relativePath] = im
-        if 'Set1' in relativePath:
-            set1ImageIDs.append(im['id'])
-        else:
-            raise Exception('Oops, can''t assign this image to a set')
-    # ...if we didn't hit the max file limit, keep going
-    else:
-        continue
-    break
-# ...for each file
-elapsed = time.time() - startTime
-print('Finished file enumeration in {}'.format(
-      humanfriendly.format_timespan(elapsed)))
-#%% Add sequence lengths
-for imageID in imageIdToImage:
-    im = imageIdToImage[imageID]
-    sequenceID = im['seq_id']
-    seq_num_frames = sequenceIDtoCount[sequenceID]
-    assert(im['seq_num_frames'] == -1)
-    im['seq_num_frames'] = seq_num_frames
-#%% Load the metadata (.txt) file
-with open(metadataFilenameSet1) as f:
-    metadataSet1Lines = f.readlines()
-metadataSet1Lines = [x.strip() for x in metadataSet1Lines]
-#%% Map relative paths to metadata
-# List of lists, length varies according to number of bounding boxes
-#
-# Preserves original ordering
-missingFilesSet1 = []
-correctedFiles = []
-relPathToMetadataSet1 = {}
-# iLine = 0; line = metadataSet1Lines[0]
-for iLine,line in enumerate(metadataSet1Lines):
-    tokens = line.split()
-    nTokens = len(tokens)
-    # Lines should be filename, number of bounding boxes, boxes (four values per box)
-    assert ((nTokens - 2) % 4) == 0
-    relPath = tokens[0].replace('/',os.sep).replace('\\',os.sep)
-    relPath = os.path.join('Set1',relPath)
-    absPath = os.path.join(imageDir,relPath)
-    originalAbsPath = absPath
-    originalRelPath = relPath
-    if not os.path.isfile(absPath):
-        absPath = originalAbsPath.replace('IMG','IMG_')
-        relPath = originalRelPath.replace('IMG','IMG_')
-        if os.path.isfile(absPath):
-            correctedFiles.append([relPath,originalRelPath,absPath,originalAbsPath])
-    if not os.path.isfile(absPath):
-        absPath = originalAbsPath.replace('Red_Deer','Red_Brocket_Deer').replace('IMG','IMG_')
-        relPath = originalRelPath.replace('Red_Deer','Red_Brocket_Deer').replace('IMG','IMG_')
-        if os.path.isfile(absPath):
-            correctedFiles.append([relPath,originalRelPath,absPath,originalAbsPath])
-    if not os.path.isfile(absPath):
-        missingFilesSet1.append([originalRelPath,originalAbsPath])
-    else:
-        relPathToMetadataSet1[relPath] = tokens
-        # Make sure we have image info for this image
-        assert relPath in relPathToIm
-print('Corrected {} paths, missing {} images of {}'.format(len(correctedFiles),
-      len(missingFilesSet1),len(metadataSet1Lines)))
-#%% Print missing files from Set 1 metadata
-# The only missing file (and it's really just missing):
-#
-# Set1/1.58-Roe_Deer/SEQ75631/SEQ75631_IMG_0011.JPG
-print('Missing files in Set 1:\n')
-for iFile,fInfo in enumerate(missingFilesSet1):
-    print(fInfo[0])
-#%% Create categories and annotations for set 1
-imagesSet1 = []
-categoriesSet1 = []
-annotationsSet1 = []
-categoryNameToId = {}
-idToCategory = {}
-# Though we have no empty sequences, we do have empty images in this set
-emptyCat = {}
-emptyCat['id'] = emptyCategoryId
-emptyCat['name'] = emptyCategoryName
-emptyCat['count'] = 0
-categoriesSet1.append(emptyCat)
-nextCategoryId = emptyCategoryId + 1
-nFoundMetadata = 0
-nTotalBoxes = 0
-nImageLevelEmpties = 0
-nSequenceLevelAnnotations = 0
-nRedundantBoxes = 0
-imageIDsWithRedundantBoxes = set()
-# For each image
-#
-# iImage = 0; imageID = set1ImageIDs[iImage]
-for iImage,imageID in enumerate(set1ImageIDs):
-    im = imageIdToImage[imageID]
-    imagesSet1.append(im)
-    # E.g. Set1\\1.80-Coiban_Agouti\\SEQ83155\\SEQ83155_IMG_0010.JPG
-    relPath = im['file_name']
-    # Find the species name
-    tokens = os.path.normpath(relPath).split(os.sep)
-    speciesTag = tokens[1]
-    tokens = speciesTag.split('-',1)
-    assert(len(tokens) == 2)
-    categoryName = tokens[1].lower()
-    category = None
-    categoryId = None
-    if categoryName not in categoryNameToId:
-        categoryId = nextCategoryId
-        nextCategoryId += 1
-        categoryNameToId[categoryName] = categoryId
-        newCat = {}
-        newCat['id'] = categoryNameToId[categoryName]
-        newCat['name'] = categoryName
-        newCat['count'] = 0
-        categoriesSet1.append(newCat)
-        idToCategory[categoryId] = newCat
-        category = newCat
-    else:
-        categoryId = categoryNameToId[categoryName]
-        category = idToCategory[categoryId]
-        # This image may still be empty...
-        # category['count'] = category['count'] + 1
-    # If we have bounding boxes, create image-level annotations
-    if relPath in relPathToMetadataSet1:
-        nFoundMetadata += 1
-        # This tuple is:
-        #
-        # filename (possibly no longer correct)
-        # number of bounding boxes
-        # [...boxes (four values per box)]
-        imageMetadata = relPathToMetadataSet1[relPath]
-        nBoxes = int(imageMetadata[1])
-        im['n_boxes'] = nBoxes
-        if nBoxes == 0:
-            ann = {}
-            ann['id'] = str(uuid.uuid1())
-            ann['image_id'] = im['id']
-            ann['category_id'] = emptyCategoryId
-            ann['sequence_level_annotation'] = False
-            annotationsSet1.append(ann)
-            emptyCat['count'] = emptyCat['count'] + 1
-            nImageLevelEmpties += 1
-        else:
-            # This image is non-empty
-            category['count'] = category['count'] + 1
-            for iBox in range(0,nBoxes):
-                boxCoords = imageMetadata[2+(iBox*4):6+(iBox*4)]
-                boxCoords = list(map(int, boxCoords))
-                # Some redundant bounding boxes crept in, don't add them twice
-                bRedundantBox = False
-                # Check this bbox against previous bboxes
-                #
-                # Inefficient?  Yes.  In an important way?  No.
-                for iBoxComparison in range(0,iBox):
-                    assert iBox != iBoxComparison
-                    boxCoordsComparison = imageMetadata[2+(iBoxComparison*4):6+(iBoxComparison*4)]
-                    boxCoordsComparison = list(map(int, boxCoordsComparison))
-                    if boxCoordsComparison == boxCoords:
-                        # print('Warning: redundant box on image {}'.format(relPath))
-                        bRedundantBox = True
-                        nRedundantBoxes += 1
-                        break
-                if bRedundantBox:
-                    imageIDsWithRedundantBoxes.add(im['id'])
-                    continue
-                # Bounding box values are in absolute coordinates, with the origin
-                # at the upper-left of the image, as [xmin1 ymin1 xmax1 ymax1].
-                #
-                # Convert to floats and to x/y/w/h, as per CCT standard
-                bboxW = boxCoords[2] - boxCoords[0]
-                bboxH = boxCoords[3] - boxCoords[1]
-                box = [boxCoords[0], boxCoords[1], bboxW, bboxH]
-                box = list(map(float, box))
-                ann = {}
-                ann['id'] = str(uuid.uuid1())
-                ann['image_id'] = im['id']
-                ann['category_id'] = categoryId
-                ann['sequence_level_annotation'] = False
-                ann['bbox'] = box
-                annotationsSet1.append(ann)
-                nTotalBoxes += 1
-            # ...for each box
-        # if we do/don't have boxes for this image
-    # Else create a sequence-level annotation
-    else:
-        ann = {}
-        ann['id'] = str(uuid.uuid1())
-        ann['image_id'] = im['id']
-        ann['category_id'] = categoryId
-        ann['sequence_level_annotation'] = True
-        annotationsSet1.append(ann)
-        nSequenceLevelAnnotations += 1
-# ...for each image
-print('Finished processing set 1, found metadata for {} of {} images'.format(nFoundMetadata,len(set1ImageIDs)))
-print('Created {} annotations and {} boxes in {} categories'.format(
-    len(annotationsSet1),nTotalBoxes,len(categoriesSet1)))
-print('Found {} redundant annotations'.format(nRedundantBoxes))
-assert len(annotationsSet1) == nSequenceLevelAnnotations + nTotalBoxes + nImageLevelEmpties
-assert len(set1ImageIDs) == nSequenceLevelAnnotations + nFoundMetadata
-print('Found {} images with redundant boxes'.format(len(imageIDsWithRedundantBoxes)))
-#%% Write out the list of images with redundant boxes
-imageFileNamesWithRedundantBoxes = []
-for image_id in imageIDsWithRedundantBoxes:
-    im = imageIdToImage[image_id]
-    imageFileNamesWithRedundantBoxes.append(im['file_name'])
-imageFileNamesWithRedundantBoxes.sort()
-with open(set1RedundantBoxListFilename,'w') as f:
-    for fn in imageFileNamesWithRedundantBoxes:
-        f.write(fn + '\n')
-#%% The 'count' field isn't really meaningful, delete it
-# It's really the count of image-level annotations, not total images assigned to a class
-for d in categoriesSet1:
-    del d['count']
-#%% Write output .json files
-data = {}
-data['info'] = infoSet1
-data['images'] = imagesSet1
-data['annotations'] = annotationsSet1
-data['categories'] = categoriesSet1
-json.dump(data, open(outputJsonFilenameSet1,'w'), indent=4)
-print('Finished writing json to {}'.format(outputJsonFilenameSet1))
-#%% Consistency-check final set 1 .json file
-from megadetector.data_management.databases import integrity_check_json_db
-options = integrity_check_json_db.IntegrityCheckOptions()
-options.baseDir = imageDir
-options.bCheckImageSizes = True
-options.bCheckImageExistence = True
-options.bFindUnusedImages = True
-options.bRequireLocation = False
-options.nThreads = 10
-sortedCategories,data,_ = integrity_check_json_db.integrity_check_json_db(outputJsonFilenameSet1, options)
-sortedCategories
-#%% Generate previews
-from megadetector.visualization import visualize_db
-output_dir = os.path.join(baseDir,'preview')
-options = visualize_db.DbVizOptions()
-options.num_to_visualize = 5000
-options.sort_by_filename = False
-options.classes_to_exclude = None
-options.trim_to_images_with_bboxes = False
-options.parallelize_rendering = True
-htmlOutputFile,_ = visualize_db.visualize_db(outputJsonFilenameSet1,output_dir,imageDir,options)
-from megadetector.utils.path_utils import open_file
-open_file(htmlOutputFile)

megadetector/data_management/importers/nacti_fieldname_adjustments.py DELETED Viewed

@@ -1,79 +0,0 @@
-"""
- nacti_fieldname_adjustments.py
- NACTI metadata was posted with "filename" in images instead of "file_name", and
- used string (rather than int) category IDs (in categories, but not in annotations).
- This script fixes those issues and rev's the version number.
-"""
-#%% Constants and environment
-import json
-import os
-inputJsonFile = r'/datadrive1/nacti_metadata_orig.json'
-outputJsonFile = r'/datadrive1/nacti_metadata.json'
-assert os.path.isfile(inputJsonFile)
-#%% Read .json file
-with open(inputJsonFile,'r') as f:
-    data = json.load(f)
-images = data['images']
-annotations = data['annotations']
-categories = data['categories']
-info = data['info']
-print('Finished reading input .json')
-#%% Rev version number, update field names and types
-assert(info['version'] == 1.0)
-info['version'] = 1.1
-nFilenameConversions = 0
-nCatConversions = 0
-nAnnConversions = 0
-for image in images:
-    assert 'path' in image and isinstance(image['path'],str)
-    image['file_name'] = image['path']
-    del image['path']
-    nFilenameConversions += 1
-    assert 'seq_no' in image
-    del image['seq_no']
-    assert 'width' in image and isinstance(image['width'],str)
-    assert 'height' in image and isinstance(image['height'],str)
-    image['width'] = int(image['width'])
-    image['height'] = int(image['height'])
-for cat in categories:
-    assert 'id' in cat and isinstance(cat['id'],str)
-    cat['id'] = int(cat['id'])
-    nCatConversions += 1
-for ann in annotations:
-    assert 'id' in ann and isinstance(ann['id'],str)
-    assert 'category_id' in ann and isinstance(ann['category_id'],str)
-    ann['category_id'] = int(ann['category_id'])
-    nAnnConversions += 1
-print('Finished checking data, converted {} filename fields, {} category IDs, {} annotation category IDs'.format(
-        nFilenameConversions,nCatConversions,nAnnConversions))
-#%% Write json file
-json.dump(data, open(outputJsonFile, 'w'), indent=4)
-print('Finished writing output .json to {}'.format(outputJsonFile))

megadetector 5.0.28__py3-none-any.whl → 10.0.0__py3-none-any.whl

Potentially problematic release.

megadetector 5.0.28py3-none-any.whl → 10.0.0py3-none-any.whl