PyPI - megadetector - Versions diffs - 10.0.13__py3-none-any.whl - Mend

megadetector 10.0.13__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of megadetector might be problematic. Click here for more details.

Files changed (147) hide show

megadetector/__init__.py +0 -0
megadetector/api/__init__.py +0 -0
megadetector/api/batch_processing/integration/digiKam/setup.py +6 -0
megadetector/api/batch_processing/integration/digiKam/xmp_integration.py +465 -0
megadetector/api/batch_processing/integration/eMammal/test_scripts/config_template.py +5 -0
megadetector/api/batch_processing/integration/eMammal/test_scripts/push_annotations_to_emammal.py +125 -0
megadetector/api/batch_processing/integration/eMammal/test_scripts/select_images_for_testing.py +55 -0
megadetector/classification/__init__.py +0 -0
megadetector/classification/aggregate_classifier_probs.py +108 -0
megadetector/classification/analyze_failed_images.py +227 -0
megadetector/classification/cache_batchapi_outputs.py +198 -0
megadetector/classification/create_classification_dataset.py +626 -0
megadetector/classification/crop_detections.py +516 -0
megadetector/classification/csv_to_json.py +226 -0
megadetector/classification/detect_and_crop.py +853 -0
megadetector/classification/efficientnet/__init__.py +9 -0
megadetector/classification/efficientnet/model.py +415 -0
megadetector/classification/efficientnet/utils.py +608 -0
megadetector/classification/evaluate_model.py +520 -0
megadetector/classification/identify_mislabeled_candidates.py +152 -0
megadetector/classification/json_to_azcopy_list.py +63 -0
megadetector/classification/json_validator.py +696 -0
megadetector/classification/map_classification_categories.py +276 -0
megadetector/classification/merge_classification_detection_output.py +509 -0
megadetector/classification/prepare_classification_script.py +194 -0
megadetector/classification/prepare_classification_script_mc.py +228 -0
megadetector/classification/run_classifier.py +287 -0
megadetector/classification/save_mislabeled.py +110 -0
megadetector/classification/train_classifier.py +827 -0
megadetector/classification/train_classifier_tf.py +725 -0
megadetector/classification/train_utils.py +323 -0
megadetector/data_management/__init__.py +0 -0
megadetector/data_management/animl_to_md.py +161 -0
megadetector/data_management/annotations/__init__.py +0 -0
megadetector/data_management/annotations/annotation_constants.py +33 -0
megadetector/data_management/camtrap_dp_to_coco.py +270 -0
megadetector/data_management/cct_json_utils.py +566 -0
megadetector/data_management/cct_to_md.py +184 -0
megadetector/data_management/cct_to_wi.py +293 -0
megadetector/data_management/coco_to_labelme.py +284 -0
megadetector/data_management/coco_to_yolo.py +702 -0
megadetector/data_management/databases/__init__.py +0 -0
megadetector/data_management/databases/add_width_and_height_to_db.py +107 -0
megadetector/data_management/databases/combine_coco_camera_traps_files.py +210 -0
megadetector/data_management/databases/integrity_check_json_db.py +528 -0
megadetector/data_management/databases/subset_json_db.py +195 -0
megadetector/data_management/generate_crops_from_cct.py +200 -0
megadetector/data_management/get_image_sizes.py +164 -0
megadetector/data_management/labelme_to_coco.py +559 -0
megadetector/data_management/labelme_to_yolo.py +349 -0
megadetector/data_management/lila/__init__.py +0 -0
megadetector/data_management/lila/create_lila_blank_set.py +556 -0
megadetector/data_management/lila/create_lila_test_set.py +187 -0
megadetector/data_management/lila/create_links_to_md_results_files.py +106 -0
megadetector/data_management/lila/download_lila_subset.py +182 -0
megadetector/data_management/lila/generate_lila_per_image_labels.py +777 -0
megadetector/data_management/lila/get_lila_annotation_counts.py +174 -0
megadetector/data_management/lila/get_lila_image_counts.py +112 -0
megadetector/data_management/lila/lila_common.py +319 -0
megadetector/data_management/lila/test_lila_metadata_urls.py +164 -0
megadetector/data_management/mewc_to_md.py +344 -0
megadetector/data_management/ocr_tools.py +873 -0
megadetector/data_management/read_exif.py +964 -0
megadetector/data_management/remap_coco_categories.py +195 -0
megadetector/data_management/remove_exif.py +156 -0
megadetector/data_management/rename_images.py +194 -0
megadetector/data_management/resize_coco_dataset.py +663 -0
megadetector/data_management/speciesnet_to_md.py +41 -0
megadetector/data_management/wi_download_csv_to_coco.py +247 -0
megadetector/data_management/yolo_output_to_md_output.py +594 -0
megadetector/data_management/yolo_to_coco.py +876 -0
megadetector/data_management/zamba_to_md.py +188 -0
megadetector/detection/__init__.py +0 -0
megadetector/detection/change_detection.py +840 -0
megadetector/detection/process_video.py +479 -0
megadetector/detection/pytorch_detector.py +1451 -0
megadetector/detection/run_detector.py +1267 -0
megadetector/detection/run_detector_batch.py +2159 -0
megadetector/detection/run_inference_with_yolov5_val.py +1314 -0
megadetector/detection/run_md_and_speciesnet.py +1494 -0
megadetector/detection/run_tiled_inference.py +1038 -0
megadetector/detection/tf_detector.py +209 -0
megadetector/detection/video_utils.py +1379 -0
megadetector/postprocessing/__init__.py +0 -0
megadetector/postprocessing/add_max_conf.py +72 -0
megadetector/postprocessing/categorize_detections_by_size.py +166 -0
megadetector/postprocessing/classification_postprocessing.py +1752 -0
megadetector/postprocessing/combine_batch_outputs.py +249 -0
megadetector/postprocessing/compare_batch_results.py +2110 -0
megadetector/postprocessing/convert_output_format.py +403 -0
megadetector/postprocessing/create_crop_folder.py +629 -0
megadetector/postprocessing/detector_calibration.py +570 -0
megadetector/postprocessing/generate_csv_report.py +522 -0
megadetector/postprocessing/load_api_results.py +223 -0
megadetector/postprocessing/md_to_coco.py +428 -0
megadetector/postprocessing/md_to_labelme.py +351 -0
megadetector/postprocessing/md_to_wi.py +41 -0
megadetector/postprocessing/merge_detections.py +392 -0
megadetector/postprocessing/postprocess_batch_results.py +2077 -0
megadetector/postprocessing/remap_detection_categories.py +226 -0
megadetector/postprocessing/render_detection_confusion_matrix.py +677 -0
megadetector/postprocessing/repeat_detection_elimination/find_repeat_detections.py +206 -0
megadetector/postprocessing/repeat_detection_elimination/remove_repeat_detections.py +82 -0
megadetector/postprocessing/repeat_detection_elimination/repeat_detections_core.py +1665 -0
megadetector/postprocessing/separate_detections_into_folders.py +795 -0
megadetector/postprocessing/subset_json_detector_output.py +964 -0
megadetector/postprocessing/top_folders_to_bottom.py +238 -0
megadetector/postprocessing/validate_batch_results.py +332 -0
megadetector/taxonomy_mapping/__init__.py +0 -0
megadetector/taxonomy_mapping/map_lila_taxonomy_to_wi_taxonomy.py +491 -0
megadetector/taxonomy_mapping/map_new_lila_datasets.py +213 -0
megadetector/taxonomy_mapping/prepare_lila_taxonomy_release.py +165 -0
megadetector/taxonomy_mapping/preview_lila_taxonomy.py +543 -0
megadetector/taxonomy_mapping/retrieve_sample_image.py +71 -0
megadetector/taxonomy_mapping/simple_image_download.py +224 -0
megadetector/taxonomy_mapping/species_lookup.py +1008 -0
megadetector/taxonomy_mapping/taxonomy_csv_checker.py +159 -0
megadetector/taxonomy_mapping/taxonomy_graph.py +346 -0
megadetector/taxonomy_mapping/validate_lila_category_mappings.py +83 -0
megadetector/tests/__init__.py +0 -0
megadetector/tests/test_nms_synthetic.py +335 -0
megadetector/utils/__init__.py +0 -0
megadetector/utils/ct_utils.py +1857 -0
megadetector/utils/directory_listing.py +199 -0
megadetector/utils/extract_frames_from_video.py +307 -0
megadetector/utils/gpu_test.py +125 -0
megadetector/utils/md_tests.py +2072 -0
megadetector/utils/path_utils.py +2832 -0
megadetector/utils/process_utils.py +172 -0
megadetector/utils/split_locations_into_train_val.py +237 -0
megadetector/utils/string_utils.py +234 -0
megadetector/utils/url_utils.py +825 -0
megadetector/utils/wi_platform_utils.py +968 -0
megadetector/utils/wi_taxonomy_utils.py +1759 -0
megadetector/utils/write_html_image_list.py +239 -0
megadetector/visualization/__init__.py +0 -0
megadetector/visualization/plot_utils.py +309 -0
megadetector/visualization/render_images_with_thumbnails.py +243 -0
megadetector/visualization/visualization_utils.py +1940 -0
megadetector/visualization/visualize_db.py +630 -0
megadetector/visualization/visualize_detector_output.py +479 -0
megadetector/visualization/visualize_video_output.py +705 -0
megadetector-10.0.13.dist-info/METADATA +134 -0
megadetector-10.0.13.dist-info/RECORD +147 -0
megadetector-10.0.13.dist-info/WHEEL +5 -0
megadetector-10.0.13.dist-info/licenses/LICENSE +19 -0
megadetector-10.0.13.dist-info/top_level.txt +1 -0

megadetector/postprocessing/combine_batch_outputs.py ADDED Viewed

@@ -0,0 +1,249 @@
+"""
+combine_batch_outputs.py
+Merges two or more .json files in MD output format, optionally
+writing the results to another .json file.
+* Concatenates image lists, erroring if images are not unique.
+* Errors if class lists are conflicting; errors on unrecognized fields.
+* Checks compatibility in info structs, within reason.
+File format:
+https://github.com/agentmorris/MegaDetector/tree/main/megadetector/api/batch_processing#batch-processing-api-output-format
+Command-line use:
+combine_batch_outputs input1.json input2.json ... inputN.json output.json
+This does no checking for redundancy; if you are looking to ensemble
+the results of multiple model versions, see merge_detections.py.
+"""
+#%% Constants and imports
+import argparse
+import sys
+import json
+from megadetector.utils import ct_utils
+#%% Merge functions
+def combine_batch_output_files(input_files,
+                               output_file=None,
+                               require_uniqueness=True,
+                               verbose=True):
+    """
+    Merges the list of MD results files [input_files] into a single
+    dictionary, optionally writing the result to [output_file].
+    Always overwrites [output_file] if it exists.
+    Args:
+        input_files (list of str): paths to JSON detection files
+        output_file (str, optional): path to write merged JSON
+        require_uniqueness (bool, optional): whether to require that the images in
+            each list of images be unique
+        verbose (bool, optional): enable additional debug output
+    Returns:
+        dict: merged dictionaries loaded from [input_files], identical to what's
+        written to [output_file] if [output_file] is not None
+    """
+    def print_if_verbose(s):
+        if verbose:
+            print(s)
+    input_dicts = []
+    for fn in input_files:
+        print_if_verbose('Loading results from {}'.format(fn))
+        with open(fn, 'r', encoding='utf-8') as f:
+            input_dicts.append(json.load(f))
+    print_if_verbose('Merging results')
+    merged_dict = combine_batch_output_dictionaries(
+        input_dicts, require_uniqueness=require_uniqueness)
+    print_if_verbose('Writing output to {}'.format(output_file))
+    if output_file is not None:
+        ct_utils.write_json(output_file, merged_dict)
+    return merged_dict
+def combine_batch_output_dictionaries(input_dicts, require_uniqueness=True):
+    """
+    Merges the list of MD results dictionaries [input_dicts] into a single dict.
+    See module header comment for details on merge rules.
+    Args:
+        input_dicts (list of dicts): list of dicts in which each dict represents the
+            contents of a MD output file
+        require_uniqueness (bool, optional): whether to require that the images in
+            each input dict be unique; if this is True and image filenames are
+            not unique, an error is raised.
+    Returns:
+        dict: merged MD results
+    """
+    # Map image filenames to detections, we'll convert to a list later
+    images = {}
+    info = {}
+    detection_categories = {}
+    classification_categories = {}
+    n_redundant_images = 0
+    n_images = 0
+    known_fields = ['info', 'detection_categories', 'classification_categories',
+                    'images']
+    for input_dict in input_dicts:
+        for k in input_dict:
+            if k not in known_fields:
+                print(f'Warning: unrecognized batch output field: {k}')
+        # Check compatibility of detection categories
+        for cat_id in input_dict['detection_categories']:
+            cat_name = input_dict['detection_categories'][cat_id]
+            if cat_id in detection_categories:
+                assert detection_categories[cat_id] == cat_name, (
+                    'Detection category mismatch')
+            else:
+                detection_categories[cat_id] = cat_name
+        # Check compatibility of classification categories
+        if 'classification_categories' in input_dict:
+            for cat_id in input_dict['classification_categories']:
+                cat_name = input_dict['classification_categories'][cat_id]
+                if cat_id in classification_categories:
+                    assert classification_categories[cat_id] == cat_name, (
+                        'Classification category mismatch')
+                else:
+                    classification_categories[cat_id] = cat_name
+        # Merge image lists, checking uniqueness
+        for im in input_dict['images']:
+            # Normalize path separators so we don't treat images as different if they
+            # were processed on different OS's
+            im['file'] = im['file'].replace('\\','/')
+            im_file = im['file']
+            if require_uniqueness:
+                assert im_file not in images, f'Duplicate image: {im_file}'
+                images[im_file] = im
+                n_images += 1
+            else:
+                if im_file in images:
+                    n_redundant_images += 1
+                    previous_im = images[im_file]
+                    # Replace a previous failure with a success
+                    if ('detections' in im) and ('detections' not in previous_im):
+                        images[im_file] = im
+                        print(f'Replacing previous failure for image: {im_file}')
+                else:
+                    images[im_file] = im
+                    n_images += 1
+        # Merge info dicts, don't check completion time fields
+        if len(info) == 0:
+            info = input_dict['info']
+        else:
+            info_compare = input_dict['info']
+            assert info_compare['detector'] == info['detector'], (
+                'Incompatible detection versions in merging')
+            assert info_compare['format_version'] == info['format_version'], (
+                'Incompatible batch output versions in merging')
+            if 'classifier' in info_compare:
+                if 'classifier' in info:
+                    assert info['classifier'] == info_compare['classifier']
+                else:
+                    info['classifier'] = info_compare['classifier']
+    # ...for each dictionary
+    if n_redundant_images > 0:
+        print(f'Warning: found {n_redundant_images} redundant images '
+              f'(out of {n_images} total) during merge')
+    # Convert merged image dictionaries to a sorted list
+    sorted_images = sorted(images.values(), key=lambda im: im['file'])
+    merged_dict = {'info': info,
+                   'detection_categories': detection_categories,
+                   'classification_categories': classification_categories,
+                   'images': sorted_images}
+    return merged_dict
+# ...combine_batch_output_files()
+def combine_api_shard_files(input_files, output_file=None):
+    """
+    Merges the list of .json-formatted API shard files [input_files] into a single
+    list of dictionaries, optionally writing the result to [output_file].
+    This operates on mostly-deprecated API shard files, not MegaDetector results files.
+    If you don't know what an API shard file is, you don't want this function.
+    Args:
+        input_files (list of str): files to merge
+        output_file (str, optional): file to which we should write merged results
+    Returns:
+        dict: merged results
+    :meta private:
+    """
+    input_lists = []
+    print('Loading input files')
+    for fn in input_files:
+        with open(fn,'r') as f:
+            input_lists.append(json.load(f))
+    detections = []
+    # detection_list = input_lists[0]
+    for detection_list in input_lists:
+        assert isinstance(detection_list, list)
+        # d = detection_list[0]
+        for d in detection_list:
+            assert 'file' in d
+            assert 'max_detection_conf' in d
+            assert 'detections' in d
+            detections.append(d)
+    print('Writing output')
+    if output_file is not None:
+        ct_utils.write_json(output_file, detections)
+    return detections
+# ...combine_api_shard_files()
+#%% Command-line driver
+def main(): # noqa
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        'input_paths', nargs='+',
+        help='List of input .json files')
+    parser.add_argument(
+        'output_path',
+        help='Output .json file')
+    if len(sys.argv[1:]) == 0:
+        parser.print_help()
+        parser.exit()
+    args = parser.parse_args()
+    combine_batch_output_files(args.input_paths, args.output_path)
+if __name__ == '__main__':
+    main()