PyPI - dataeval - Versions diffs - 1.0.1__tar.gz → 1.0.2__tar.gz - Mend

dataeval 1.0.1tar.gz → 1.0.2tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (110) hide show

{dataeval-1.0.1 → dataeval-1.0.2}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: dataeval
-Version: 1.0.1
+Version: 1.0.2
 Summary: DataEval provides a simple interface to characterize image data and its impact on model performance across classification and object-detection tasks
 Project-URL: Homepage, https://dataeval.ai/
 Project-URL: Repository, https://github.com/aria-ml/dataeval/

{dataeval-1.0.1 → dataeval-1.0.2}/pyproject.toml RENAMED Viewed

@@ -103,7 +103,7 @@ docs = [
   "jinja2>=3.1.6",
   "jupyter-client>=8.6.0",
   "jupyter-cache>=1.0",
-  "maite-datasets>=0.0.10",
+  "maite-datasets>=0.0.12",
   "myst-nb>=1.0",
   "opencv-python-headless>=4.8.0",
   "plotly>=6.2.0",

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/_metadata.py RENAMED Viewed

@@ -1311,7 +1311,13 @@ class Metadata(Array, FeatureExtractor):
                 n_classes,
             )
-        index2label = self._dataset.metadata.get("index2label", {i: str(i) for i in np.unique(labels)})
+        unique_labels = np.unique(labels) if len(labels) else np.array([], dtype=np.intp)
+        provided_i2l = self._dataset.metadata.get("index2label", None)
+        if provided_i2l is not None:
+            # Ensure every observed label has a name; use fallback for unmapped labels
+            index2label = {int(lbl): provided_i2l.get(int(lbl), f"UNDEFINED_CLASS_{int(lbl)}") for lbl in unique_labels}
+        else:
+            index2label = {int(lbl): str(int(lbl)) for lbl in unique_labels}
         target_idx = self._compute_target_indices(srcidx, datum_count, bool(self._has_targets))
         reserved = ["item_index", "target_index", "class_label", "score", "box"]
         target_factor_dict = {}

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/_version.py RENAMED Viewed

@@ -28,7 +28,7 @@ version_tuple: VERSION_TUPLE
 commit_id: COMMIT_ID
 __commit_id__: COMMIT_ID
-__version__ = version = '1.0.1'
-__version_tuple__ = version_tuple = (1, 0, 1)
+__version__ = version = '1.0.2'
+__version_tuple__ = version_tuple = (1, 0, 2)
 __commit_id__ = commit_id = None

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_compute_stats.py RENAMED Viewed

@@ -351,6 +351,11 @@ def compute_stats(
     """
     Compute specified statistics on a set of images, optionally within bounding boxes.
+    Mixed-bit-depth datasets can produce misleading statistics when raw pixel values are
+    compared directly. To avoid this, pixel values are normalized to [0, 1] based on each
+    image's bit depth before any statistic is computed, keeping results meaningful and
+    comparable across 8-bit, 16-bit, 32-bit, and other precision images.
     Parameters
     ----------
     data : Iterable[ArrayLike] | Dataset[ArrayLike] | Dataset[tuple[ArrayLike, Any, Any]]

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_parity.py RENAMED Viewed

@@ -116,6 +116,7 @@ def parity(
     chi_scores = np.zeros(factor_data_np.shape[1])
     p_values = np.zeros_like(chi_scores)
     insufficient_ddict: defaultdict[int, defaultdict[int, dict[int, int]]] = defaultdict(lambda: defaultdict(dict))
+    unique_class_labels = np.unique(class_labels_np)
     for i, col_data in enumerate(factor_data_np.T):
         # Builds a contingency matrix where entry at index (r,c) represents
@@ -132,7 +133,8 @@ def parity(
             if contingency_matrix[int_factor, int_class] > 0:
                 factor_category = unique_factor_values[int_factor].item()
                 class_count = contingency_matrix[int_factor, int_class].item()
-                insufficient_ddict[i][factor_category][int_class] = class_count
+                class_label = int(unique_class_labels[int_class])
+                insufficient_ddict[i][factor_category][class_label] = class_count
         # This deletes rows containing only zeros,
         # because scipy.stats.chi2_contingency fails when there are rows containing only zeros.

{dataeval-1.0.1 → dataeval-1.0.2}/.gitignore RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/LICENSE RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/README.md RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/_embeddings.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/_experimental.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/_helpers.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/_log.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/_warm_cache.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/bias/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/bias/_balance.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/bias/_diversity.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/bias/_parity.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/config.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_ber.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_bin.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_calculators/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_calculators/_base.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_calculators/_cache.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_calculators/_dimensionstats.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_calculators/_hashstats.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_calculators/_pixelstats.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_calculators/_register.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_calculators/_registry.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_calculators/_visualstats.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_clusterer.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_completeness.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_compute_ratios.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_coverage.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_divergence.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_diversity.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_fast_hdbscan/_cluster_trees.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_fast_hdbscan/_disjoint_set.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_fast_hdbscan/_mst.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_feature_distance.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_hash.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_label_errors.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_label_parity.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_label_stats.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_metadata_insights.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_mst.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_mutual_info.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_nullmodel.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_rank.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/core/_uap.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/exceptions.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/extractors/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/extractors/_bovw.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/extractors/_flatten.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/extractors/_onnx.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/extractors/_torch.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/extractors/_uncertainty.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/flags.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/performance/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/performance/_aggregator.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/performance/_output.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/performance/_sufficiency.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/performance/schedules.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/protocols.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/py.typed RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/quality/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/quality/_duplicates.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/quality/_outliers.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/quality/_shared.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/scope/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/scope/_prioritize.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/selection/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/selection/_classbalance.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/selection/_classfilter.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/selection/_indices.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/selection/_limit.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/selection/_reverse.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/selection/_select.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/selection/_shuffle.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_drift/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_drift/_base.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_drift/_chunk.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_drift/_domain_classifier.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_drift/_kneighbors.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_drift/_mmd.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_drift/_reconstruction.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_drift/_univariate.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_ood/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_ood/_base.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_ood/_domain_classifier.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_ood/_kneighbors.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_ood/_reconstruction.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_shared/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_shared/_domain_classifier.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_shared/_kneighbors.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/_shared/_reconstruction.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/shift/update_strategies.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/types.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/utils/__init__.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/utils/_internal.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/utils/data.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/utils/losses.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/utils/models.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/utils/onnx.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/utils/preprocessing.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/utils/thresholds.py RENAMED Viewed

File without changes

{dataeval-1.0.1 → dataeval-1.0.2}/src/dataeval/utils/training.py RENAMED Viewed

File without changes

dataeval 1.0.1__tar.gz → 1.0.2__tar.gz

dataeval 1.0.1tar.gz → 1.0.2tar.gz