PyPI - dataeval - Versions diffs - 0.86.8__py3-none-any.whl → 0.86.9__py3-none-any.whl - Mend

dataeval 0.86.8py3-none-any.whl → 0.86.9py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (13) hide show

dataeval/_version.py +2 -2
dataeval/utils/datasets/__init__.py +2 -0
dataeval/utils/datasets/_antiuav.py +1 -1
dataeval/utils/datasets/_base.py +12 -8
dataeval/utils/datasets/_fileio.py +3 -3
dataeval/utils/datasets/_milco.py +1 -1
dataeval/utils/datasets/_seadrone.py +512 -0
dataeval/utils/datasets/_voc.py +3 -3
dataeval/workflows/sufficiency.py +53 -10
{dataeval-0.86.8.dist-info → dataeval-0.86.9.dist-info}/METADATA +1 -1
{dataeval-0.86.8.dist-info → dataeval-0.86.9.dist-info}/RECORD +13 -12
{dataeval-0.86.8.dist-info → dataeval-0.86.9.dist-info}/WHEEL +0 -0
{dataeval-0.86.8.dist-info → dataeval-0.86.9.dist-info}/licenses/LICENSE.txt +0 -0

dataeval/utils/datasets/_voc.py CHANGED Viewed

@@ -51,7 +51,7 @@ VOCClassStringMap = Literal[
 TVOCClassMap = TypeVar("TVOCClassMap", VOCClassStringMap, int, list[VOCClassStringMap], list[int])
-class BaseVOCDataset(BaseDataset[_TArray, _TTarget, list[str]]):
+class BaseVOCDataset(BaseDataset[_TArray, _TTarget, list[str], str]):
     _resources = [
         DataLocation(
             url="https://data.brainchip.com/dataset-mirror/voc/VOCtrainval_11-May-2012.tar",
@@ -412,7 +412,7 @@ class BaseVOCDataset(BaseDataset[_TArray, _TTarget, list[str]]):
 class VOCDetection(
     BaseVOCDataset[NDArray[Any], ObjectDetectionTarget[NDArray[Any]]],
-    BaseODDataset[NDArray[Any]],
+    BaseODDataset[NDArray[Any], list[str], str],
     BaseDatasetNumpyMixin,
 ):
     """
@@ -467,7 +467,7 @@ class VOCDetection(
 class VOCDetectionTorch(
     BaseVOCDataset[torch.Tensor, ObjectDetectionTarget[torch.Tensor]],
-    BaseODDataset[torch.Tensor],
+    BaseODDataset[torch.Tensor, list[str], str],
     BaseDatasetTorchMixin,
 ):
     """

dataeval/workflows/sufficiency.py CHANGED Viewed

@@ -57,22 +57,29 @@ class Sufficiency(Generic[T]):
     test_ds : torch.Dataset
         Data that will be used for every run's evaluation
     train_fn : Callable[[nn.Module, Dataset, Sequence[int]], None]
-        Function which takes a model (torch.nn.Module), a dataset
-        (torch.utils.data.Dataset), indices to train on and executes model
+        Function which takes a model, a dataset, and indices to train on and then executes model
         training against the data.
     eval_fn : Callable[[nn.Module, Dataset], Mapping[str, float | ArrayLike]]
-        Function which takes a model (torch.nn.Module), a dataset
-        (torch.utils.data.Dataset) and returns a dictionary of metric
-        values (Mapping[str, float]) which is used to assess model performance
+        Function which takes a model, a dataset and returns a dictionary of metric
+        values which is used to assess model performance
         given the model and data.
     runs : int, default 1
-        Number of models to run over all subsets
+        Number of models to train over the entire dataset.
     substeps : int, default 5
-        Total number of dataset partitions that each model will train on
+        The number of steps that each model will be trained and evaluated on.
     train_kwargs : Mapping | None, default None
         Additional arguments required for custom training function
     eval_kwargs : Mapping | None, default None
         Additional arguments required for custom evaluation function
+    Warning
+    -------
+    Since each run is trained sequentially, increasing the parameter `runs` can significantly increase runtime.
+    Note
+    ----
+    Substeps is overridden by the parameter `eval_at` in :meth:`.Sufficiency.evaluate`
     """
     def __init__(
@@ -159,13 +166,22 @@ class Sufficiency(Generic[T]):
     @set_metadata(state=["runs", "substeps"])
     def evaluate(self, eval_at: int | Iterable[int] | None = None) -> SufficiencyOutput:
         """
-        Creates data indices, trains models, and returns plotting data
+        Train and evaluate a model over multiple substeps
+        This function trains a model up to each step calculated from substeps. The model is then evaluated
+        at that step and trained from 0 to the next step. This repeats for all substeps. Once a model has been
+        trained and evaluated at all substeps, if runs is greater than one, the model weights are reset and
+        the process is repeated.
+        During each evaluation, the metrics returned as a dictionary by the given evaluation function are stored
+        and then averaged over when all runs are complete.
         Parameters
         ----------
         eval_at : int | Iterable[int] | None, default None
-            Specify this to collect accuracies over a specific set of dataset lengths, rather
-            than letting :term:`sufficiency<Sufficiency>` internally create the lengths to evaluate at.
+            Specify this to collect metrics over a specific set of dataset lengths.
+            If `None`, evaluates at each step is calculated by
+            `np.geomspace` over the length of the dataset for self.substeps
         Returns
         -------
@@ -179,6 +195,8 @@ class Sufficiency(Generic[T]):
         Examples
         --------
+        Default runs and substeps
         >>> suff = Sufficiency(
         ...     model=model,
         ...     train_ds=train_ds,
@@ -190,6 +208,31 @@ class Sufficiency(Generic[T]):
         ... )
         >>> suff.evaluate()
         SufficiencyOutput(steps=array([  1,   3,  10,  31, 100], dtype=uint32), measures={'test': array([1., 1., 1., 1., 1.])}, n_iter=1000)
+        Evaluate at a single value
+        >>> suff = Sufficiency(
+        ...     model=model,
+        ...     train_ds=train_ds,
+        ...     test_ds=test_ds,
+        ...     train_fn=train_fn,
+        ...     eval_fn=eval_fn,
+        ... )
+        >>> suff.evaluate(eval_at=50)
+        SufficiencyOutput(steps=array([50]), measures={'test': array([1.])}, n_iter=1000)
+        Evaluating at linear steps from 0-100 inclusive
+        >>> suff = Sufficiency(
+        ...     model=model,
+        ...     train_ds=train_ds,
+        ...     test_ds=test_ds,
+        ...     train_fn=train_fn,
+        ...     eval_fn=eval_fn,
+        ... )
+        >>> suff.evaluate(eval_at=np.arange(0, 101, 20))
+        SufficiencyOutput(steps=array([  0,  20,  40,  60,  80, 100]), measures={'test': array([1., 1., 1., 1., 1., 1.])}, n_iter=1000)
         """  # noqa: E501
         if eval_at is not None:
             ranges = np.asarray(list(eval_at) if isinstance(eval_at, Iterable) else [eval_at])

{dataeval-0.86.8.dist-info → dataeval-0.86.9.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: dataeval
-Version: 0.86.8
+Version: 0.86.9
 Summary: DataEval provides a simple interface to characterize image data and its impact on model performance across classification and object-detection tasks
 Project-URL: Homepage, https://dataeval.ai/
 Project-URL: Repository, https://github.com/aria-ml/dataeval/

{dataeval-0.86.8.dist-info → dataeval-0.86.9.dist-info}/RECORD RENAMED Viewed

@@ -1,6 +1,6 @@
 dataeval/__init__.py,sha256=dEDltdHOnbk4-XAbQwJLOZtCbRLZsDMnptWRwbF2r54,1773
 dataeval/_log.py,sha256=C7AGkIRzymvYJ0LQXtnShiy3i5Xrp8T58JzIHHguk_Q,365
-dataeval/_version.py,sha256=IPUOExUy8nF4kYGtCPV5bg6_IYDRLVOKnFJcNllcO1M,513
+dataeval/_version.py,sha256=NKlNIBKyuGsE6TJjC6ieMwWJh-T6f3KPhk_0sXgjByQ,513
 dataeval/config.py,sha256=g3Np0Q3J5Rzij6Gsz7tJh7eOxgwNPf6NsFYmAR8Atfs,4219
 dataeval/py.typed,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 dataeval/typing.py,sha256=W8rqFFkAqE5a5ar3MmB-O5gcMJqvoDKXC8Y0ggBqAKo,7216
@@ -89,17 +89,18 @@ dataeval/utils/data/__init__.py,sha256=xGzrjrOxOP2DP1tU84AWMKPnSxFvSjM81CTlDg4rN
 dataeval/utils/data/_dataset.py,sha256=tC_vqgWnmojAoAANo5BUVfEUYXl7GzOBSeYjR9olbDk,9506
 dataeval/utils/data/collate.py,sha256=5egEEKhNNCGeNLChO1p6dZ4Wg6x51VEaMNHz7hEZUxI,3936
 dataeval/utils/data/metadata.py,sha256=L1c2bCiMj0aR0QCoKkjwBujIftJDEMgW_3ZbgeS8WHo,14703
-dataeval/utils/datasets/__init__.py,sha256=pAXqHX76yAoBI8XB3m6zGuW-u3s3PCoIXG5GDzxH7Zs,572
-dataeval/utils/datasets/_antiuav.py,sha256=kA_ia1fYNcJiz9SpCvh-Z8iSc7iJrdogjBI3soyaa7A,8304
-dataeval/utils/datasets/_base.py,sha256=pyfpJda3ku469M3TFRsJn9S2oAiQODOGTlLcdcoEW9U,9031
+dataeval/utils/datasets/__init__.py,sha256=8sEQwOixx9OMkwaU0u9Hl2Cdcb5095tJzz5dgqgdNKc,643
+dataeval/utils/datasets/_antiuav.py,sha256=CvqFIBEu8X1MmKzyUBTw1uzog2DWppiJ6ZynVNp8mv0,8320
+dataeval/utils/datasets/_base.py,sha256=hMVza1lN9yhLVLSR7ucw1cQKn3s8UGdq74NV8MN6ZYo,9285
 dataeval/utils/datasets/_cifar10.py,sha256=hZc_A30yKYBbv2kvVdEkZ9egyEe6XBUnmksoIAoJ-5Y,8265
-dataeval/utils/datasets/_fileio.py,sha256=LEoFVNdryRdi7mKpWw-9D8lA6XMa-Jaszd85bv93POo,5454
-dataeval/utils/datasets/_milco.py,sha256=iXf4C1I3Eg_3gHKUe4XPi21yFMBO51zxTIqAkGf9bYg,7869
+dataeval/utils/datasets/_fileio.py,sha256=hMxGm-OnsDMj8_xbbHgv9YSxpqm_8NXWQrj53rDg-nQ,5451
+dataeval/utils/datasets/_milco.py,sha256=yWAqH-Dxe2ZYWG8dW89j4SQHh8O_Ys90LurGKFYfSU4,7885
 dataeval/utils/datasets/_mixin.py,sha256=S8iii-SoYUsFFYNXjw2thlZkpBvRLnZ4XI8wTqOKXgU,1729
 dataeval/utils/datasets/_mnist.py,sha256=uz46sE1Go3TgGjG6x2cXckSVQ0mSg2mhgk8BUvLWjb0,8149
+dataeval/utils/datasets/_seadrone.py,sha256=daRjeRNaa5CPhwr1nelbTXaJrF5H6nUbz4scH3gCl8g,270979
 dataeval/utils/datasets/_ships.py,sha256=6U04HAoM3jgLl1qv-NnxjZeSsBipcqWJBMhBMn5iIUY,5115
 dataeval/utils/datasets/_types.py,sha256=iSKyHXRlGuomXs0FHK6md8lXLQrQQ4fxgVOwr4o81bo,1089
-dataeval/utils/datasets/_voc.py,sha256=pafY112O80isYkrdy7Quie9SBm_TmYhREuyl8SxtsR0,24586
+dataeval/utils/datasets/_voc.py,sha256=P11jLIMo87_f8xBLWCMAX1-lA5OGCowmfWpVxpQJFEc,24623
 dataeval/utils/torch/__init__.py,sha256=dn5mjCrFp0b1aL_UEURhONU0Ag0cmXoTOBSGagpkTiA,325
 dataeval/utils/torch/_blocks.py,sha256=HVhBTMMD5NA4qheMUgyol1KWiKZDIuc8k5j4RcMKmhk,1466
 dataeval/utils/torch/_gmm.py,sha256=XM68GNEP97EjaB1U49-ZXRb81d0CEFnPS910alrcB3g,3740
@@ -107,8 +108,8 @@ dataeval/utils/torch/_internal.py,sha256=9rzlMeM8i3p-ctulh9WDQATMXtlp-Jk2pBX7NGC
 dataeval/utils/torch/models.py,sha256=1idpXyjrYcCBSsbxxRUOto8xr4MJNjDEqQHiIXVU5Zc,9700
 dataeval/utils/torch/trainer.py,sha256=DRyPScGdE4o5Xo3BmD9p2PGOApzi1E-QfsBRNZ5IXW8,5544
 dataeval/workflows/__init__.py,sha256=ou8y0KO-d6W5lgmcyLjKlf-J_ckP3vilW7wHkgiDlZ4,255
-dataeval/workflows/sufficiency.py,sha256=j-R8dg4XE6a66p_oTXG2GNzgg3vGk85CTblxhFXaxog,8513
-dataeval-0.86.8.dist-info/METADATA,sha256=rCf58-uzgjsTNZkY3LOBMSi5fhQ2cdAtnrrDI_eYR_I,5925
-dataeval-0.86.8.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
-dataeval-0.86.8.dist-info/licenses/LICENSE.txt,sha256=uAooygKWvX6NbU9Ran9oG2msttoG8aeTeHSTe5JeCnY,1061
-dataeval-0.86.8.dist-info/RECORD,,
+dataeval/workflows/sufficiency.py,sha256=UAPjowFrmM6IJJaOk9GkH3nfQTyDy2_zOY55o2g3G1M,10072
+dataeval-0.86.9.dist-info/METADATA,sha256=qUho4Ureh4Pfo91py79pNNUK5yu0x0c6K8R29Al5yQ4,5925
+dataeval-0.86.9.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
+dataeval-0.86.9.dist-info/licenses/LICENSE.txt,sha256=uAooygKWvX6NbU9Ran9oG2msttoG8aeTeHSTe5JeCnY,1061
+dataeval-0.86.9.dist-info/RECORD,,

{dataeval-0.86.8.dist-info → dataeval-0.86.9.dist-info}/WHEEL RENAMED Viewed

File without changes

{dataeval-0.86.8.dist-info → dataeval-0.86.9.dist-info}/licenses/LICENSE.txt RENAMED Viewed

File without changes

dataeval 0.86.8__py3-none-any.whl → 0.86.9__py3-none-any.whl

dataeval 0.86.8py3-none-any.whl → 0.86.9py3-none-any.whl