PyPI - validmind - Versions diffs - 2.5.25__py3-none-any.whl → 2.6.8__py3-none-any.whl - Mend

validmind 2.5.25py3-none-any.whl → 2.6.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (198) hide show

validmind/__init__.py +8 -17
validmind/__version__.py +1 -1
validmind/ai/test_descriptions.py +66 -85
validmind/ai/test_result_description/context.py +2 -2
validmind/ai/utils.py +26 -1
validmind/api_client.py +43 -79
validmind/client.py +5 -7
validmind/client_config.py +1 -1
validmind/datasets/__init__.py +1 -1
validmind/datasets/classification/customer_churn.py +7 -5
validmind/datasets/nlp/__init__.py +2 -2
validmind/errors.py +6 -10
validmind/html_templates/content_blocks.py +18 -16
validmind/logging.py +21 -16
validmind/tests/__init__.py +28 -5
validmind/tests/__types__.py +186 -170
validmind/tests/_store.py +7 -21
validmind/tests/comparison.py +362 -0
validmind/tests/data_validation/ACFandPACFPlot.py +44 -73
validmind/tests/data_validation/ADF.py +49 -83
validmind/tests/data_validation/AutoAR.py +59 -96
validmind/tests/data_validation/AutoMA.py +59 -96
validmind/tests/data_validation/AutoStationarity.py +66 -114
validmind/tests/data_validation/ClassImbalance.py +48 -117
validmind/tests/data_validation/DatasetDescription.py +180 -209
validmind/tests/data_validation/DatasetSplit.py +50 -75
validmind/tests/data_validation/DescriptiveStatistics.py +59 -85
validmind/tests/data_validation/{DFGLSArch.py → DickeyFullerGLS.py} +44 -76
validmind/tests/data_validation/Duplicates.py +21 -90
validmind/tests/data_validation/EngleGrangerCoint.py +53 -75
validmind/tests/data_validation/HighCardinality.py +32 -80
validmind/tests/data_validation/HighPearsonCorrelation.py +29 -97
validmind/tests/data_validation/IQROutliersBarPlot.py +63 -94
validmind/tests/data_validation/IQROutliersTable.py +40 -80
validmind/tests/data_validation/IsolationForestOutliers.py +41 -63
validmind/tests/data_validation/KPSS.py +33 -81
validmind/tests/data_validation/LaggedCorrelationHeatmap.py +47 -95
validmind/tests/data_validation/MissingValues.py +17 -58
validmind/tests/data_validation/MissingValuesBarPlot.py +61 -87
validmind/tests/data_validation/PhillipsPerronArch.py +56 -79
validmind/tests/data_validation/RollingStatsPlot.py +50 -81
validmind/tests/data_validation/SeasonalDecompose.py +102 -184
validmind/tests/data_validation/Skewness.py +27 -64
validmind/tests/data_validation/SpreadPlot.py +34 -57
validmind/tests/data_validation/TabularCategoricalBarPlots.py +46 -65
validmind/tests/data_validation/TabularDateTimeHistograms.py +23 -45
validmind/tests/data_validation/TabularNumericalHistograms.py +27 -46
validmind/tests/data_validation/TargetRateBarPlots.py +54 -93
validmind/tests/data_validation/TimeSeriesFrequency.py +48 -133
validmind/tests/data_validation/TimeSeriesHistogram.py +24 -3
validmind/tests/data_validation/TimeSeriesLinePlot.py +29 -47
validmind/tests/data_validation/TimeSeriesMissingValues.py +59 -135
validmind/tests/data_validation/TimeSeriesOutliers.py +54 -171
validmind/tests/data_validation/TooManyZeroValues.py +21 -70
validmind/tests/data_validation/UniqueRows.py +23 -62
validmind/tests/data_validation/WOEBinPlots.py +83 -109
validmind/tests/data_validation/WOEBinTable.py +28 -69
validmind/tests/data_validation/ZivotAndrewsArch.py +33 -75
validmind/tests/data_validation/nlp/CommonWords.py +49 -57
validmind/tests/data_validation/nlp/Hashtags.py +27 -49
validmind/tests/data_validation/nlp/LanguageDetection.py +7 -13
validmind/tests/data_validation/nlp/Mentions.py +32 -63
validmind/tests/data_validation/nlp/PolarityAndSubjectivity.py +89 -14
validmind/tests/data_validation/nlp/Punctuations.py +63 -47
validmind/tests/data_validation/nlp/Sentiment.py +4 -0
validmind/tests/data_validation/nlp/StopWords.py +62 -91
validmind/tests/data_validation/nlp/TextDescription.py +116 -159
validmind/tests/data_validation/nlp/Toxicity.py +12 -4
validmind/tests/decorator.py +33 -242
validmind/tests/load.py +212 -153
validmind/tests/model_validation/BertScore.py +13 -7
validmind/tests/model_validation/BleuScore.py +4 -0
validmind/tests/model_validation/ClusterSizeDistribution.py +24 -47
validmind/tests/model_validation/ContextualRecall.py +3 -0
validmind/tests/model_validation/FeaturesAUC.py +43 -74
validmind/tests/model_validation/MeteorScore.py +3 -0
validmind/tests/model_validation/RegardScore.py +5 -1
validmind/tests/model_validation/RegressionResidualsPlot.py +54 -75
validmind/tests/model_validation/embeddings/ClusterDistribution.py +10 -33
validmind/tests/model_validation/embeddings/CosineSimilarityDistribution.py +11 -29
validmind/tests/model_validation/embeddings/DescriptiveAnalytics.py +19 -31
validmind/tests/model_validation/embeddings/EmbeddingsVisualization2D.py +40 -49
validmind/tests/model_validation/embeddings/StabilityAnalysisKeyword.py +29 -15
validmind/tests/model_validation/embeddings/StabilityAnalysisRandomNoise.py +25 -11
validmind/tests/model_validation/embeddings/StabilityAnalysisSynonyms.py +28 -13
validmind/tests/model_validation/embeddings/StabilityAnalysisTranslation.py +67 -38
validmind/tests/model_validation/embeddings/utils.py +53 -0
validmind/tests/model_validation/ragas/AnswerCorrectness.py +37 -32
validmind/tests/model_validation/ragas/{AspectCritique.py → AspectCritic.py} +33 -27
validmind/tests/model_validation/ragas/ContextEntityRecall.py +44 -41
validmind/tests/model_validation/ragas/ContextPrecision.py +40 -35
validmind/tests/model_validation/ragas/ContextPrecisionWithoutReference.py +133 -0
validmind/tests/model_validation/ragas/ContextRecall.py +40 -35
validmind/tests/model_validation/ragas/Faithfulness.py +42 -30
validmind/tests/model_validation/ragas/NoiseSensitivity.py +59 -35
validmind/tests/model_validation/ragas/{AnswerRelevance.py → ResponseRelevancy.py} +52 -41
validmind/tests/model_validation/ragas/{AnswerSimilarity.py → SemanticSimilarity.py} +39 -34
validmind/tests/model_validation/sklearn/AdjustedMutualInformation.py +13 -16
validmind/tests/model_validation/sklearn/AdjustedRandIndex.py +13 -16
validmind/tests/model_validation/sklearn/ClassifierPerformance.py +51 -89
validmind/tests/model_validation/sklearn/ClusterCosineSimilarity.py +31 -61
validmind/tests/model_validation/sklearn/ClusterPerformanceMetrics.py +118 -83
validmind/tests/model_validation/sklearn/CompletenessScore.py +13 -16
validmind/tests/model_validation/sklearn/ConfusionMatrix.py +62 -94
validmind/tests/model_validation/sklearn/FeatureImportance.py +7 -8
validmind/tests/model_validation/sklearn/FowlkesMallowsScore.py +12 -15
validmind/tests/model_validation/sklearn/HomogeneityScore.py +12 -15
validmind/tests/model_validation/sklearn/HyperParametersTuning.py +23 -53
validmind/tests/model_validation/sklearn/KMeansClustersOptimization.py +60 -74
validmind/tests/model_validation/sklearn/MinimumAccuracy.py +16 -84
validmind/tests/model_validation/sklearn/MinimumF1Score.py +22 -72
validmind/tests/model_validation/sklearn/MinimumROCAUCScore.py +29 -78
validmind/tests/model_validation/sklearn/ModelsPerformanceComparison.py +52 -82
validmind/tests/model_validation/sklearn/OverfitDiagnosis.py +51 -145
validmind/tests/model_validation/sklearn/PermutationFeatureImportance.py +60 -78
validmind/tests/model_validation/sklearn/PopulationStabilityIndex.py +130 -172
validmind/tests/model_validation/sklearn/PrecisionRecallCurve.py +26 -55
validmind/tests/model_validation/sklearn/ROCCurve.py +43 -77
validmind/tests/model_validation/sklearn/RegressionPerformance.py +41 -94
validmind/tests/model_validation/sklearn/RobustnessDiagnosis.py +47 -136
validmind/tests/model_validation/sklearn/SHAPGlobalImportance.py +164 -208
validmind/tests/model_validation/sklearn/SilhouettePlot.py +54 -99
validmind/tests/model_validation/sklearn/TrainingTestDegradation.py +50 -124
validmind/tests/model_validation/sklearn/VMeasure.py +12 -15
validmind/tests/model_validation/sklearn/WeakspotsDiagnosis.py +225 -281
validmind/tests/model_validation/statsmodels/AutoARIMA.py +40 -45
validmind/tests/model_validation/statsmodels/KolmogorovSmirnov.py +22 -47
validmind/tests/model_validation/statsmodels/Lilliefors.py +17 -28
validmind/tests/model_validation/statsmodels/RegressionFeatureSignificance.py +37 -81
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlot.py +37 -105
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlotLevels.py +62 -166
validmind/tests/model_validation/statsmodels/RegressionModelSensitivityPlot.py +57 -119
validmind/tests/model_validation/statsmodels/RegressionModelSummary.py +20 -57
validmind/tests/model_validation/statsmodels/RegressionPermutationFeatureImportance.py +47 -80
validmind/tests/ongoing_monitoring/PredictionCorrelation.py +2 -0
validmind/tests/ongoing_monitoring/TargetPredictionDistributionPlot.py +4 -2
validmind/tests/output.py +120 -0
validmind/tests/prompt_validation/Bias.py +55 -98
validmind/tests/prompt_validation/Clarity.py +56 -99
validmind/tests/prompt_validation/Conciseness.py +63 -101
validmind/tests/prompt_validation/Delimitation.py +48 -89
validmind/tests/prompt_validation/NegativeInstruction.py +62 -96
validmind/tests/prompt_validation/Robustness.py +80 -121
validmind/tests/prompt_validation/Specificity.py +61 -95
validmind/tests/prompt_validation/ai_powered_test.py +2 -2
validmind/tests/run.py +314 -496
validmind/tests/test_providers.py +109 -79
validmind/tests/utils.py +91 -0
validmind/unit_metrics/__init__.py +16 -155
validmind/unit_metrics/classification/F1.py +1 -0
validmind/unit_metrics/classification/Precision.py +1 -0
validmind/unit_metrics/classification/ROC_AUC.py +1 -0
validmind/unit_metrics/classification/Recall.py +1 -0
validmind/unit_metrics/regression/AdjustedRSquaredScore.py +1 -0
validmind/unit_metrics/regression/GiniCoefficient.py +1 -0
validmind/unit_metrics/regression/HuberLoss.py +1 -0
validmind/unit_metrics/regression/KolmogorovSmirnovStatistic.py +1 -0
validmind/unit_metrics/regression/MeanAbsoluteError.py +1 -0
validmind/unit_metrics/regression/MeanAbsolutePercentageError.py +1 -0
validmind/unit_metrics/regression/MeanBiasDeviation.py +1 -0
validmind/unit_metrics/regression/MeanSquaredError.py +1 -0
validmind/unit_metrics/regression/QuantileLoss.py +1 -0
validmind/unit_metrics/regression/RSquaredScore.py +2 -1
validmind/unit_metrics/regression/RootMeanSquaredError.py +1 -0
validmind/utils.py +66 -17
validmind/vm_models/__init__.py +2 -17
validmind/vm_models/dataset/dataset.py +31 -4
validmind/vm_models/figure.py +7 -37
validmind/vm_models/model.py +3 -0
validmind/vm_models/result/__init__.py +7 -0
validmind/vm_models/result/result.jinja +21 -0
validmind/vm_models/result/result.py +337 -0
validmind/vm_models/result/utils.py +160 -0
validmind/vm_models/test_suite/runner.py +16 -54
validmind/vm_models/test_suite/summary.py +3 -3
validmind/vm_models/test_suite/test.py +43 -77
validmind/vm_models/test_suite/test_suite.py +8 -40
validmind-2.6.8.dist-info/METADATA +137 -0
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/RECORD +182 -189
validmind/tests/data_validation/AutoSeasonality.py +0 -190
validmind/tests/metadata.py +0 -59
validmind/tests/model_validation/embeddings/StabilityAnalysis.py +0 -176
validmind/tests/model_validation/ragas/ContextUtilization.py +0 -161
validmind/tests/model_validation/sklearn/ClusterPerformance.py +0 -80
validmind/unit_metrics/composite.py +0 -238
validmind/vm_models/test/metric.py +0 -98
validmind/vm_models/test/metric_result.py +0 -61
validmind/vm_models/test/output_template.py +0 -55
validmind/vm_models/test/result_summary.py +0 -76
validmind/vm_models/test/result_wrapper.py +0 -488
validmind/vm_models/test/test.py +0 -103
validmind/vm_models/test/threshold_test.py +0 -106
validmind/vm_models/test/threshold_test_result.py +0 -75
validmind/vm_models/test_context.py +0 -259
validmind-2.5.25.dist-info/METADATA +0 -118
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/LICENSE +0 -0
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/WHEEL +0 -0
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/entry_points.txt +0 -0

validmind/tests/decorator.py CHANGED Viewed

@@ -2,216 +2,28 @@
 # See the LICENSE file in the root of this repository for details.
 # SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
-"""Decorators for creating and registering metrics with the ValidMind framework."""
-# TODO: as we move entirely to a functional approach a lot of this logic
-# should be moved into the __init__ to replace the old class-based stuff
+"""Decorators for creating and registering tests with the ValidMind Library."""
 import inspect
 import os
-from typing import Any, Dict, List, Tuple, Union
-from uuid import uuid4
-import pandas as pd
+from functools import wraps
-from validmind.ai.test_descriptions import get_description_metadata
-from validmind.errors import MissingRequiredTestInputError
 from validmind.logging import get_logger
-from validmind.vm_models import (
-    Metric,
-    MetricResult,
-    ResultSummary,
-    ResultTable,
-    ResultTableMetadata,
-    VMDataset,
-    VMModel,
-)
-from validmind.vm_models.figure import (
-    Figure,
-    is_matplotlib_figure,
-    is_plotly_figure,
-    is_png_image,
-)
-from validmind.vm_models.test.result_wrapper import MetricResultWrapper
 from ._store import test_store
+from .load import load_test
 logger = get_logger(__name__)
-_input_type_map = {
-    "dataset": VMDataset,
-    "datasets": List[VMDataset],
-    "model": VMModel,
-    "models": List[VMModel],
-}
-def _inspect_signature(test_func: callable):
-    inputs = {}
-    params = {}
-    for name, arg in inspect.signature(test_func).parameters.items():
-        if name in _input_type_map:
-            inputs[name] = {
-                "type": _input_type_map[name],
-            }
-        else:
-            params[name] = {
-                "type": arg.annotation,
-                "default": (
-                    arg.default if arg.default is not inspect.Parameter.empty else None
-                ),
-            }
-    return inputs, params
-def _build_result(  # noqa: C901
-    results: Union[Any, Tuple[Any, ...]],
-    test_id: str,
-    inputs: List[str],
-    params: Dict[str, Any],
-    description: str = None,
-    output_template: str = None,
-    generate_description: bool = True,
-):
-    ref_id = str(uuid4())
-    figure_metadata = {
-        "_type": "metric",
-        "_name": test_id,
-        "_ref_id": ref_id,
-    }
-    tables = []
-    figures = []
-    scalars = []
-    def process_result_item(item):
-        # TOOD: build out a more robust/extensible system for this
-        # TODO: custom type handlers would be really cool
-        # unit metrics (scalar values) - for now only one per test
-        if isinstance(item, int) or isinstance(item, float):
-            if scalars:
-                raise ValueError("Only one unit metric may be returned per test.")
-            scalars.append(item)
-        # plots
-        elif isinstance(item, Figure):
-            figures.append(item)
-        elif is_matplotlib_figure(item) or is_plotly_figure(item) or is_png_image(item):
-            figures.append(
-                Figure(
-                    key=f"{test_id}:{len(figures) + 1}",
-                    figure=item,
-                    metadata=figure_metadata,
-                )
-            )
-        # tables
-        elif isinstance(item, list) or isinstance(item, pd.DataFrame):
-            tables.append(ResultTable(data=item))
-        elif isinstance(item, dict):
-            for table_name, table in item.items():
-                if not isinstance(table, list) and not isinstance(table, pd.DataFrame):
-                    raise ValueError(
-                        f"Invalid table format: {table_name} must be a list or DataFrame"
-                    )
-                tables.append(
-                    ResultTable(
-                        data=table,
-                        metadata=ResultTableMetadata(title=table_name),
-                    )
-                )
-        else:
-            raise ValueError(f"Invalid return type: {type(item)}")
-    # if the results are a tuple, process each item as a separate result
-    if isinstance(results, tuple):
-        for item in results:
-            process_result_item(item)
-    else:
-        process_result_item(results)
-    metric_inputs = [
-        sub_i.input_id if hasattr(sub_i, "input_id") else sub_i
-        for i in inputs
-        for sub_i in (i if isinstance(i, list) else [i])
-    ]
-    return MetricResultWrapper(
-        result_id=test_id,
-        scalar=scalars[0] if scalars else None,
-        metric=(
-            MetricResult(
-                key=test_id,
-                ref_id=ref_id,
-                value="Empty",
-                summary=ResultSummary(results=tables),
-            )
-            if tables or figures  # if tables or figures than its a traditional metric
-            else None
-        ),
-        figures=figures,
-        result_metadata=(
-            [
-                get_description_metadata(
-                    test_id=test_id,
-                    default_description=description,
-                    summary=ResultSummary(results=tables).serialize(),
-                    figures=figures,
-                    should_generate=generate_description,
-                )
-            ]
-            if tables or figures
-            else None
-        ),
-        inputs=metric_inputs,
-        params=params,
-        output_template=output_template,
-    )
-def _get_run_method(func, func_inputs, func_params):
-    def run(self: Metric):
-        input_kwargs = {}  # map function inputs (`dataset` etc) to actual objects
-        input_ids = []  # store input_ids used so they can be logged
-        for key in func_inputs.keys():
-            try:
-                input_kwargs[key] = getattr(self.inputs, key)
-                if isinstance(input_kwargs[key], list):
-                    input_ids.extend([i.input_id for i in input_kwargs[key]])
-                else:
-                    input_ids.append(input_kwargs[key].input_id)
-            except AttributeError:
-                raise MissingRequiredTestInputError(f"Missing required input: {key}.")
-        param_kwargs = {
-            key: self.params.get(key, func_params[key]["default"])
-            for key in func_params.keys()
-        }
-        raw_results = func(**input_kwargs, **param_kwargs)
-        self.result = _build_result(
-            results=raw_results,
-            test_id=self.test_id,
-            description=inspect.getdoc(self),
-            inputs=input_ids,
-            params=param_kwargs,
-            output_template=self.output_template,
-            generate_description=self.generate_description,
-        )
-        return self.result
-    return run
+def _get_save_func(func, test_id):
+    """Helper function to save a decorated function to a file
+    Useful when a custom test function has been created inline in a notebook or
+    interactive session and needs to be saved to a file so it can be added to a
+    test library.
+    """
-def _get_save_func(func, test_id):
     def save(root_folder=".", imports=None):
         parts = test_id.split(".")
@@ -270,34 +82,26 @@ def _get_save_func(func, test_id):
     return save
-def metric(func_or_id):
-    """
-    DEPRECATED, use @vm.test instead
-    """
-    # print a deprecation notice and call the test() function instead
-    logger.warning(
-        "The @vm.metric decorator is deprecated and will be removed in a future release. "
-        "Please use @vm.test instead."
-    )
-    return test(func_or_id)
+def test(func_or_id):
+    """Decorator for creating and registering custom tests
+    This decorator registers the function it wraps as a test function within ValidMind
+    under the provided ID. Once decorated, the function can be run using the
+    `validmind.tests.run_test` function.
-def test(func_or_id):
-    """Decorator for creating and registering metrics with the ValidMind framework.
+    The function can take two different types of arguments:
-    Creates a metric object and registers it with ValidMind under the provided ID. If
-    no ID is provided, the function name will be used as to build one. So if the
-    function name is `my_metric`, the metric will be registered under the ID
-    `validmind.custom_metrics.my_metric`.
+    - Inputs: ValidMind model or dataset (or list of models/datasets). These arguments
+      must use the following names: `model`, `models`, `dataset`, `datasets`.
+    - Parameters: Any additional keyword arguments of any type (must have a default
+      value) that can have any name.
-    This decorator works by creating a new `Metric` class will be created whose `run`
-    method calls the decorated function. This function should take as arguments the
-    inputs it requires (`dataset`, `datasets`, `model`, `models`) followed by any
-    parameters. It can return any number of the following types:
+    The function should return one of the following types:
     - Table: Either a list of dictionaries or a pandas DataFrame
     - Plot: Either a matplotlib figure or a plotly figure
-    - Scalar: A single number or string
+    - Scalar: A single number (int or float)
+    - Boolean: A single boolean value indicating whether the test passed or failed
     The function may also include a docstring. This docstring will be used and logged
     as the metric's description.
@@ -312,30 +116,17 @@ def test(func_or_id):
     def decorator(func):
         test_id = func_or_id or f"validmind.custom_metrics.{func.__name__}"
+        test_func = load_test(test_id, func, reload=True)
+        test_store.register_test(test_id, test_func)
-        inputs, params = _inspect_signature(func)
-        description = inspect.getdoc(func)
-        tasks = getattr(func, "__tasks__", [])
-        tags = getattr(func, "__tags__", [])
-        metric_class = type(
-            func.__name__,
-            (Metric,),
-            {
-                "run": _get_run_method(func, inputs, params),
-                "required_inputs": list(inputs.keys()),
-                "default_params": {k: v["default"] for k, v in params.items()},
-                "__doc__": description,
-                "tasks": tasks,
-                "tags": tags,
-            },
-        )
-        test_store.register_custom_test(test_id, metric_class)
+        @wraps(test_func)
+        def wrapper(*args, **kwargs):
+            return test_func(*args, **kwargs)
         # special function to allow the function to be saved to a file
-        func.save = _get_save_func(func, test_id)
+        wrapper.save = _get_save_func(test_func, test_id)
-        return func
+        return wrapper
     if callable(func_or_id):
         return decorator(func_or_id)
@@ -344,10 +135,10 @@ def test(func_or_id):
 def tasks(*tasks):
-    """Decorator for specifying the task types that a metric is designed for.
+    """Decorator for specifying the task types that a test is designed for.
     Args:
-        *tasks: The task types that the metric is designed for.
+        *tasks: The task types that the test is designed for.
     """
     def decorator(func):
@@ -358,10 +149,10 @@ def tasks(*tasks):
 def tags(*tags):
-    """Decorator for specifying tags for a metric.
+    """Decorator for specifying tags for a test.
     Args:
-        *tags: The tags to apply to the metric.
+        *tags: The tags to apply to the test.
     """
     def decorator(func):

validmind 2.5.25__py3-none-any.whl → 2.6.8__py3-none-any.whl

validmind 2.5.25py3-none-any.whl → 2.6.8py3-none-any.whl