PyPI - validmind - Versions diffs - 2.5.25__py3-none-any.whl → 2.6.7__py3-none-any.whl - Mend

validmind 2.5.25py3-none-any.whl → 2.6.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (198) hide show

validmind/__init__.py +8 -17
validmind/__version__.py +1 -1
validmind/ai/test_descriptions.py +66 -85
validmind/ai/test_result_description/context.py +2 -2
validmind/ai/utils.py +26 -1
validmind/api_client.py +43 -79
validmind/client.py +5 -7
validmind/client_config.py +1 -1
validmind/datasets/__init__.py +1 -1
validmind/datasets/classification/customer_churn.py +7 -5
validmind/datasets/nlp/__init__.py +2 -2
validmind/errors.py +6 -10
validmind/html_templates/content_blocks.py +18 -16
validmind/logging.py +21 -16
validmind/tests/__init__.py +28 -5
validmind/tests/__types__.py +186 -170
validmind/tests/_store.py +7 -21
validmind/tests/comparison.py +362 -0
validmind/tests/data_validation/ACFandPACFPlot.py +44 -73
validmind/tests/data_validation/ADF.py +49 -83
validmind/tests/data_validation/AutoAR.py +59 -96
validmind/tests/data_validation/AutoMA.py +59 -96
validmind/tests/data_validation/AutoStationarity.py +66 -114
validmind/tests/data_validation/ClassImbalance.py +48 -117
validmind/tests/data_validation/DatasetDescription.py +180 -209
validmind/tests/data_validation/DatasetSplit.py +50 -75
validmind/tests/data_validation/DescriptiveStatistics.py +59 -85
validmind/tests/data_validation/{DFGLSArch.py → DickeyFullerGLS.py} +44 -76
validmind/tests/data_validation/Duplicates.py +21 -90
validmind/tests/data_validation/EngleGrangerCoint.py +53 -75
validmind/tests/data_validation/HighCardinality.py +32 -80
validmind/tests/data_validation/HighPearsonCorrelation.py +29 -97
validmind/tests/data_validation/IQROutliersBarPlot.py +63 -94
validmind/tests/data_validation/IQROutliersTable.py +40 -80
validmind/tests/data_validation/IsolationForestOutliers.py +41 -63
validmind/tests/data_validation/KPSS.py +33 -81
validmind/tests/data_validation/LaggedCorrelationHeatmap.py +47 -95
validmind/tests/data_validation/MissingValues.py +17 -58
validmind/tests/data_validation/MissingValuesBarPlot.py +61 -87
validmind/tests/data_validation/PhillipsPerronArch.py +56 -79
validmind/tests/data_validation/RollingStatsPlot.py +50 -81
validmind/tests/data_validation/SeasonalDecompose.py +102 -184
validmind/tests/data_validation/Skewness.py +27 -64
validmind/tests/data_validation/SpreadPlot.py +34 -57
validmind/tests/data_validation/TabularCategoricalBarPlots.py +46 -65
validmind/tests/data_validation/TabularDateTimeHistograms.py +23 -45
validmind/tests/data_validation/TabularNumericalHistograms.py +27 -46
validmind/tests/data_validation/TargetRateBarPlots.py +54 -93
validmind/tests/data_validation/TimeSeriesFrequency.py +48 -133
validmind/tests/data_validation/TimeSeriesHistogram.py +24 -3
validmind/tests/data_validation/TimeSeriesLinePlot.py +29 -47
validmind/tests/data_validation/TimeSeriesMissingValues.py +59 -135
validmind/tests/data_validation/TimeSeriesOutliers.py +54 -171
validmind/tests/data_validation/TooManyZeroValues.py +21 -70
validmind/tests/data_validation/UniqueRows.py +23 -62
validmind/tests/data_validation/WOEBinPlots.py +83 -109
validmind/tests/data_validation/WOEBinTable.py +28 -69
validmind/tests/data_validation/ZivotAndrewsArch.py +33 -75
validmind/tests/data_validation/nlp/CommonWords.py +49 -57
validmind/tests/data_validation/nlp/Hashtags.py +27 -49
validmind/tests/data_validation/nlp/LanguageDetection.py +7 -13
validmind/tests/data_validation/nlp/Mentions.py +32 -63
validmind/tests/data_validation/nlp/PolarityAndSubjectivity.py +89 -14
validmind/tests/data_validation/nlp/Punctuations.py +63 -47
validmind/tests/data_validation/nlp/Sentiment.py +4 -0
validmind/tests/data_validation/nlp/StopWords.py +62 -91
validmind/tests/data_validation/nlp/TextDescription.py +116 -159
validmind/tests/data_validation/nlp/Toxicity.py +12 -4
validmind/tests/decorator.py +33 -242
validmind/tests/load.py +212 -153
validmind/tests/model_validation/BertScore.py +13 -7
validmind/tests/model_validation/BleuScore.py +4 -0
validmind/tests/model_validation/ClusterSizeDistribution.py +24 -47
validmind/tests/model_validation/ContextualRecall.py +3 -0
validmind/tests/model_validation/FeaturesAUC.py +43 -74
validmind/tests/model_validation/MeteorScore.py +3 -0
validmind/tests/model_validation/RegardScore.py +5 -1
validmind/tests/model_validation/RegressionResidualsPlot.py +54 -75
validmind/tests/model_validation/embeddings/ClusterDistribution.py +10 -33
validmind/tests/model_validation/embeddings/CosineSimilarityDistribution.py +11 -29
validmind/tests/model_validation/embeddings/DescriptiveAnalytics.py +19 -31
validmind/tests/model_validation/embeddings/EmbeddingsVisualization2D.py +40 -49
validmind/tests/model_validation/embeddings/StabilityAnalysisKeyword.py +29 -15
validmind/tests/model_validation/embeddings/StabilityAnalysisRandomNoise.py +25 -11
validmind/tests/model_validation/embeddings/StabilityAnalysisSynonyms.py +28 -13
validmind/tests/model_validation/embeddings/StabilityAnalysisTranslation.py +67 -38
validmind/tests/model_validation/embeddings/utils.py +53 -0
validmind/tests/model_validation/ragas/AnswerCorrectness.py +37 -32
validmind/tests/model_validation/ragas/{AspectCritique.py → AspectCritic.py} +33 -27
validmind/tests/model_validation/ragas/ContextEntityRecall.py +44 -41
validmind/tests/model_validation/ragas/ContextPrecision.py +40 -35
validmind/tests/model_validation/ragas/ContextPrecisionWithoutReference.py +133 -0
validmind/tests/model_validation/ragas/ContextRecall.py +40 -35
validmind/tests/model_validation/ragas/Faithfulness.py +42 -30
validmind/tests/model_validation/ragas/NoiseSensitivity.py +59 -35
validmind/tests/model_validation/ragas/{AnswerRelevance.py → ResponseRelevancy.py} +52 -41
validmind/tests/model_validation/ragas/{AnswerSimilarity.py → SemanticSimilarity.py} +39 -34
validmind/tests/model_validation/sklearn/AdjustedMutualInformation.py +13 -16
validmind/tests/model_validation/sklearn/AdjustedRandIndex.py +13 -16
validmind/tests/model_validation/sklearn/ClassifierPerformance.py +51 -89
validmind/tests/model_validation/sklearn/ClusterCosineSimilarity.py +31 -61
validmind/tests/model_validation/sklearn/ClusterPerformanceMetrics.py +118 -83
validmind/tests/model_validation/sklearn/CompletenessScore.py +13 -16
validmind/tests/model_validation/sklearn/ConfusionMatrix.py +62 -94
validmind/tests/model_validation/sklearn/FeatureImportance.py +7 -8
validmind/tests/model_validation/sklearn/FowlkesMallowsScore.py +12 -15
validmind/tests/model_validation/sklearn/HomogeneityScore.py +12 -15
validmind/tests/model_validation/sklearn/HyperParametersTuning.py +23 -53
validmind/tests/model_validation/sklearn/KMeansClustersOptimization.py +60 -74
validmind/tests/model_validation/sklearn/MinimumAccuracy.py +16 -84
validmind/tests/model_validation/sklearn/MinimumF1Score.py +22 -72
validmind/tests/model_validation/sklearn/MinimumROCAUCScore.py +29 -78
validmind/tests/model_validation/sklearn/ModelsPerformanceComparison.py +52 -82
validmind/tests/model_validation/sklearn/OverfitDiagnosis.py +51 -145
validmind/tests/model_validation/sklearn/PermutationFeatureImportance.py +60 -78
validmind/tests/model_validation/sklearn/PopulationStabilityIndex.py +130 -172
validmind/tests/model_validation/sklearn/PrecisionRecallCurve.py +26 -55
validmind/tests/model_validation/sklearn/ROCCurve.py +43 -77
validmind/tests/model_validation/sklearn/RegressionPerformance.py +41 -94
validmind/tests/model_validation/sklearn/RobustnessDiagnosis.py +47 -136
validmind/tests/model_validation/sklearn/SHAPGlobalImportance.py +164 -208
validmind/tests/model_validation/sklearn/SilhouettePlot.py +54 -99
validmind/tests/model_validation/sklearn/TrainingTestDegradation.py +50 -124
validmind/tests/model_validation/sklearn/VMeasure.py +12 -15
validmind/tests/model_validation/sklearn/WeakspotsDiagnosis.py +225 -281
validmind/tests/model_validation/statsmodels/AutoARIMA.py +40 -45
validmind/tests/model_validation/statsmodels/KolmogorovSmirnov.py +22 -47
validmind/tests/model_validation/statsmodels/Lilliefors.py +17 -28
validmind/tests/model_validation/statsmodels/RegressionFeatureSignificance.py +37 -81
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlot.py +37 -105
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlotLevels.py +62 -166
validmind/tests/model_validation/statsmodels/RegressionModelSensitivityPlot.py +57 -119
validmind/tests/model_validation/statsmodels/RegressionModelSummary.py +20 -57
validmind/tests/model_validation/statsmodels/RegressionPermutationFeatureImportance.py +47 -80
validmind/tests/ongoing_monitoring/PredictionCorrelation.py +2 -0
validmind/tests/ongoing_monitoring/TargetPredictionDistributionPlot.py +4 -2
validmind/tests/output.py +120 -0
validmind/tests/prompt_validation/Bias.py +55 -98
validmind/tests/prompt_validation/Clarity.py +56 -99
validmind/tests/prompt_validation/Conciseness.py +63 -101
validmind/tests/prompt_validation/Delimitation.py +48 -89
validmind/tests/prompt_validation/NegativeInstruction.py +62 -96
validmind/tests/prompt_validation/Robustness.py +80 -121
validmind/tests/prompt_validation/Specificity.py +61 -95
validmind/tests/prompt_validation/ai_powered_test.py +2 -2
validmind/tests/run.py +314 -496
validmind/tests/test_providers.py +109 -79
validmind/tests/utils.py +91 -0
validmind/unit_metrics/__init__.py +16 -155
validmind/unit_metrics/classification/F1.py +1 -0
validmind/unit_metrics/classification/Precision.py +1 -0
validmind/unit_metrics/classification/ROC_AUC.py +1 -0
validmind/unit_metrics/classification/Recall.py +1 -0
validmind/unit_metrics/regression/AdjustedRSquaredScore.py +1 -0
validmind/unit_metrics/regression/GiniCoefficient.py +1 -0
validmind/unit_metrics/regression/HuberLoss.py +1 -0
validmind/unit_metrics/regression/KolmogorovSmirnovStatistic.py +1 -0
validmind/unit_metrics/regression/MeanAbsoluteError.py +1 -0
validmind/unit_metrics/regression/MeanAbsolutePercentageError.py +1 -0
validmind/unit_metrics/regression/MeanBiasDeviation.py +1 -0
validmind/unit_metrics/regression/MeanSquaredError.py +1 -0
validmind/unit_metrics/regression/QuantileLoss.py +1 -0
validmind/unit_metrics/regression/RSquaredScore.py +2 -1
validmind/unit_metrics/regression/RootMeanSquaredError.py +1 -0
validmind/utils.py +66 -17
validmind/vm_models/__init__.py +2 -17
validmind/vm_models/dataset/dataset.py +31 -4
validmind/vm_models/figure.py +7 -37
validmind/vm_models/model.py +3 -0
validmind/vm_models/result/__init__.py +7 -0
validmind/vm_models/result/result.jinja +21 -0
validmind/vm_models/result/result.py +337 -0
validmind/vm_models/result/utils.py +160 -0
validmind/vm_models/test_suite/runner.py +16 -54
validmind/vm_models/test_suite/summary.py +3 -3
validmind/vm_models/test_suite/test.py +43 -77
validmind/vm_models/test_suite/test_suite.py +8 -40
validmind-2.6.7.dist-info/METADATA +137 -0
{validmind-2.5.25.dist-info → validmind-2.6.7.dist-info}/RECORD +182 -189
validmind/tests/data_validation/AutoSeasonality.py +0 -190
validmind/tests/metadata.py +0 -59
validmind/tests/model_validation/embeddings/StabilityAnalysis.py +0 -176
validmind/tests/model_validation/ragas/ContextUtilization.py +0 -161
validmind/tests/model_validation/sklearn/ClusterPerformance.py +0 -80
validmind/unit_metrics/composite.py +0 -238
validmind/vm_models/test/metric.py +0 -98
validmind/vm_models/test/metric_result.py +0 -61
validmind/vm_models/test/output_template.py +0 -55
validmind/vm_models/test/result_summary.py +0 -76
validmind/vm_models/test/result_wrapper.py +0 -488
validmind/vm_models/test/test.py +0 -103
validmind/vm_models/test/threshold_test.py +0 -106
validmind/vm_models/test/threshold_test_result.py +0 -75
validmind/vm_models/test_context.py +0 -259
validmind-2.5.25.dist-info/METADATA +0 -118
{validmind-2.5.25.dist-info → validmind-2.6.7.dist-info}/LICENSE +0 -0
{validmind-2.5.25.dist-info → validmind-2.6.7.dist-info}/WHEEL +0 -0
{validmind-2.5.25.dist-info → validmind-2.6.7.dist-info}/entry_points.txt +0 -0

validmind/vm_models/result/utils.py ADDED Viewed

@@ -0,0 +1,160 @@
+# Copyright © 2023-2024 ValidMind Inc. All rights reserved.
+# See the LICENSE file in the root of this repository for details.
+# SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
+import os
+from typing import TYPE_CHECKING, Dict, List, Union
+import pandas as pd
+from ipywidgets import HTML, GridBox, Layout
+from jinja2 import Template
+from ... import api_client
+from ...logging import get_logger
+from ..dataset import VMDataset
+from ..figure import Figure
+from ..input import VMInput
+if TYPE_CHECKING:
+    from .result import ResultTable
+AI_REVISION_NAME = "Generated by ValidMind AI"
+DEFAULT_REVISION_NAME = "Default Description"
+logger = get_logger(__name__)
+_result_template = None
+def get_result_template():
+    """Get the jinja html template for rendering test results"""
+    global _result_template
+    if _result_template is None:
+        with open(os.path.join(os.path.dirname(__file__), "result.jinja")) as f:
+            _result_template = Template(f.read())
+    return _result_template
+async def update_metadata(content_id: str, text: str, _json: Union[Dict, List] = None):
+    """Create or Update a Metadata Object"""
+    parts = content_id.split("::")
+    content_id = parts[0]
+    revision_name = parts[1] if len(parts) > 1 else None
+    # we always want composite metric definitions to be updated
+    should_update = content_id.startswith("composite_metric_def:")
+    # if we are updating a metric or test description, we check if the text
+    # has changed from the last time it was logged, and only update if it has
+    if content_id.split(":", 1)[0] in ["metric_description", "test_description"]:
+        try:
+            md = await api_client.aget_metadata(content_id)
+            # if there is an existing description, only update it if the new one
+            # is different and is an AI-generated description
+            should_update = (
+                md["text"] != text if revision_name == AI_REVISION_NAME else False
+            )
+            logger.debug(f"Check if description has changed: {should_update}")
+        except Exception:
+            # if exception, assume its not created yet TODO: don't catch all
+            should_update = True
+    if should_update:
+        if revision_name:
+            content_id = f"{content_id}::{revision_name}"
+        logger.debug(f"Updating metadata for `{content_id}`")
+        await api_client.alog_metadata(content_id, text, _json)
+def check_for_sensitive_data(data: pd.DataFrame, inputs: List[VMInput]):
+    """Check if a table contains raw data from input datasets"""
+    dataset_columns = {
+        col: len(input_obj.df)
+        for input_obj in inputs
+        if isinstance(input_obj, VMDataset)
+        for col in input_obj.columns
+    }
+    table_columns = {col: len(data) for col in data.columns}
+    offending_columns = [
+        col
+        for col in table_columns
+        if col in dataset_columns and table_columns[col] == dataset_columns[col]
+    ]
+    if offending_columns:
+        raise ValueError(
+            f"Raw input data found in table, pass `unsafe=True` "
+            f"or remove the offending columns: {offending_columns}"
+        )
+def tables_to_widgets(tables: List["ResultTable"]):
+    """Convert summary (list of json tables) into a list of ipywidgets"""
+    widgets = [
+        HTML("<h3>Tables</h3>"),
+    ]
+    for table in tables:
+        html = ""
+        if table.title:
+            html += f"<h4>{table.title}</h4>"
+        html += (
+            table.data.reset_index(drop=True)
+            .style.format(precision=4)
+            .hide(axis="index")
+            .set_table_styles(
+                [
+                    {
+                        "selector": "",
+                        "props": [("width", "100%")],
+                    },
+                    {
+                        "selector": "th",
+                        "props": [("text-align", "left")],
+                    },
+                    {
+                        "selector": "tbody tr:nth-child(even)",
+                        "props": [("background-color", "#FFFFFF")],
+                    },
+                    {
+                        "selector": "tbody tr:nth-child(odd)",
+                        "props": [("background-color", "#F5F5F5")],
+                    },
+                    {
+                        "selector": "td, th",
+                        "props": [
+                            ("padding-left", "5px"),
+                            ("padding-right", "5px"),
+                        ],
+                    },
+                ]
+            )
+            .set_properties(**{"text-align": "left"})
+            .to_html(escape=False)
+        )
+        widgets.append(HTML(html))
+    return widgets
+def figures_to_widgets(figures: List[Figure]) -> list:
+    """Plot figures to a ipywidgets GridBox"""
+    num_columns = 2 if len(figures) > 1 else 1
+    plot_widgets = GridBox(
+        [figure.to_widget() for figure in figures],
+        layout=Layout(
+            grid_template_columns=f"repeat({num_columns}, 1fr)",
+        ),
+    )
+    return [HTML("<h3>Figures</h3>"), plot_widgets]

validmind/vm_models/test_suite/runner.py CHANGED Viewed

@@ -9,7 +9,6 @@ from IPython.display import display
 from ...logging import get_logger
 from ...utils import is_notebook, run_async, run_async_check
-from ..test_context import TestContext, TestInput
 from .summary import TestSuiteSummary
 from .test_suite import TestSuite
@@ -22,8 +21,6 @@ class TestSuiteRunner:
     """
     suite: TestSuite = None
-    context: TestContext = None
-    input: TestInput = None
     config: dict = None
     _test_configs: dict = None
@@ -32,67 +29,33 @@ class TestSuiteRunner:
     pbar_description: widgets.Label = None
     pbar_box: widgets.HBox = None
-    def __init__(self, suite: TestSuite, input: TestInput, config: dict = None):
+    def __init__(self, suite: TestSuite, config: dict = None, inputs: dict = None):
         self.suite = suite
-        self.input = input
         self.config = config or {}
-        self.context = TestContext()
+        self._load_config(inputs)
-        self._load_config()
-        self._init_tests()
-    def _load_config(self):
+    def _load_config(self, inputs: dict = None):
         """Splits the config into a global config and test configs"""
-        self._test_configs = {}
+        self._test_configs = {
+            test.test_id: {"inputs": inputs or {}} for test in self.suite.get_tests()
+        }
         for key, value in self.config.items():
-            test_ids = [test.test_id for test in self.suite.get_tests()]
             # If the key does not exist in the test suite, we need to
             # inform the user the config is probably wrong but we will
             # keep running all tests
-            if key not in test_ids:
+            if key not in self._test_configs:
                 logger.warning(
                     f"Config key '{key}' does not match a test_id in the template."
                     "\n\tEnsure you registered a content block with the correct content_id in the template"
                     "\n\tThe configuration for this test will be ignored."
                 )
-            else:
-                self._test_configs[key] = value
+                continue
-    def _init_tests(self):
-        """
-        Loads the tests in a test suite
-        """
-        for section in self.suite.sections:
-            for test in section.tests:
-                # use local inputs from config if provided
-                test_configs = self._test_configs.get(test.test_id, {})
-                inputs = self.input
-                if (
-                    test.test_id in self.config
-                    and "inputs" in self.config[test.test_id]
-                ):
-                    inputs = TestInput(self.config[test.test_id]["inputs"])
-                    test_configs = {
-                        key: value
-                        for key, value in test_configs.items()
-                        if key != "inputs"
-                    }
-                    test_configs = test_configs.get("params", {})
-                else:
-                    if (test_configs) and ("params" not in test_configs):
-                        # [DEPRECATED] This is the old way of setting test parameters
-                        msg = (
-                            "Setting test parameters directly in the 'config' parameter"
-                            " of the run_documentation_tests() method is deprecated. "
-                            "Instead, use the new format of the config: "
-                            'config = {"test_id": {"params": {...}, "inputs": {...}}}'
-                        )
-                        logger.warning(msg)
-                test.load(inputs=inputs, context=self.context, config=test_configs)
+            # override the global config (inputs) with the test-specific config
+            # TODO: better configuration would make for a better DX
+            self._test_configs[key] = value
     def _start_progress_bar(self, send: bool = True):
         """
@@ -176,12 +139,11 @@ class TestSuiteRunner:
         for section in self.suite.sections:
             for test in section.tests:
-                if test._test_class is None:
-                    self.pbar.value += 1
-                    continue
-                self.pbar_description.value = f"Running {test.test_type}: {test.name}"
-                test.run(fail_fast=fail_fast)
+                self.pbar_description.value = f"Running {test.name}"
+                test.run(
+                    fail_fast=fail_fast,
+                    config=self._test_configs.get(test.test_id, {}),
+                )
                 self.pbar.value += 1
         if send:

validmind/vm_models/test_suite/summary.py CHANGED Viewed

@@ -9,7 +9,7 @@ import ipywidgets as widgets
 from ...logging import get_logger
 from ...utils import display, md_to_html
-from ..test.result_wrapper import FailedResultWrapper
+from ..result import ErrorResult
 from .test_suite import TestSuiteSection, TestSuiteTest
 logger = get_logger(__name__)
@@ -52,7 +52,7 @@ class TestSuiteSectionSummary:
             children.append(test.result.to_widget())
             titles.append(
                 f"❌ {test.result.name}: {test.name} ({test.test_id})"
-                if isinstance(test.result, FailedResultWrapper)
+                if isinstance(test.result, ErrorResult)
                 else f"{test.result.name}: {test.name} ({test.test_id})"
             )
@@ -96,7 +96,7 @@ class TestSuiteSummary:
         from ...api_client import get_api_host, get_api_model
         ui_host = get_api_host().replace("/api/v1/tracking", "").replace("api", "app")
-        link = f"{ui_host}/projects/{get_api_model()}/project-overview"
+        link = f"{ui_host}model-inventory/{get_api_model()}"
         results_link = f"""
         <h3>
             Check out the updated documentation in your

validmind/vm_models/test_suite/test.py CHANGED Viewed

@@ -2,14 +2,14 @@
 # See the LICENSE file in the root of this repository for details.
 # SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
-from ...errors import should_raise_on_fail_fast
+from typing import Any, Dict, Union
+from ...errors import LoadTestError, should_raise_on_fail_fast
 from ...logging import get_logger, log_performance
-from ...tests import LoadTestError
-from ...tests import load_test as load_test_class
+from ...tests.load import load_test
+from ...tests.run import run_test
 from ...utils import test_id_to_name
-from ..test.result_wrapper import FailedResultWrapper, ResultWrapper
-from ..test.test import Test
-from ..test_context import TestContext, TestInput
+from ..result import ErrorResult, Result, TestResult
 logger = get_logger(__name__)
@@ -21,12 +21,11 @@ class TestSuiteTest:
     test_id: str
     output_template: str = None
-    name: str = None
-    _test_class: Test = None
-    _test_instance: Test = None
+    name: Union[str, None] = None
+    description: Union[Dict[str, Any], None] = None
+    result: Union[Result, None] = None
-    result: object = None
+    _load_failed: bool = False
     def __init__(self, test_id_or_obj):
         """Load the test class from the test id
@@ -42,69 +41,46 @@ class TestSuiteTest:
         self.name = test_id_to_name(self.test_id)
+    def get_default_config(self):
+        """Returns the default configuration for the test"""
         try:
-            self._test_class = load_test_class(self.test_id)
+            test_func = load_test(self.test_id)
         except LoadTestError as e:
-            self.result = FailedResultWrapper(
-                error=e,
-                message=f"Failed to load test '{self.test_id}'",
-                result_id=self.test_id,
-            )
-        except Exception as e:
-            # The test suite runner will appropriately ignore this error
-            # since _test_class is None
             logger.error(f"Failed to load test '{self.test_id}': {e}")
-    @property
-    def test_type(self):
-        return self._test_class.test_type
-    def get_default_params(self):
-        """Returns the default params for the test"""
-        if not self._test_class:
-            return {}
-        return self._test_class.default_params
-    def load(self, inputs: TestInput, context: TestContext, config: dict = None):
-        """Load an instance of the test class"""
-        if not self._test_class:
-            return
-        try:
-            self._test_instance = self._test_class(
-                test_id=self.test_id,
-                context=context,
-                inputs=inputs,
-                params=config,
-                output_template=self.output_template,
-            )
-        except Exception as e:
-            logger.error(
-                f"Failed to load test '{self.test_id}': "
-                f"({e.__class__.__name__}) {e}"
-            )
-            self.result = FailedResultWrapper(
+            self._load_failed = True
+            self.result = ErrorResult(
                 error=e,
                 message=f"Failed to load test '{self.name}'",
                 result_id=self.test_id,
             )
-    def run(self, fail_fast: bool = False):
+            return None
+        config = {
+            # we use the input name ('dataset', 'model') as the key and the value
+            "inputs": {k: k for k in test_func.inputs},
+            "params": {k: v.get("default") for k, v in test_func.params.items()},
+        }
+        return config
+    def run(self, fail_fast: bool = False, config: dict = None):
         """Run the test"""
-        if not self._test_instance:
-            # test failed to load and we have already logged the error
+        if self._load_failed:
             return
         try:
-            self._test_instance.validate_inputs()
             # run the test and log the performance if LOG_LEVEL is set to DEBUG
-            log_performance(
-                func=self._test_instance.run,
-                name=self.test_id,
-                logger=logger,
-            )()  # this is a decorator so we need to call it
+            @log_performance(name=self.test_id, logger=logger)
+            def run_test_with_logging():
+                return run_test(
+                    self.test_id,
+                    **(config or {}),
+                    show=False,
+                )
+            self.result = run_test_with_logging()
         except Exception as e:
             if fail_fast and should_raise_on_fail_fast(e):
@@ -113,40 +89,30 @@ class TestSuiteTest:
             logger.error(
                 f"Failed to run test '{self.test_id}': " f"({e.__class__.__name__}) {e}"
             )
-            self.result = FailedResultWrapper(
-                name=f"Failed {self._test_instance.test_type}",
+            self.result = ErrorResult(
                 error=e,
                 message=f"Failed to run '{self.name}'",
                 result_id=self.test_id,
             )
-            return
-        if self._test_instance.result is None:
-            self.result = FailedResultWrapper(
-                name=f"Failed {self._test_instance.test_type}",
+        if self.result is None:
+            self.result = ErrorResult(
                 error=None,
                 message=f"'{self.name}' did not return a result",
                 result_id=self.test_id,
             )
-            return
-        if not isinstance(self._test_instance.result, ResultWrapper):
-            self.result = FailedResultWrapper(
-                name=f"Failed {self._test_instance.test_type}",
+        if not isinstance(self.result, Result):
+            self.result = ErrorResult(
                 error=None,
                 message=f"{self.name} returned an invalid result: {self._test_instance.result}",
                 result_id=self.test_id,
             )
-            return
-        self.result = self._test_instance.result
     async def log_async(self):
         """Log the result for this test to ValidMind"""
         if not self.result:
             raise ValueError("Cannot log test result before running the test")
-        await self.result.log_async()
+        if isinstance(self.result, TestResult):
+            return await self.result.log_async()

validmind/vm_models/test_suite/test_suite.py CHANGED Viewed

@@ -48,48 +48,16 @@ class TestSuiteSection:
     section_id: str = None
     description: Optional[str] = None
-    def get_required_inputs_for_test(self, test: TestSuiteTest) -> List[str]:
-        """
-        Returns the required inputs for a specific test. Returns an input
-        dictionary that can be passed directly to run_test() or run_documentation_test()
-        Args:
-            test (TestSuiteTest): The test to get the required inputs for
-        Returns:
-            dict: A dictionary of required inputs
-        """
-        test_class = test._test_class
-        inputs_dict = {}
-        if (
-            not hasattr(test_class, "required_inputs")
-            or test_class.required_inputs is None
-        ):
-            return inputs_dict
-        for input_name in test_class.required_inputs:
-            # This required input is not valid but the behavior in this function
-            # is consistent with required_inputs as defined in the test class so
-            # we will ignore it for now
-            #
-            # if input_name == "model.train_ds" or input_name == "model.test_ds":
-            #     continue
-            # Assign None to the input to indicate that it is required
-            inputs_dict[input_name] = None
-        return inputs_dict
     def get_default_config(self):
         """Returns the default configuration for the test suite section"""
         # TODO: configuration across sections/tests needs more work
         section_default_config = {}
         for test in self.tests:
-            section_default_config[test.test_id] = {
-                "inputs": self.get_required_inputs_for_test(test),
-                "params": test.get_default_params() or {},
-            }
+            default_config = test.get_default_config()
+            if default_config:
+                section_default_config[test.test_id] = default_config
         return section_default_config
@@ -162,13 +130,13 @@ class TestSuite:
         return self.suite_id.title().replace("_", " ")
     def get_tests(self) -> List[str]:
-        """Get all test IDs from all sections"""
-        test_ids = []
+        """Get all test suite test objects from all sections"""
+        tests = []
         for section in self.sections:
-            test_ids.extend(section.tests)
+            tests.extend(section.tests)
-        return test_ids
+        return tests
     def num_tests(self) -> int:
         """Returns the total number of tests in the test suite"""

validmind 2.5.25__py3-none-any.whl → 2.6.7__py3-none-any.whl

validmind 2.5.25py3-none-any.whl → 2.6.7py3-none-any.whl