PyPI - validmind - Versions diffs - 2.5.25__py3-none-any.whl → 2.6.8__py3-none-any.whl - Mend

validmind 2.5.25py3-none-any.whl → 2.6.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (198) hide show

validmind/__init__.py +8 -17
validmind/__version__.py +1 -1
validmind/ai/test_descriptions.py +66 -85
validmind/ai/test_result_description/context.py +2 -2
validmind/ai/utils.py +26 -1
validmind/api_client.py +43 -79
validmind/client.py +5 -7
validmind/client_config.py +1 -1
validmind/datasets/__init__.py +1 -1
validmind/datasets/classification/customer_churn.py +7 -5
validmind/datasets/nlp/__init__.py +2 -2
validmind/errors.py +6 -10
validmind/html_templates/content_blocks.py +18 -16
validmind/logging.py +21 -16
validmind/tests/__init__.py +28 -5
validmind/tests/__types__.py +186 -170
validmind/tests/_store.py +7 -21
validmind/tests/comparison.py +362 -0
validmind/tests/data_validation/ACFandPACFPlot.py +44 -73
validmind/tests/data_validation/ADF.py +49 -83
validmind/tests/data_validation/AutoAR.py +59 -96
validmind/tests/data_validation/AutoMA.py +59 -96
validmind/tests/data_validation/AutoStationarity.py +66 -114
validmind/tests/data_validation/ClassImbalance.py +48 -117
validmind/tests/data_validation/DatasetDescription.py +180 -209
validmind/tests/data_validation/DatasetSplit.py +50 -75
validmind/tests/data_validation/DescriptiveStatistics.py +59 -85
validmind/tests/data_validation/{DFGLSArch.py → DickeyFullerGLS.py} +44 -76
validmind/tests/data_validation/Duplicates.py +21 -90
validmind/tests/data_validation/EngleGrangerCoint.py +53 -75
validmind/tests/data_validation/HighCardinality.py +32 -80
validmind/tests/data_validation/HighPearsonCorrelation.py +29 -97
validmind/tests/data_validation/IQROutliersBarPlot.py +63 -94
validmind/tests/data_validation/IQROutliersTable.py +40 -80
validmind/tests/data_validation/IsolationForestOutliers.py +41 -63
validmind/tests/data_validation/KPSS.py +33 -81
validmind/tests/data_validation/LaggedCorrelationHeatmap.py +47 -95
validmind/tests/data_validation/MissingValues.py +17 -58
validmind/tests/data_validation/MissingValuesBarPlot.py +61 -87
validmind/tests/data_validation/PhillipsPerronArch.py +56 -79
validmind/tests/data_validation/RollingStatsPlot.py +50 -81
validmind/tests/data_validation/SeasonalDecompose.py +102 -184
validmind/tests/data_validation/Skewness.py +27 -64
validmind/tests/data_validation/SpreadPlot.py +34 -57
validmind/tests/data_validation/TabularCategoricalBarPlots.py +46 -65
validmind/tests/data_validation/TabularDateTimeHistograms.py +23 -45
validmind/tests/data_validation/TabularNumericalHistograms.py +27 -46
validmind/tests/data_validation/TargetRateBarPlots.py +54 -93
validmind/tests/data_validation/TimeSeriesFrequency.py +48 -133
validmind/tests/data_validation/TimeSeriesHistogram.py +24 -3
validmind/tests/data_validation/TimeSeriesLinePlot.py +29 -47
validmind/tests/data_validation/TimeSeriesMissingValues.py +59 -135
validmind/tests/data_validation/TimeSeriesOutliers.py +54 -171
validmind/tests/data_validation/TooManyZeroValues.py +21 -70
validmind/tests/data_validation/UniqueRows.py +23 -62
validmind/tests/data_validation/WOEBinPlots.py +83 -109
validmind/tests/data_validation/WOEBinTable.py +28 -69
validmind/tests/data_validation/ZivotAndrewsArch.py +33 -75
validmind/tests/data_validation/nlp/CommonWords.py +49 -57
validmind/tests/data_validation/nlp/Hashtags.py +27 -49
validmind/tests/data_validation/nlp/LanguageDetection.py +7 -13
validmind/tests/data_validation/nlp/Mentions.py +32 -63
validmind/tests/data_validation/nlp/PolarityAndSubjectivity.py +89 -14
validmind/tests/data_validation/nlp/Punctuations.py +63 -47
validmind/tests/data_validation/nlp/Sentiment.py +4 -0
validmind/tests/data_validation/nlp/StopWords.py +62 -91
validmind/tests/data_validation/nlp/TextDescription.py +116 -159
validmind/tests/data_validation/nlp/Toxicity.py +12 -4
validmind/tests/decorator.py +33 -242
validmind/tests/load.py +212 -153
validmind/tests/model_validation/BertScore.py +13 -7
validmind/tests/model_validation/BleuScore.py +4 -0
validmind/tests/model_validation/ClusterSizeDistribution.py +24 -47
validmind/tests/model_validation/ContextualRecall.py +3 -0
validmind/tests/model_validation/FeaturesAUC.py +43 -74
validmind/tests/model_validation/MeteorScore.py +3 -0
validmind/tests/model_validation/RegardScore.py +5 -1
validmind/tests/model_validation/RegressionResidualsPlot.py +54 -75
validmind/tests/model_validation/embeddings/ClusterDistribution.py +10 -33
validmind/tests/model_validation/embeddings/CosineSimilarityDistribution.py +11 -29
validmind/tests/model_validation/embeddings/DescriptiveAnalytics.py +19 -31
validmind/tests/model_validation/embeddings/EmbeddingsVisualization2D.py +40 -49
validmind/tests/model_validation/embeddings/StabilityAnalysisKeyword.py +29 -15
validmind/tests/model_validation/embeddings/StabilityAnalysisRandomNoise.py +25 -11
validmind/tests/model_validation/embeddings/StabilityAnalysisSynonyms.py +28 -13
validmind/tests/model_validation/embeddings/StabilityAnalysisTranslation.py +67 -38
validmind/tests/model_validation/embeddings/utils.py +53 -0
validmind/tests/model_validation/ragas/AnswerCorrectness.py +37 -32
validmind/tests/model_validation/ragas/{AspectCritique.py → AspectCritic.py} +33 -27
validmind/tests/model_validation/ragas/ContextEntityRecall.py +44 -41
validmind/tests/model_validation/ragas/ContextPrecision.py +40 -35
validmind/tests/model_validation/ragas/ContextPrecisionWithoutReference.py +133 -0
validmind/tests/model_validation/ragas/ContextRecall.py +40 -35
validmind/tests/model_validation/ragas/Faithfulness.py +42 -30
validmind/tests/model_validation/ragas/NoiseSensitivity.py +59 -35
validmind/tests/model_validation/ragas/{AnswerRelevance.py → ResponseRelevancy.py} +52 -41
validmind/tests/model_validation/ragas/{AnswerSimilarity.py → SemanticSimilarity.py} +39 -34
validmind/tests/model_validation/sklearn/AdjustedMutualInformation.py +13 -16
validmind/tests/model_validation/sklearn/AdjustedRandIndex.py +13 -16
validmind/tests/model_validation/sklearn/ClassifierPerformance.py +51 -89
validmind/tests/model_validation/sklearn/ClusterCosineSimilarity.py +31 -61
validmind/tests/model_validation/sklearn/ClusterPerformanceMetrics.py +118 -83
validmind/tests/model_validation/sklearn/CompletenessScore.py +13 -16
validmind/tests/model_validation/sklearn/ConfusionMatrix.py +62 -94
validmind/tests/model_validation/sklearn/FeatureImportance.py +7 -8
validmind/tests/model_validation/sklearn/FowlkesMallowsScore.py +12 -15
validmind/tests/model_validation/sklearn/HomogeneityScore.py +12 -15
validmind/tests/model_validation/sklearn/HyperParametersTuning.py +23 -53
validmind/tests/model_validation/sklearn/KMeansClustersOptimization.py +60 -74
validmind/tests/model_validation/sklearn/MinimumAccuracy.py +16 -84
validmind/tests/model_validation/sklearn/MinimumF1Score.py +22 -72
validmind/tests/model_validation/sklearn/MinimumROCAUCScore.py +29 -78
validmind/tests/model_validation/sklearn/ModelsPerformanceComparison.py +52 -82
validmind/tests/model_validation/sklearn/OverfitDiagnosis.py +51 -145
validmind/tests/model_validation/sklearn/PermutationFeatureImportance.py +60 -78
validmind/tests/model_validation/sklearn/PopulationStabilityIndex.py +130 -172
validmind/tests/model_validation/sklearn/PrecisionRecallCurve.py +26 -55
validmind/tests/model_validation/sklearn/ROCCurve.py +43 -77
validmind/tests/model_validation/sklearn/RegressionPerformance.py +41 -94
validmind/tests/model_validation/sklearn/RobustnessDiagnosis.py +47 -136
validmind/tests/model_validation/sklearn/SHAPGlobalImportance.py +164 -208
validmind/tests/model_validation/sklearn/SilhouettePlot.py +54 -99
validmind/tests/model_validation/sklearn/TrainingTestDegradation.py +50 -124
validmind/tests/model_validation/sklearn/VMeasure.py +12 -15
validmind/tests/model_validation/sklearn/WeakspotsDiagnosis.py +225 -281
validmind/tests/model_validation/statsmodels/AutoARIMA.py +40 -45
validmind/tests/model_validation/statsmodels/KolmogorovSmirnov.py +22 -47
validmind/tests/model_validation/statsmodels/Lilliefors.py +17 -28
validmind/tests/model_validation/statsmodels/RegressionFeatureSignificance.py +37 -81
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlot.py +37 -105
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlotLevels.py +62 -166
validmind/tests/model_validation/statsmodels/RegressionModelSensitivityPlot.py +57 -119
validmind/tests/model_validation/statsmodels/RegressionModelSummary.py +20 -57
validmind/tests/model_validation/statsmodels/RegressionPermutationFeatureImportance.py +47 -80
validmind/tests/ongoing_monitoring/PredictionCorrelation.py +2 -0
validmind/tests/ongoing_monitoring/TargetPredictionDistributionPlot.py +4 -2
validmind/tests/output.py +120 -0
validmind/tests/prompt_validation/Bias.py +55 -98
validmind/tests/prompt_validation/Clarity.py +56 -99
validmind/tests/prompt_validation/Conciseness.py +63 -101
validmind/tests/prompt_validation/Delimitation.py +48 -89
validmind/tests/prompt_validation/NegativeInstruction.py +62 -96
validmind/tests/prompt_validation/Robustness.py +80 -121
validmind/tests/prompt_validation/Specificity.py +61 -95
validmind/tests/prompt_validation/ai_powered_test.py +2 -2
validmind/tests/run.py +314 -496
validmind/tests/test_providers.py +109 -79
validmind/tests/utils.py +91 -0
validmind/unit_metrics/__init__.py +16 -155
validmind/unit_metrics/classification/F1.py +1 -0
validmind/unit_metrics/classification/Precision.py +1 -0
validmind/unit_metrics/classification/ROC_AUC.py +1 -0
validmind/unit_metrics/classification/Recall.py +1 -0
validmind/unit_metrics/regression/AdjustedRSquaredScore.py +1 -0
validmind/unit_metrics/regression/GiniCoefficient.py +1 -0
validmind/unit_metrics/regression/HuberLoss.py +1 -0
validmind/unit_metrics/regression/KolmogorovSmirnovStatistic.py +1 -0
validmind/unit_metrics/regression/MeanAbsoluteError.py +1 -0
validmind/unit_metrics/regression/MeanAbsolutePercentageError.py +1 -0
validmind/unit_metrics/regression/MeanBiasDeviation.py +1 -0
validmind/unit_metrics/regression/MeanSquaredError.py +1 -0
validmind/unit_metrics/regression/QuantileLoss.py +1 -0
validmind/unit_metrics/regression/RSquaredScore.py +2 -1
validmind/unit_metrics/regression/RootMeanSquaredError.py +1 -0
validmind/utils.py +66 -17
validmind/vm_models/__init__.py +2 -17
validmind/vm_models/dataset/dataset.py +31 -4
validmind/vm_models/figure.py +7 -37
validmind/vm_models/model.py +3 -0
validmind/vm_models/result/__init__.py +7 -0
validmind/vm_models/result/result.jinja +21 -0
validmind/vm_models/result/result.py +337 -0
validmind/vm_models/result/utils.py +160 -0
validmind/vm_models/test_suite/runner.py +16 -54
validmind/vm_models/test_suite/summary.py +3 -3
validmind/vm_models/test_suite/test.py +43 -77
validmind/vm_models/test_suite/test_suite.py +8 -40
validmind-2.6.8.dist-info/METADATA +137 -0
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/RECORD +182 -189
validmind/tests/data_validation/AutoSeasonality.py +0 -190
validmind/tests/metadata.py +0 -59
validmind/tests/model_validation/embeddings/StabilityAnalysis.py +0 -176
validmind/tests/model_validation/ragas/ContextUtilization.py +0 -161
validmind/tests/model_validation/sklearn/ClusterPerformance.py +0 -80
validmind/unit_metrics/composite.py +0 -238
validmind/vm_models/test/metric.py +0 -98
validmind/vm_models/test/metric_result.py +0 -61
validmind/vm_models/test/output_template.py +0 -55
validmind/vm_models/test/result_summary.py +0 -76
validmind/vm_models/test/result_wrapper.py +0 -488
validmind/vm_models/test/test.py +0 -103
validmind/vm_models/test/threshold_test.py +0 -106
validmind/vm_models/test/threshold_test_result.py +0 -75
validmind/vm_models/test_context.py +0 -259
validmind-2.5.25.dist-info/METADATA +0 -118
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/LICENSE +0 -0
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/WHEEL +0 -0
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/entry_points.txt +0 -0

validmind/tests/data_validation/DatasetSplit.py CHANGED Viewed

@@ -2,10 +2,22 @@
 # See the LICENSE file in the root of this repository for details.
 # SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
-from validmind.vm_models import Metric, ResultSummary, ResultTable
+from typing import List
+from validmind import tags, tasks
+from validmind.vm_models import VMDataset
-class DatasetSplit(Metric):
+DATASET_LABELS = {
+    "train_ds": "Training",
+    "test_ds": "Test",
+    "validation_ds": "Validation",
+    "total": "Total",
+}
+@tags("tabular_data", "time_series_data", "text_data")
+@tasks("classification", "regression", "text_classification", "text_summarization")
+def DatasetSplit(datasets: List[VMDataset]):
     """
     Evaluates and visualizes the distribution proportions among training, testing, and validation datasets of an ML
     model.
@@ -47,80 +59,43 @@ class DatasetSplit(Metric):
     - Potential lack of compatibility with more complex modes of data splitting (for example, stratified or time-based
     splits) could limit the applicability of this test.
     """
-    name = "dataset_split"
-    required_inputs = ["datasets"]
-    tasks = [
-        "classification",
-        "regression",
-        "text_classification",
-        "text_summarization",
-    ]
-    tags = ["tabular_data", "time_series_data", "text_data"]
-    dataset_labels = {
-        "train_ds": "Training",
-        "test_ds": "Test",
-        "validation_ds": "Validation",
-        "total": "Total",
-    }
-    def summary(self, raw_results):
-        """
-        Returns a summarized representation of the dataset split information
-        """
-        table_records = []
-        for key, value in raw_results.items():
-            if key.endswith("_size"):
-                dataset_name = key.replace("_size", "")
-                if dataset_name == "total":
-                    table_records.append(
-                        {
-                            "Dataset": "Total",
-                            "Size": value,
-                            "Proportion": "100%",
-                        }
-                    )
-                    continue
-                proportion = raw_results[f"{dataset_name}_proportion"] * 100
-                table_records.append(
+    results = {}
+    total_size = 0
+    # First calculate the total size of the dataset
+    for dataset in datasets:
+        if dataset is not None:
+            total_size += len(dataset.df)
+    # Then calculate the proportion of each dataset
+    for dataset in datasets:
+        if dataset is not None:
+            results[f"{dataset.input_id}_size"] = len(dataset.df)
+            results[f"{dataset.input_id}_proportion"] = len(dataset.df) / total_size
+    results["total_size"] = total_size
+    table = []
+    for key, value in results.items():
+        if key.endswith("_size"):
+            dataset_name = key.replace("_size", "")
+            if dataset_name == "total":
+                table.append(
                     {
-                        "Dataset": dataset_name,  # DatasetSplit.dataset_labels[dataset_name],
+                        "Dataset": "Total",
                         "Size": value,
-                        "Proportion": f"{proportion:.2f}%",
+                        "Proportion": "100%",
                     }
                 )
-        return ResultSummary(results=[ResultTable(data=table_records)])
-    def run(self):
-        # Try to extract metrics from each available dataset
-        available_datasets = self.inputs.datasets
-        results = {}
-        total_size = 0
-        # First calculate the total size of the dataset
-        for dataset in available_datasets:
-            if dataset is not None:
-                total_size += len(dataset.df)
-        # Then calculate the proportion of each dataset
-        for dataset in available_datasets:
-            if dataset is not None:
-                results[f"{dataset.input_id}_size"] = len(dataset.df)
-                results[f"{dataset.input_id}_proportion"] = len(dataset.df) / total_size
-        results["total_size"] = total_size
-        return self.cache_results(results)
-    def test(self):
-        """Unit Test for DatasetSplit Metric"""
-        assert self.result is not None
-        assert self.result.metric is not None
-        assert isinstance(self.result.metric.value, dict)
-        assert self.result.figures is None
+                continue
+            proportion = results[f"{dataset_name}_proportion"] * 100
+            table.append(
+                {
+                    "Dataset": dataset_name,  # DatasetSplit.dataset_labels[dataset_name],
+                    "Size": value,
+                    "Proportion": f"{proportion:.2f}%",
+                }
+            )
+    return table

validmind/tests/data_validation/DescriptiveStatistics.py CHANGED Viewed

@@ -2,16 +2,51 @@
 # See the LICENSE file in the root of this repository for details.
 # SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
-from dataclasses import dataclass
 import pandas as pd
+from validmind import tags, tasks
+from validmind.errors import SkipTestError
 from validmind.utils import format_records
-from validmind.vm_models import Metric, ResultSummary, ResultTable, ResultTableMetadata
+from validmind.vm_models import VMDataset
+def get_summary_statistics_numerical(df, numerical_fields):
+    percentiles = [0.25, 0.5, 0.75, 0.90, 0.95]
+    summary_stats = df[numerical_fields].describe(percentiles=percentiles).T
+    summary_stats = summary_stats[
+        ["count", "mean", "std", "min", "25%", "50%", "75%", "90%", "95%", "max"]
+    ]
+    summary_stats.columns = summary_stats.columns.str.title()
+    summary_stats.reset_index(inplace=True)
+    summary_stats.rename(columns={"index": "Name"}, inplace=True)
+    return summary_stats
+def get_summary_statistics_categorical(df, categorical_fields):
+    summary_stats = pd.DataFrame()
+    for column in df[categorical_fields].columns:
+        top_value = df[column].value_counts().idxmax()
+        top_freq = df[column].value_counts().max()
+        summary_stats.loc[column, "Count"] = df[column].count()
+        summary_stats.loc[column, "Number of Unique Values"] = df[column].nunique()
+        summary_stats.loc[column, "Top Value"] = top_value
+        summary_stats.loc[column, "Top Value Frequency"] = top_freq
+        summary_stats.loc[column, "Top Value Frequency %"] = (
+            top_freq / df[column].count()
+        ) * 100
-@dataclass
-class DescriptiveStatistics(Metric):
+    summary_stats.reset_index(inplace=True)
+    summary_stats.rename(columns={"index": "Name"}, inplace=True)
+    return summary_stats
+@tags("tabular_data", "time_series_data")
+@tasks("classification", "regression")
+def DescriptiveStatistics(dataset: VMDataset):
     """
     Performs a detailed descriptive statistical analysis of both numerical and categorical data within a model's
     dataset.
@@ -57,84 +92,23 @@ class DescriptiveStatistics(Metric):
     - Should be used in conjunction with other statistical tests to provide a comprehensive understanding of the
     model's data.
     """
-    name = "descriptive_statistics"
-    required_inputs = ["dataset"]
-    tasks = ["classification", "regression"]
-    tags = ["tabular_data", "time_series_data"]
-    def get_summary_statistics_numerical(self, df, numerical_fields):
-        percentiles = [0.25, 0.5, 0.75, 0.90, 0.95]
-        summary_stats = df[numerical_fields].describe(percentiles=percentiles).T
-        summary_stats = summary_stats[
-            ["count", "mean", "std", "min", "25%", "50%", "75%", "90%", "95%", "max"]
-        ]
-        summary_stats.columns = summary_stats.columns.str.title()
-        summary_stats.reset_index(inplace=True)
-        summary_stats.rename(columns={"index": "Name"}, inplace=True)
-        return format_records(summary_stats)
-    def get_summary_statistics_categorical(self, df, categorical_fields):
-        summary_stats = pd.DataFrame()
-        for column in df[categorical_fields].columns:
-            top_value = df[column].value_counts().idxmax()
-            top_freq = df[column].value_counts().max()
-            summary_stats.loc[column, "Count"] = df[column].count()
-            summary_stats.loc[column, "Number of Unique Values"] = df[column].nunique()
-            summary_stats.loc[column, "Top Value"] = top_value
-            summary_stats.loc[column, "Top Value Frequency"] = top_freq
-            summary_stats.loc[column, "Top Value Frequency %"] = (
-                top_freq / df[column].count()
-            ) * 100
-        summary_stats.reset_index(inplace=True)
-        summary_stats.rename(columns={"index": "Name"}, inplace=True)
-        return format_records(summary_stats)
-    def summary(self, metric_value):
-        """
-        Build two tables: one for summarizing numerical variables and one for categorical variables
-        """
-        summary_stats_numerical = metric_value["numerical"]
-        summary_stats_categorical = metric_value["categorical"]
-        results = []
-        if len(summary_stats_numerical) != 0:
-            results.append(
-                ResultTable(
-                    data=summary_stats_numerical,
-                    metadata=ResultTableMetadata(title="Numerical Variables"),
-                )
-            )
-        if len(summary_stats_categorical) != 0:
-            results.append(
-                ResultTable(
-                    data=summary_stats_categorical,
-                    metadata=ResultTableMetadata(title="Categorical Variables"),
-                )
-            )
-        return ResultSummary(results=results)
-    def run(self):
-        feature_columns = self.inputs.dataset.feature_columns
-        numerical_feature_columns = self.inputs.dataset.feature_columns_numeric
-        categorical_feature_columns = self.inputs.dataset.feature_columns_categorical
-        df = self.inputs.dataset.df[feature_columns]
-        summary_stats_numerical = self.get_summary_statistics_numerical(
-            df, numerical_feature_columns
-        )
-        summary_stats_categorical = self.get_summary_statistics_categorical(
-            df, categorical_feature_columns
-        )
-        return self.cache_results(
-            {
-                "numerical": summary_stats_numerical,
-                "categorical": summary_stats_categorical,
-            }
+    tables = {}
+    summary_stats_numerical = get_summary_statistics_numerical(
+        dataset.df, dataset.feature_columns_numeric
+    )
+    if not summary_stats_numerical.empty:
+        tables["Numerical Variables"] = format_records(summary_stats_numerical)
+    summary_stats_categorical = get_summary_statistics_categorical(
+        dataset.df, dataset.feature_columns_categorical
+    )
+    if not summary_stats_categorical.empty:
+        tables["Categorical Variables"] = format_records(summary_stats_categorical)
+    if not tables:
+        raise SkipTestError(
+            "No numerical or categorical variables found in the dataset."
         )
+    return tables

validmind/tests/data_validation/{DFGLSArch.py → DickeyFullerGLS.py} RENAMED Viewed

@@ -2,20 +2,21 @@
 # See the LICENSE file in the root of this repository for details.
 # SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
-from dataclasses import dataclass
 import pandas as pd
 from arch.unitroot import DFGLS
 from numpy.linalg import LinAlgError
+from validmind import tags, tasks
+from validmind.errors import SkipTestError
 from validmind.logging import get_logger
-from validmind.vm_models import Metric, ResultSummary, ResultTable, ResultTableMetadata
+from validmind.vm_models import VMDataset
 logger = get_logger(__name__)
-@dataclass
-class DFGLSArch(Metric):
+@tags("time_series_data", "forecasting", "unit_root_test")
+@tasks("regression")
+def DickeyFullerGLS(dataset: VMDataset):
     """
     Assesses stationarity in time series data using the Dickey-Fuller GLS test to determine the order of integration.
@@ -56,77 +57,44 @@ class DFGLSArch(Metric):
     - The test also presents challenges when dealing with shorter time series data or volatile data, not producing
     reliable results in these cases.
     """
+    df = dataset.df.dropna()
-    name = "dickey_fuller_gls"
-    required_inputs = ["dataset"]
-    tasks = ["regression"]
-    tags = ["time_series_data", "forecasting", "unit_root_test"]
-    def run(self):
-        """
-        Calculates Dickey-Fuller GLS metric for each of the dataset features
-        """
-        dataset = self.inputs.dataset.df
-        # Check if the dataset is a time series
-        if not isinstance(dataset.index, (pd.DatetimeIndex, pd.PeriodIndex)):
-            raise ValueError(
-                "Dataset index must be a datetime or period index for time series analysis."
-            )
+    if not isinstance(df.index, (pd.DatetimeIndex, pd.PeriodIndex)):
+        raise SkipTestError(
+            "Dataset index must be a datetime or period index for time series analysis."
+        )
-        # Preprocessing: Drop rows with any NaN values
-        if dataset.isnull().values.any():
-            logger.warning(
-                "Dataset contains missing values. Rows with NaNs will be dropped."
+    df = df.apply(pd.to_numeric, errors="coerce")
+    dfgls_values = []
+    for col in df.columns:
+        try:
+            dfgls_out = DFGLS(df[col].values)
+            dfgls_values.append(
+                {
+                    "Variable": col,
+                    "stat": dfgls_out.stat,
+                    "pvalue": dfgls_out.pvalue,
+                    "usedlag": dfgls_out.lags,
+                    "nobs": dfgls_out.nobs,
+                }
             )
-            dataset = dataset.dropna()
-        # Convert to numeric and handle non-numeric data
-        dataset = dataset.apply(pd.to_numeric, errors="coerce")
-        # Initialize a list to store DFGLS results
-        dfgls_values = []
-        for col in dataset.columns:
-            try:
-                dfgls_out = DFGLS(dataset[col].values)
-                dfgls_values.append(
-                    {
-                        "Variable": col,
-                        "stat": dfgls_out.stat,
-                        "pvalue": dfgls_out.pvalue,
-                        "usedlag": dfgls_out.lags,
-                        "nobs": dfgls_out.nobs,
-                    }
-                )
-            except LinAlgError as e:
-                logger.error(
-                    f"SVD did not converge while processing column '{col}'. This could be due to numerical instability or multicollinearity. Error details: {e}"
-                )
-                dfgls_values.append(
-                    {
-                        "Variable": col,
-                        "stat": None,
-                        "pvalue": None,
-                        "usedlag": None,
-                        "nobs": None,
-                        "error": str(e),
-                    }
-                )
-        return self.cache_results({"dfgls_results": dfgls_values})
-    def summary(self, metric_value):
-        """
-        Build a table for summarizing the DFGLS results
-        """
-        dfgls_results = metric_value["dfgls_results"]
-        return ResultSummary(
-            results=[
-                ResultTable(
-                    data=dfgls_results,
-                    metadata=ResultTableMetadata(title="DFGLS Test Results"),
-                )
-            ]
-        )
+        except LinAlgError as e:
+            logger.error(
+                f"SVD did not converge while processing column '{col}'. This could be due to numerical instability or multicollinearity. Error details: {e}"
+            )
+            dfgls_values.append(
+                {
+                    "Variable": col,
+                    "stat": None,
+                    "pvalue": None,
+                    "usedlag": None,
+                    "nobs": None,
+                    "error": str(e),
+                }
+            )
+    return {
+        "DFGLS Test Results": dfgls_values,
+    }

validmind/tests/data_validation/Duplicates.py CHANGED Viewed

@@ -2,22 +2,14 @@
 # See the LICENSE file in the root of this repository for details.
 # SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
-from dataclasses import dataclass
-from typing import List
 import pandas as pd
-from validmind.vm_models import (
-    ResultSummary,
-    ResultTable,
-    ResultTableMetadata,
-    ThresholdTest,
-    ThresholdTestResult,
-)
+from validmind import tags, tasks
-@dataclass
-class Duplicates(ThresholdTest):
+@tags("tabular_data", "data_quality", "text_data")
+@tasks("classification", "regression")
+def Duplicates(dataset, min_threshold=1):
     """
     Tests dataset for duplicate entries, ensuring model reliability via data quality verification.
@@ -59,82 +51,21 @@ class Duplicates(ThresholdTest):
     for very large datasets.
     - Can only check for exact duplicates and may miss semantically similar information packaged differently.
     """
+    df = dataset.df[dataset.text_column or dataset.feature_columns]
+    duplicate_rows_count = df.duplicated().sum()
+    percentage_duplicate_rows = (duplicate_rows_count / len(df)) * 100
+    result_df = pd.DataFrame(
+        {
+            "Number of Duplicates": [duplicate_rows_count],
+            "Percentage of Rows (%)": [percentage_duplicate_rows],
+        }
+    )
+    # test has passed if the total sum of duplicates is less than the threshold
+    passed = result_df["Number of Duplicates"].sum() < min_threshold
-    name = "duplicates"
-    required_inputs = ["dataset"]
-    default_params = {"min_threshold": 1}
-    tasks = ["classification", "regression"]
-    tags = ["tabular_data", "data_quality", "text_data"]
-    def summary(self, results: List[ThresholdTestResult], all_passed: bool):
-        """
-        The duplicates test returns results like these:
-        [{"values": {"n_duplicates": 0, "p_duplicates": 0.0}, "passed": true}]
-        So we build a table with 1 row and show number of duplicates and percentage of duplicates.
-        """
-        result = results[0]
-        results_table = [{k: v for k, v in row.items()} for row in result.values]
-        return ResultSummary(
-            results=[
-                ResultTable(
-                    data=results_table,
-                    metadata=ResultTableMetadata(
-                        title="Duplicate Rows Results for Dataset"
-                    ),
-                )
-            ]
-        )
-    def run(self):
-        if self.inputs.dataset.text_column:
-            columns = self.inputs.dataset.text_column
-        else:
-            columns = self.inputs.dataset.feature_columns
-        df = self.inputs.dataset.df[columns]
-        # Find duplicate rows
-        duplicate_rows = df.duplicated()
-        # Calculate number of duplicate rows
-        duplicate_rows_count = duplicate_rows.sum()
-        # Calculate total number of rows
-        total_rows = len(df)
-        # Calculate percentage of duplicate rows
-        percentage_duplicate_rows = (duplicate_rows_count / total_rows) * 100
-        # Create a DataFrame with results
-        result_df = pd.DataFrame(
-            {
-                "Number of Duplicates": [duplicate_rows_count],
-                "Percentage of Rows (%)": [percentage_duplicate_rows],
-            }
-        )
-        # test has passed if the total sum of duplicates is less than the threshold
-        n_duplicates = result_df["Number of Duplicates"].sum()
-        passed = n_duplicates < self.params["min_threshold"]
-        results = [
-            ThresholdTestResult(
-                passed=passed,
-                values=result_df.to_dict(orient="records"),
-            )
-        ]
-        return self.cache_results(results, passed=all([r.passed for r in results]))
-    def test(self):
-        # Check that result object is not None
-        assert self.result is not None
-        # Check that we have a list of test results
-        assert isinstance(self.result.test_results.results, list)
-        # Check if the 'passed' variable in results reflects the test correctly
-        for result in self.result.test_results.results[1:]:
-            assert result.passed == (
-                result.values["n_duplicates"] < self.params["min_threshold"]
-            )
-        expected_results_count = 1
-        assert len(self.result.test_results.results) == expected_results_count
+    return {
+        "Duplicate Rows Results for Dataset": result_df.to_dict(orient="records")
+    }, passed

validmind 2.5.25__py3-none-any.whl → 2.6.8__py3-none-any.whl

validmind 2.5.25py3-none-any.whl → 2.6.8py3-none-any.whl