PyPI - validmind - Versions diffs - 2.5.25__py3-none-any.whl → 2.6.8__py3-none-any.whl - Mend

validmind 2.5.25py3-none-any.whl → 2.6.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (198) hide show

validmind/__init__.py +8 -17
validmind/__version__.py +1 -1
validmind/ai/test_descriptions.py +66 -85
validmind/ai/test_result_description/context.py +2 -2
validmind/ai/utils.py +26 -1
validmind/api_client.py +43 -79
validmind/client.py +5 -7
validmind/client_config.py +1 -1
validmind/datasets/__init__.py +1 -1
validmind/datasets/classification/customer_churn.py +7 -5
validmind/datasets/nlp/__init__.py +2 -2
validmind/errors.py +6 -10
validmind/html_templates/content_blocks.py +18 -16
validmind/logging.py +21 -16
validmind/tests/__init__.py +28 -5
validmind/tests/__types__.py +186 -170
validmind/tests/_store.py +7 -21
validmind/tests/comparison.py +362 -0
validmind/tests/data_validation/ACFandPACFPlot.py +44 -73
validmind/tests/data_validation/ADF.py +49 -83
validmind/tests/data_validation/AutoAR.py +59 -96
validmind/tests/data_validation/AutoMA.py +59 -96
validmind/tests/data_validation/AutoStationarity.py +66 -114
validmind/tests/data_validation/ClassImbalance.py +48 -117
validmind/tests/data_validation/DatasetDescription.py +180 -209
validmind/tests/data_validation/DatasetSplit.py +50 -75
validmind/tests/data_validation/DescriptiveStatistics.py +59 -85
validmind/tests/data_validation/{DFGLSArch.py → DickeyFullerGLS.py} +44 -76
validmind/tests/data_validation/Duplicates.py +21 -90
validmind/tests/data_validation/EngleGrangerCoint.py +53 -75
validmind/tests/data_validation/HighCardinality.py +32 -80
validmind/tests/data_validation/HighPearsonCorrelation.py +29 -97
validmind/tests/data_validation/IQROutliersBarPlot.py +63 -94
validmind/tests/data_validation/IQROutliersTable.py +40 -80
validmind/tests/data_validation/IsolationForestOutliers.py +41 -63
validmind/tests/data_validation/KPSS.py +33 -81
validmind/tests/data_validation/LaggedCorrelationHeatmap.py +47 -95
validmind/tests/data_validation/MissingValues.py +17 -58
validmind/tests/data_validation/MissingValuesBarPlot.py +61 -87
validmind/tests/data_validation/PhillipsPerronArch.py +56 -79
validmind/tests/data_validation/RollingStatsPlot.py +50 -81
validmind/tests/data_validation/SeasonalDecompose.py +102 -184
validmind/tests/data_validation/Skewness.py +27 -64
validmind/tests/data_validation/SpreadPlot.py +34 -57
validmind/tests/data_validation/TabularCategoricalBarPlots.py +46 -65
validmind/tests/data_validation/TabularDateTimeHistograms.py +23 -45
validmind/tests/data_validation/TabularNumericalHistograms.py +27 -46
validmind/tests/data_validation/TargetRateBarPlots.py +54 -93
validmind/tests/data_validation/TimeSeriesFrequency.py +48 -133
validmind/tests/data_validation/TimeSeriesHistogram.py +24 -3
validmind/tests/data_validation/TimeSeriesLinePlot.py +29 -47
validmind/tests/data_validation/TimeSeriesMissingValues.py +59 -135
validmind/tests/data_validation/TimeSeriesOutliers.py +54 -171
validmind/tests/data_validation/TooManyZeroValues.py +21 -70
validmind/tests/data_validation/UniqueRows.py +23 -62
validmind/tests/data_validation/WOEBinPlots.py +83 -109
validmind/tests/data_validation/WOEBinTable.py +28 -69
validmind/tests/data_validation/ZivotAndrewsArch.py +33 -75
validmind/tests/data_validation/nlp/CommonWords.py +49 -57
validmind/tests/data_validation/nlp/Hashtags.py +27 -49
validmind/tests/data_validation/nlp/LanguageDetection.py +7 -13
validmind/tests/data_validation/nlp/Mentions.py +32 -63
validmind/tests/data_validation/nlp/PolarityAndSubjectivity.py +89 -14
validmind/tests/data_validation/nlp/Punctuations.py +63 -47
validmind/tests/data_validation/nlp/Sentiment.py +4 -0
validmind/tests/data_validation/nlp/StopWords.py +62 -91
validmind/tests/data_validation/nlp/TextDescription.py +116 -159
validmind/tests/data_validation/nlp/Toxicity.py +12 -4
validmind/tests/decorator.py +33 -242
validmind/tests/load.py +212 -153
validmind/tests/model_validation/BertScore.py +13 -7
validmind/tests/model_validation/BleuScore.py +4 -0
validmind/tests/model_validation/ClusterSizeDistribution.py +24 -47
validmind/tests/model_validation/ContextualRecall.py +3 -0
validmind/tests/model_validation/FeaturesAUC.py +43 -74
validmind/tests/model_validation/MeteorScore.py +3 -0
validmind/tests/model_validation/RegardScore.py +5 -1
validmind/tests/model_validation/RegressionResidualsPlot.py +54 -75
validmind/tests/model_validation/embeddings/ClusterDistribution.py +10 -33
validmind/tests/model_validation/embeddings/CosineSimilarityDistribution.py +11 -29
validmind/tests/model_validation/embeddings/DescriptiveAnalytics.py +19 -31
validmind/tests/model_validation/embeddings/EmbeddingsVisualization2D.py +40 -49
validmind/tests/model_validation/embeddings/StabilityAnalysisKeyword.py +29 -15
validmind/tests/model_validation/embeddings/StabilityAnalysisRandomNoise.py +25 -11
validmind/tests/model_validation/embeddings/StabilityAnalysisSynonyms.py +28 -13
validmind/tests/model_validation/embeddings/StabilityAnalysisTranslation.py +67 -38
validmind/tests/model_validation/embeddings/utils.py +53 -0
validmind/tests/model_validation/ragas/AnswerCorrectness.py +37 -32
validmind/tests/model_validation/ragas/{AspectCritique.py → AspectCritic.py} +33 -27
validmind/tests/model_validation/ragas/ContextEntityRecall.py +44 -41
validmind/tests/model_validation/ragas/ContextPrecision.py +40 -35
validmind/tests/model_validation/ragas/ContextPrecisionWithoutReference.py +133 -0
validmind/tests/model_validation/ragas/ContextRecall.py +40 -35
validmind/tests/model_validation/ragas/Faithfulness.py +42 -30
validmind/tests/model_validation/ragas/NoiseSensitivity.py +59 -35
validmind/tests/model_validation/ragas/{AnswerRelevance.py → ResponseRelevancy.py} +52 -41
validmind/tests/model_validation/ragas/{AnswerSimilarity.py → SemanticSimilarity.py} +39 -34
validmind/tests/model_validation/sklearn/AdjustedMutualInformation.py +13 -16
validmind/tests/model_validation/sklearn/AdjustedRandIndex.py +13 -16
validmind/tests/model_validation/sklearn/ClassifierPerformance.py +51 -89
validmind/tests/model_validation/sklearn/ClusterCosineSimilarity.py +31 -61
validmind/tests/model_validation/sklearn/ClusterPerformanceMetrics.py +118 -83
validmind/tests/model_validation/sklearn/CompletenessScore.py +13 -16
validmind/tests/model_validation/sklearn/ConfusionMatrix.py +62 -94
validmind/tests/model_validation/sklearn/FeatureImportance.py +7 -8
validmind/tests/model_validation/sklearn/FowlkesMallowsScore.py +12 -15
validmind/tests/model_validation/sklearn/HomogeneityScore.py +12 -15
validmind/tests/model_validation/sklearn/HyperParametersTuning.py +23 -53
validmind/tests/model_validation/sklearn/KMeansClustersOptimization.py +60 -74
validmind/tests/model_validation/sklearn/MinimumAccuracy.py +16 -84
validmind/tests/model_validation/sklearn/MinimumF1Score.py +22 -72
validmind/tests/model_validation/sklearn/MinimumROCAUCScore.py +29 -78
validmind/tests/model_validation/sklearn/ModelsPerformanceComparison.py +52 -82
validmind/tests/model_validation/sklearn/OverfitDiagnosis.py +51 -145
validmind/tests/model_validation/sklearn/PermutationFeatureImportance.py +60 -78
validmind/tests/model_validation/sklearn/PopulationStabilityIndex.py +130 -172
validmind/tests/model_validation/sklearn/PrecisionRecallCurve.py +26 -55
validmind/tests/model_validation/sklearn/ROCCurve.py +43 -77
validmind/tests/model_validation/sklearn/RegressionPerformance.py +41 -94
validmind/tests/model_validation/sklearn/RobustnessDiagnosis.py +47 -136
validmind/tests/model_validation/sklearn/SHAPGlobalImportance.py +164 -208
validmind/tests/model_validation/sklearn/SilhouettePlot.py +54 -99
validmind/tests/model_validation/sklearn/TrainingTestDegradation.py +50 -124
validmind/tests/model_validation/sklearn/VMeasure.py +12 -15
validmind/tests/model_validation/sklearn/WeakspotsDiagnosis.py +225 -281
validmind/tests/model_validation/statsmodels/AutoARIMA.py +40 -45
validmind/tests/model_validation/statsmodels/KolmogorovSmirnov.py +22 -47
validmind/tests/model_validation/statsmodels/Lilliefors.py +17 -28
validmind/tests/model_validation/statsmodels/RegressionFeatureSignificance.py +37 -81
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlot.py +37 -105
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlotLevels.py +62 -166
validmind/tests/model_validation/statsmodels/RegressionModelSensitivityPlot.py +57 -119
validmind/tests/model_validation/statsmodels/RegressionModelSummary.py +20 -57
validmind/tests/model_validation/statsmodels/RegressionPermutationFeatureImportance.py +47 -80
validmind/tests/ongoing_monitoring/PredictionCorrelation.py +2 -0
validmind/tests/ongoing_monitoring/TargetPredictionDistributionPlot.py +4 -2
validmind/tests/output.py +120 -0
validmind/tests/prompt_validation/Bias.py +55 -98
validmind/tests/prompt_validation/Clarity.py +56 -99
validmind/tests/prompt_validation/Conciseness.py +63 -101
validmind/tests/prompt_validation/Delimitation.py +48 -89
validmind/tests/prompt_validation/NegativeInstruction.py +62 -96
validmind/tests/prompt_validation/Robustness.py +80 -121
validmind/tests/prompt_validation/Specificity.py +61 -95
validmind/tests/prompt_validation/ai_powered_test.py +2 -2
validmind/tests/run.py +314 -496
validmind/tests/test_providers.py +109 -79
validmind/tests/utils.py +91 -0
validmind/unit_metrics/__init__.py +16 -155
validmind/unit_metrics/classification/F1.py +1 -0
validmind/unit_metrics/classification/Precision.py +1 -0
validmind/unit_metrics/classification/ROC_AUC.py +1 -0
validmind/unit_metrics/classification/Recall.py +1 -0
validmind/unit_metrics/regression/AdjustedRSquaredScore.py +1 -0
validmind/unit_metrics/regression/GiniCoefficient.py +1 -0
validmind/unit_metrics/regression/HuberLoss.py +1 -0
validmind/unit_metrics/regression/KolmogorovSmirnovStatistic.py +1 -0
validmind/unit_metrics/regression/MeanAbsoluteError.py +1 -0
validmind/unit_metrics/regression/MeanAbsolutePercentageError.py +1 -0
validmind/unit_metrics/regression/MeanBiasDeviation.py +1 -0
validmind/unit_metrics/regression/MeanSquaredError.py +1 -0
validmind/unit_metrics/regression/QuantileLoss.py +1 -0
validmind/unit_metrics/regression/RSquaredScore.py +2 -1
validmind/unit_metrics/regression/RootMeanSquaredError.py +1 -0
validmind/utils.py +66 -17
validmind/vm_models/__init__.py +2 -17
validmind/vm_models/dataset/dataset.py +31 -4
validmind/vm_models/figure.py +7 -37
validmind/vm_models/model.py +3 -0
validmind/vm_models/result/__init__.py +7 -0
validmind/vm_models/result/result.jinja +21 -0
validmind/vm_models/result/result.py +337 -0
validmind/vm_models/result/utils.py +160 -0
validmind/vm_models/test_suite/runner.py +16 -54
validmind/vm_models/test_suite/summary.py +3 -3
validmind/vm_models/test_suite/test.py +43 -77
validmind/vm_models/test_suite/test_suite.py +8 -40
validmind-2.6.8.dist-info/METADATA +137 -0
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/RECORD +182 -189
validmind/tests/data_validation/AutoSeasonality.py +0 -190
validmind/tests/metadata.py +0 -59
validmind/tests/model_validation/embeddings/StabilityAnalysis.py +0 -176
validmind/tests/model_validation/ragas/ContextUtilization.py +0 -161
validmind/tests/model_validation/sklearn/ClusterPerformance.py +0 -80
validmind/unit_metrics/composite.py +0 -238
validmind/vm_models/test/metric.py +0 -98
validmind/vm_models/test/metric_result.py +0 -61
validmind/vm_models/test/output_template.py +0 -55
validmind/vm_models/test/result_summary.py +0 -76
validmind/vm_models/test/result_wrapper.py +0 -488
validmind/vm_models/test/test.py +0 -103
validmind/vm_models/test/threshold_test.py +0 -106
validmind/vm_models/test/threshold_test_result.py +0 -75
validmind/vm_models/test_context.py +0 -259
validmind-2.5.25.dist-info/METADATA +0 -118
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/LICENSE +0 -0
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/WHEEL +0 -0
{validmind-2.5.25.dist-info → validmind-2.6.8.dist-info}/entry_points.txt +0 -0

validmind/tests/model_validation/sklearn/SHAPGlobalImportance.py CHANGED Viewed

@@ -3,22 +3,122 @@
 # SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
 import warnings
-from dataclasses import dataclass
+from warnings import filters as _warnings_filters
 import matplotlib.pyplot as plt
 import numpy as np
 import shap
+from validmind import tags, tasks
 from validmind.errors import UnsupportedModelForSHAPError
 from validmind.logging import get_logger
 from validmind.models import CatBoostModel, SKlearnModel, StatsModelsModel
-from validmind.vm_models import Figure, Metric
+from validmind.vm_models import VMDataset, VMModel
 logger = get_logger(__name__)
-@dataclass
-class SHAPGlobalImportance(Metric):
+def select_shap_values(shap_values, class_of_interest):
+    """Selects SHAP values for binary or multiclass classification.
+    For regression models, returns the SHAP values directly as there are no classes.
+    Args:
+        shap_values: The SHAP values returned by the SHAP explainer. For multiclass
+            classification, this will be a list where each element corresponds to a class.
+            For regression, this will be a single array of SHAP values.
+        class_of_interest: The class index for which to retrieve SHAP values. If None
+            (default), the function will assume binary classification and use class 1
+            by default.
+    Returns:
+        The SHAP values for the specified class (classification) or for the regression
+        output.
+    Raises:
+        ValueError: If class_of_interest is specified and is out of bounds for the
+            number of classes.
+    """
+    if not isinstance(shap_values, list):
+        # For regression, return the SHAP values as they are
+        # TODO: shap_values is always an array of all predictions, how is the if above supposed to work?
+        # logger.info("Returning SHAP values as-is.")
+        return shap_values
+    num_classes = len(shap_values)
+    # Default to class 1 for binary classification where no class is specified
+    if num_classes == 2 and class_of_interest is None:
+        logger.debug("Using SHAP values for class 1 (positive class).")
+        return shap_values[1]
+    # Otherwise, use the specified class_of_interest
+    if (
+        class_of_interest is None
+        or class_of_interest < 0
+        or class_of_interest >= num_classes
+    ):
+        raise ValueError(
+            f"Invalid class_of_interest: {class_of_interest}. Must be between 0 and {num_classes - 1}."
+        )
+    logger.debug(f"Using SHAP values for class {class_of_interest}.")
+    return shap_values[class_of_interest]
+def generate_shap_plot(type_, shap_values, x_test):
+    """Plots two types of SHAP global importance (SHAP).
+    Args:
+        type_: The type of SHAP plot to generate. Must be "mean" or "summary".
+        shap_values: The SHAP values to plot.
+        x_test: The test data used to generate the SHAP values.
+    Returns:
+        The generated plot.
+    """
+    ax = plt.axes()
+    ax.set_facecolor("white")
+    if type_ == "mean":
+        # Calculate the mean absolute SHAP value for each feature
+        mean_abs_shap = np.abs(shap_values).mean(axis=0)
+        # Find the maximum mean absolute SHAP value
+        max_shap_value = np.max(mean_abs_shap)
+        # Normalize all SHAP values based on the top feature
+        shap_values = shap_values / max_shap_value * 100
+        shap.summary_plot(shap_values, x_test, show=False, plot_type="bar")
+        # Customize the plot using matplotlib
+        plt.xlabel("Normalized SHAP Value (Percentage)", fontsize=13)
+        plt.ylabel("Features", fontsize=13)
+        plt.title("Normalized Feature Importance", fontsize=13)
+    else:
+        shap.summary_plot(shap_values, x_test, show=False)
+    fig = plt.gcf()
+    plt.close()
+    return fig
+@tags(
+    "sklearn",
+    "binary_classification",
+    "multiclass_classification",
+    "feature_importance",
+    "visualization",
+)
+@tasks("classification", "text_classification")
+def SHAPGlobalImportance(
+    model: VMModel,
+    dataset: VMDataset,
+    kernel_explainer_samples: int = 10,
+    tree_or_linear_explainer_samples: int = 200,
+    class_of_interest: int = None,
+):
     """
     Evaluates and visualizes global feature importance using SHAP values for model explanation and risk identification.
@@ -44,7 +144,6 @@ class SHAPGlobalImportance(Metric):
     represents a Shapley value for a certain feature in a specific case. The vertical axis is denoted by the feature
     whereas the horizontal one corresponds to the Shapley value. A color gradient indicates the value of the feature,
     gradually changing from low to high. Features are systematically organized in accordance with their importance.
-    These plots are generated by the function `_generate_shap_plot()`.
     ### Signs of High Risk
@@ -64,213 +163,70 @@ class SHAPGlobalImportance(Metric):
     - High-dimensional data can convolute interpretations.
     - Associating importance with tangible real-world impact still involves a certain degree of subjectivity.
     """
-    name = "shap"
-    required_inputs = ["model", "dataset"]
-    tasks = ["classification", "text_classification"]
-    tags = [
-        "sklearn",
-        "binary_classification",
-        "multiclass_classification",
-        "feature_importance",
-        "visualization",
-    ]
-    default_params = {
-        "kernel_explainer_samples": 10,
-        "tree_or_linear_explainer_samples": 200,
-        "class_of_interest": None,
-    }
-    def _generate_shap_plot(self, type_, shap_values, x_test):
-        """
-        Plots two types of SHAP global importance (SHAP).
-        :params type: mean, summary
-        :params shap_values: a matrix
-        :params x_test:
-        """
-        plt.close("all")
-        # preserve styles
-        # mpl.rcParams["grid.color"] = "#CCC"
-        ax = plt.axes()
-        ax.set_facecolor("white")
-        summary_plot_extra_args = {}
-        if type_ == "mean":
-            # Calculate the mean absolute SHAP value for each feature
-            mean_abs_shap = np.abs(shap_values).mean(axis=0)
-            # Find the maximum mean absolute SHAP value
-            max_shap_value = np.max(mean_abs_shap)
-            # Normalize all SHAP values based on the top feature
-            shap_values = (
-                shap_values / max_shap_value * 100
-            )  # scaling factor to make the top feature 100%
-            summary_plot_extra_args = {"plot_type": "bar"}
-            shap.summary_plot(
-                shap_values, x_test, show=False, **summary_plot_extra_args
-            )
-            # Customize the plot using matplotlib
-            plt.xlabel("Normalized SHAP Value (Percentage)", fontsize=13)
-            plt.ylabel("Features", fontsize=13)
-            plt.title("Normalized Feature Importance", fontsize=13)
-        else:
-            shap.summary_plot(
-                shap_values, x_test, show=False, **summary_plot_extra_args
-            )
-        figure = plt.gcf()
-        # avoid displaying on notebooks and clears the canvas for the next plot
-        plt.close()
-        return Figure(
-            for_object=self,
-            figure=figure,
-            key=f"shap:{type_}",
-            metadata={"type": type_},
+    if not isinstance(model, SKlearnModel) or isinstance(
+        model, (CatBoostModel, StatsModelsModel)
+    ):
+        raise UnsupportedModelForSHAPError(
+            f"Model {model.class_} is not supported for SHAP importance."
         )
-    def run(self):
-        if not isinstance(self.inputs.model, SKlearnModel) or isinstance(
-            self.inputs.model, (CatBoostModel, StatsModelsModel)
-        ):
-            logger.info(f"Skiping SHAP for {self.inputs.model.library} models")
-            return
-        trained_model = self.inputs.model.model
-        model_class = self.inputs.model.class_
-        # the shap library generates a bunch of annoying warnings that we don't care about
-        warnings.filterwarnings("ignore", category=UserWarning)
-        # Any tree based model can go here
-        if (
-            model_class == "XGBClassifier"
-            or model_class == "RandomForestClassifier"
-            or model_class == "CatBoostClassifier"
-            or model_class == "DecisionTreeClassifier"
-            or model_class == "RandomForestRegressor"
-            or model_class == "GradientBoostingRegressor"
-        ):
-            explainer = shap.TreeExplainer(trained_model)
-        elif (
-            model_class == "LogisticRegression"
-            or model_class == "XGBRegressor"
-            or model_class == "LinearRegression"
-            or model_class == "LinearSVC"
-        ):
-            explainer = shap.LinearExplainer(trained_model, self.inputs.dataset.x)
-        elif model_class == "SVC":
-            # KernelExplainer is slow so we use shap.sample to speed it up
-            explainer = shap.KernelExplainer(
-                trained_model.predict,
-                shap.sample(
-                    self.inputs.dataset.x,
-                    self.params["kernel_explainer_samples"],
-                ),
-            )
-        else:
-            model_class = "<ExternalModel>" if model_class is None else model_class
-            raise UnsupportedModelForSHAPError(
-                f"Model {model_class} not supported for SHAP importance."
-            )
+    model_class = model.class_
+    # the shap library generates a bunch of annoying warnings that we don't care about
+    warnings.filterwarnings("ignore", category=UserWarning)
+    if (
+        model_class == "XGBClassifier"
+        or model_class == "RandomForestClassifier"
+        or model_class == "CatBoostClassifier"
+        or model_class == "DecisionTreeClassifier"
+        or model_class == "RandomForestRegressor"
+        or model_class == "GradientBoostingRegressor"
+    ):
+        explainer = shap.TreeExplainer(model.model)
+    elif (
+        model_class == "LogisticRegression"
+        or model_class == "XGBRegressor"
+        or model_class == "LinearRegression"
+        or model_class == "LinearSVC"
+    ):
+        explainer = shap.LinearExplainer(model.model, dataset.x)
+    elif model_class == "SVC":
         # KernelExplainer is slow so we use shap.sample to speed it up
-        if isinstance(explainer, shap.KernelExplainer):
-            shap_sample = shap.sample(
-                self.inputs.dataset.x_df(),
-                self.params["kernel_explainer_samples"],
-            )
-        else:
-            shap_sample = self.inputs.dataset.x_df().sample(
-                min(
-                    self.params["tree_or_linear_explainer_samples"],
-                    self.inputs.dataset.x_df().shape[0],
-                )
-            )
-        shap_values = explainer.shap_values(shap_sample)
-        # Select the SHAP values for the specified class (classification) or for the regression output.
-        class_of_interest = self.params["class_of_interest"]
-        shap_values = _select_shap_values(shap_values, class_of_interest)
-        figures = [
-            self._generate_shap_plot("mean", shap_values, shap_sample),
-            self._generate_shap_plot("summary", shap_values, shap_sample),
-        ]
-        # restore warnings
-        warnings.filterwarnings("default", category=UserWarning)
-        return self.cache_results(figures=figures)
-    def test(self):
-        """Unit Test for SHAP Global Importance Metric"""
-        # Verify that the result object is not None
-        assert self.result is not None
-        # Verify that there are exactly two figures in the figures list
-        assert len(self.result.figures) == 2
-        # Verify that each figure is an instance of Figure and has the correct metadata type
-        for fig_num, type_ in enumerate(["mean", "summary"], start=1):
-            assert isinstance(self.result.figures[fig_num - 1], Figure)
-            assert self.result.figures[fig_num - 1].metadata["type"] == type_
-def _select_shap_values(shap_values, class_of_interest=None):
-    """
-    Selects SHAP values for binary or multiclass classification. For regression models,
-    returns the SHAP values directly as there are no classes.
+        explainer = shap.KernelExplainer(
+            model.model.predict,
+            shap.sample(
+                dataset.x,
+                kernel_explainer_samples,
+            ),
+        )
+    else:
+        model_class = "<ExternalModel>" if model_class is None else model_class
+        raise UnsupportedModelForSHAPError(
+            f"Model {model_class} not supported for SHAP importance."
+        )
-    Parameters:
-    -----------
-    shap_values : list or numpy.ndarray
-        The SHAP values returned by the SHAP explainer. For multiclass classification,
-        this will be a list where each element corresponds to a class. For regression,
-        this will be a single array of SHAP values.
+    # KernelExplainer is slow so we use shap.sample to speed it up
+    if isinstance(explainer, shap.KernelExplainer):
+        shap_sample = shap.sample(
+            dataset.x,
+            kernel_explainer_samples,
+        )
+    else:
+        shap_sample = dataset.x_df().sample(
+            min(
+                tree_or_linear_explainer_samples,
+                dataset.x_df().shape[0],
+            )
+        )
-    class_of_interest : int, optional
-        The class index for which to retrieve SHAP values. If None (default), the function
-        will assume binary classification and use class 1 by default.
+    shap_values = explainer.shap_values(shap_sample)
+    shap_values = select_shap_values(shap_values, class_of_interest)
-    Returns:
-    --------
-    numpy.ndarray
-        The SHAP values for the specified class (classification) or for the regression output.
+    # restore warnings
+    _warnings_filters.pop(0)
-    Raises:
-    -------
-    ValueError
-        If class_of_interest is specified and is out of bounds for the number of classes.
-    """
-    # Check if we are dealing with a multiclass classification
-    if isinstance(shap_values, list):
-        num_classes = len(shap_values)
-        # Default to class 1 for binary classification
-        if num_classes == 2 and class_of_interest is None:
-            logger.info(
-                "Binary classification detected: using SHAP values for class 1 (positive class)."
-            )
-            return shap_values[1]
-        else:
-            # Multiclass classification: use the specified class_of_interest
-            if class_of_interest is not None and 0 <= class_of_interest < num_classes:
-                logger.info(
-                    f"Multiclass classification: using SHAP values for class {class_of_interest}."
-                )
-                return shap_values[class_of_interest]
-            else:
-                raise ValueError(
-                    f"Invalid class_of_interest: {class_of_interest}. Must be between 0 and {num_classes - 1}."
-                )
-    else:
-        # For regression, return the SHAP values as they are
-        # TODO: shap_values is always an array of all predictions, how is the if above supposed to work?
-        # logger.info("Regression model detected: returning SHAP values as-is.")
-        return shap_values
+    return (
+        generate_shap_plot("mean", shap_values, shap_sample),
+        generate_shap_plot("summary", shap_values, shap_sample),
+    )

validmind/tests/model_validation/sklearn/SilhouettePlot.py CHANGED Viewed

@@ -2,23 +2,17 @@
 # See the LICENSE file in the root of this repository for details.
 # SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
-from dataclasses import dataclass
 import matplotlib.pyplot as plt
 import numpy as np
 from sklearn.metrics import silhouette_samples, silhouette_score
-from validmind.vm_models import (
-    Figure,
-    Metric,
-    ResultSummary,
-    ResultTable,
-    ResultTableMetadata,
-)
+from validmind import tags, tasks
+from validmind.vm_models import VMDataset, VMModel
-@dataclass
-class SilhouettePlot(Metric):
+@tags("sklearn", "model_performance")
+@tasks("clustering")
+def SilhouettePlot(model: VMModel, dataset: VMDataset):
     """
     Calculates and visualizes Silhouette Score, assessing the degree of data point suitability to its cluster in ML
     models.
@@ -65,93 +59,54 @@ class SilhouettePlot(Metric):
     assignment nuances, so potentially relevant details may be omitted.
     - Computationally expensive for large datasets, as it requires pairwise distance computations.
     """
-    name = "silhouette_plot"
-    required_inputs = ["model", "dataset"]
-    tasks = ["clustering"]
-    tags = [
-        "sklearn",
-        "model_performance",
-    ]
-    def run(self):
-        y_pred_train = self.inputs.dataset.y_pred(self.inputs.model)
-        # Calculate the silhouette score
-        silhouette_avg = silhouette_score(
-            self.inputs.dataset.x,
-            y_pred_train,
-            metric="euclidean",
-        )
-        num_clusters = len(np.unique(y_pred_train))
-        # Calculate silhouette coefficients for each data point
-        sample_silhouette_values = silhouette_samples(
-            self.inputs.dataset.x, y_pred_train
-        )
-        # Create a silhouette plot
-        fig, ax = plt.subplots()
-        y_lower = 10
-        for i in range(num_clusters):
-            # Aggregate the silhouette scores for samples belonging to cluster i
-            ith_cluster_silhouette_values = sample_silhouette_values[y_pred_train == i]
-            ith_cluster_silhouette_values.sort()
-            size_cluster_i = ith_cluster_silhouette_values.shape[0]
-            y_upper = y_lower + size_cluster_i
-            color = plt.cm.viridis(float(i) / num_clusters)
-            ax.fill_betweenx(
-                np.arange(y_lower, y_upper),
-                0,
-                ith_cluster_silhouette_values,
-                facecolor=color,
-                edgecolor=color,
-                alpha=0.7,
-            )
-            # Label the silhouette plots with their cluster numbers at the middle
-            ax.text(-0.05, y_lower + 0.5 * size_cluster_i, str(i))
-            # Compute the new y_lower for the next plot
-            y_lower = y_upper + 10
-        ax.set_title("Silhouette Plot for Clusters")
-        ax.set_xlabel("Silhouette Coefficient Values")
-        ax.set_ylabel("Cluster Label")
-        # The vertical line represents the average silhouette score
-        ax.axvline(x=silhouette_avg, color="red", linestyle="--")
-        figures = [
-            Figure(
-                for_object=self,
-                key=self.key,
-                figure=fig,
-            )
-        ]
-        # Close the figure to prevent it from displaying
-        plt.close(fig)
-        return self.cache_results(
-            metric_value={
-                "silhouette_score": {
-                    "silhouette_score": silhouette_avg,
-                },
-            },
-            figures=figures,
+    y_pred = dataset.y_pred(model)
+    silhouette_avg = silhouette_score(
+        X=dataset.x,
+        labels=y_pred,
+        metric="euclidean",
+    )
+    # Calculate silhouette coefficients for each data point
+    sample_silhouette_values = silhouette_samples(dataset.x, y_pred)
+    # Create a silhouette plot
+    fig, ax = plt.subplots()
+    y_lower = 10
+    num_clusters = len(np.unique(y_pred))
+    for i in range(num_clusters):
+        # Aggregate the silhouette scores for samples belonging to cluster i
+        ith_cluster_silhouette_values = sample_silhouette_values[y_pred == i]
+        ith_cluster_silhouette_values.sort()
+        size_cluster_i = ith_cluster_silhouette_values.shape[0]
+        y_upper = y_lower + size_cluster_i
+        color = plt.cm.viridis(float(i) / num_clusters)
+        ax.fill_betweenx(
+            np.arange(y_lower, y_upper),
+            0,
+            ith_cluster_silhouette_values,
+            facecolor=color,
+            edgecolor=color,
+            alpha=0.7,
         )
-    def summary(self, metric_value):
-        """
-        Build one table for summarizing the Silhouette score results
-        """
-        silhouette_score = metric_value["silhouette_score"]
-        table = []
-        table.append(silhouette_score)
-        return ResultSummary(
-            results=[
-                ResultTable(
-                    data=table,
-                    metadata=ResultTableMetadata(title="Silhouette Score"),
-                ),
-            ]
-        )
+        # Label the silhouette plots with their cluster numbers at the middle
+        ax.text(-0.05, y_lower + 0.5 * size_cluster_i, str(i))
+        # Compute the new y_lower for the next plot
+        y_lower = y_upper + 10
+    ax.set_title("Silhouette Plot for Clusters")
+    ax.set_xlabel("Silhouette Coefficient Values")
+    ax.set_ylabel("Cluster Label")
+    # The vertical line represents the average silhouette score
+    ax.axvline(x=silhouette_avg, color="red", linestyle="--")
+    plt.close()
+    return [
+        {
+            "Silhouette Score": silhouette_avg,
+        },
+    ], fig

validmind 2.5.25__py3-none-any.whl → 2.6.8__py3-none-any.whl

validmind 2.5.25py3-none-any.whl → 2.6.8py3-none-any.whl