PyPI - validmind - Versions diffs - 2.1.1__py3-none-any.whl → 2.2.4__py3-none-any.whl - Mend

validmind 2.1.1py3-none-any.whl → 2.2.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (113) hide show

validmind/__version__.py +1 -1
validmind/ai.py +72 -49
validmind/api_client.py +42 -16
validmind/client.py +68 -25
validmind/datasets/llm/rag/__init__.py +11 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_1.csv +30 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_2.csv +30 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_3.csv +53 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_4.csv +53 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_5.csv +53 -0
validmind/datasets/llm/rag/rfp.py +41 -0
validmind/errors.py +1 -1
validmind/html_templates/__init__.py +0 -0
validmind/html_templates/content_blocks.py +89 -14
validmind/models/__init__.py +7 -4
validmind/models/foundation.py +8 -34
validmind/models/function.py +51 -0
validmind/models/huggingface.py +16 -46
validmind/models/metadata.py +42 -0
validmind/models/pipeline.py +66 -0
validmind/models/pytorch.py +8 -42
validmind/models/r_model.py +33 -82
validmind/models/sklearn.py +39 -38
validmind/template.py +8 -26
validmind/tests/__init__.py +43 -20
validmind/tests/data_validation/ANOVAOneWayTable.py +1 -1
validmind/tests/data_validation/ChiSquaredFeaturesTable.py +1 -1
validmind/tests/data_validation/DescriptiveStatistics.py +2 -4
validmind/tests/data_validation/Duplicates.py +1 -1
validmind/tests/data_validation/IsolationForestOutliers.py +2 -2
validmind/tests/data_validation/LaggedCorrelationHeatmap.py +1 -1
validmind/tests/data_validation/TargetRateBarPlots.py +1 -1
validmind/tests/data_validation/nlp/LanguageDetection.py +59 -0
validmind/tests/data_validation/nlp/PolarityAndSubjectivity.py +48 -0
validmind/tests/data_validation/nlp/Punctuations.py +11 -12
validmind/tests/data_validation/nlp/Sentiment.py +57 -0
validmind/tests/data_validation/nlp/Toxicity.py +45 -0
validmind/tests/decorator.py +12 -7
validmind/tests/model_validation/BertScore.py +100 -98
validmind/tests/model_validation/BleuScore.py +93 -64
validmind/tests/model_validation/ContextualRecall.py +74 -91
validmind/tests/model_validation/MeteorScore.py +86 -74
validmind/tests/model_validation/RegardScore.py +103 -121
validmind/tests/model_validation/RougeScore.py +118 -0
validmind/tests/model_validation/TokenDisparity.py +84 -121
validmind/tests/model_validation/ToxicityScore.py +109 -123
validmind/tests/model_validation/embeddings/CosineSimilarityComparison.py +96 -0
validmind/tests/model_validation/embeddings/CosineSimilarityHeatmap.py +71 -0
validmind/tests/model_validation/embeddings/EuclideanDistanceComparison.py +92 -0
validmind/tests/model_validation/embeddings/EuclideanDistanceHeatmap.py +69 -0
validmind/tests/model_validation/embeddings/PCAComponentsPairwisePlots.py +78 -0
validmind/tests/model_validation/embeddings/StabilityAnalysis.py +35 -23
validmind/tests/model_validation/embeddings/StabilityAnalysisKeyword.py +3 -0
validmind/tests/model_validation/embeddings/StabilityAnalysisRandomNoise.py +7 -1
validmind/tests/model_validation/embeddings/StabilityAnalysisSynonyms.py +3 -0
validmind/tests/model_validation/embeddings/StabilityAnalysisTranslation.py +3 -0
validmind/tests/model_validation/embeddings/TSNEComponentsPairwisePlots.py +99 -0
validmind/tests/model_validation/ragas/AnswerCorrectness.py +131 -0
validmind/tests/model_validation/ragas/AnswerRelevance.py +134 -0
validmind/tests/model_validation/ragas/AnswerSimilarity.py +119 -0
validmind/tests/model_validation/ragas/AspectCritique.py +167 -0
validmind/tests/model_validation/ragas/ContextEntityRecall.py +133 -0
validmind/tests/model_validation/ragas/ContextPrecision.py +123 -0
validmind/tests/model_validation/ragas/ContextRecall.py +123 -0
validmind/tests/model_validation/ragas/ContextRelevancy.py +114 -0
validmind/tests/model_validation/ragas/Faithfulness.py +119 -0
validmind/tests/model_validation/ragas/utils.py +66 -0
validmind/tests/model_validation/sklearn/OverfitDiagnosis.py +3 -7
validmind/tests/model_validation/sklearn/PermutationFeatureImportance.py +8 -9
validmind/tests/model_validation/sklearn/PopulationStabilityIndex.py +5 -10
validmind/tests/model_validation/sklearn/PrecisionRecallCurve.py +3 -2
validmind/tests/model_validation/sklearn/ROCCurve.py +2 -1
validmind/tests/model_validation/sklearn/RegressionR2Square.py +1 -1
validmind/tests/model_validation/sklearn/RobustnessDiagnosis.py +2 -3
validmind/tests/model_validation/sklearn/SHAPGlobalImportance.py +7 -11
validmind/tests/model_validation/sklearn/WeakspotsDiagnosis.py +3 -4
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlot.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlotLevels.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelInsampleComparison.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelOutsampleComparison.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelSummary.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelsCoeffs.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelsPerformance.py +1 -1
validmind/tests/model_validation/statsmodels/ScorecardHistogram.py +5 -6
validmind/unit_metrics/__init__.py +26 -49
validmind/unit_metrics/composite.py +13 -7
validmind/unit_metrics/regression/sklearn/AdjustedRSquaredScore.py +1 -1
validmind/utils.py +99 -6
validmind/vm_models/__init__.py +1 -1
validmind/vm_models/dataset/__init__.py +7 -0
validmind/vm_models/dataset/dataset.py +560 -0
validmind/vm_models/dataset/utils.py +146 -0
validmind/vm_models/model.py +97 -72
validmind/vm_models/test/metric.py +9 -24
validmind/vm_models/test/result_wrapper.py +124 -28
validmind/vm_models/test/threshold_test.py +10 -28
validmind/vm_models/test_context.py +1 -1
validmind/vm_models/test_suite/summary.py +3 -4
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/METADATA +5 -3
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/RECORD +103 -78
validmind/models/catboost.py +0 -33
validmind/models/statsmodels.py +0 -50
validmind/models/xgboost.py +0 -30
validmind/tests/model_validation/BertScoreAggregate.py +0 -90
validmind/tests/model_validation/RegardHistogram.py +0 -148
validmind/tests/model_validation/RougeMetrics.py +0 -147
validmind/tests/model_validation/RougeMetricsAggregate.py +0 -133
validmind/tests/model_validation/SelfCheckNLIScore.py +0 -112
validmind/tests/model_validation/ToxicityHistogram.py +0 -136
validmind/vm_models/dataset.py +0 -1303
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/LICENSE +0 -0
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/WHEEL +0 -0
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/entry_points.txt +0 -0

validmind/template.py CHANGED Viewed

@@ -2,20 +2,15 @@
 # See the LICENSE file in the root of this repository for details.
 # SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
-from pprint import pformat
-import mistune
-from IPython.display import display
 from ipywidgets import HTML, Accordion, VBox
 from .html_templates.content_blocks import (
     failed_content_block_html,
     non_test_content_block_html,
-    test_content_block_html,
 )
 from .logging import get_logger
 from .tests import LoadTestError, describe_test
-from .utils import is_notebook
+from .utils import display, is_notebook
 from .vm_models import TestSuite
 logger = get_logger(__name__)
@@ -26,6 +21,7 @@ CONTENT_TYPE_MAP = {
     "metadata_text": "Metadata Text",
     "dynamic": "Dynamic Content",
     "text": "Text",
+    "risk_assessment": "Risk Assessment",
 }
@@ -66,29 +62,12 @@ def _create_content_widget(content):
         )
     try:
-        test_deets = describe_test(test_id=content["content_id"], raw=True)
+        test_html = describe_test(test_id=content["content_id"], show=False)
     except LoadTestError:
         return HTML(failed_content_block_html.format(test_id=content["content_id"]))
     return Accordion(
-        children=[
-            HTML(
-                test_content_block_html.format(
-                    title=test_deets["Name"],
-                    description=mistune.html(test_deets["Description"]),
-                    required_inputs=", ".join(
-                        test_deets["Required Inputs"] or ["None"]
-                    ),
-                    params_table="\n".join(
-                        [
-                            f"<tr><td>{param}</td><td>{pformat(value, indent=4)}</td></tr>"
-                            for param, value in test_deets["Params"].items()
-                        ]
-                    ),
-                    table_display="table" if test_deets["Params"] else "none",
-                )
-            )
-        ],
+        children=[HTML(test_html)],
         titles=[f"{content_type} Block: '{content['content_id']}'"],
     )
@@ -117,7 +96,10 @@ def _create_sub_section_widget(sub_sections, section_number):
                 contents_widget,
             )
         else:
-            accordion.children = (*accordion.children, HTML("<p>Empty Section</p>"))
+            accordion.children = (
+                *accordion.children,
+                HTML("<p>Empty Section</p>"),
+            )
         accordion.set_title(
             i, f"{section_number}.{i + 1}. {section['title']} ('{section['id']}')"

validmind/tests/__init__.py CHANGED Viewed

@@ -6,22 +6,29 @@
 import importlib
 import inspect
+import json
 import sys
 from pathlib import Path
 from pprint import pformat
 from typing import Dict
+from uuid import uuid4
-import mistune
 import pandas as pd
-from IPython.display import display
-from ipywidgets import HTML
+from ipywidgets import HTML, Accordion
 from ..errors import LoadTestError
 from ..html_templates.content_blocks import test_content_block_html
 from ..logging import get_logger
 from ..unit_metrics import run_metric
 from ..unit_metrics.composite import load_composite_metric
-from ..utils import format_dataframe, fuzzy_match, test_id_to_name
+from ..utils import (
+    NumpyEncoder,
+    display,
+    format_dataframe,
+    fuzzy_match,
+    md_to_html,
+    test_id_to_name,
+)
 from ..vm_models import TestContext, TestInput
 from .decorator import metric, tags, tasks
 from .test_providers import LocalTestProvider, TestProvider
@@ -75,10 +82,12 @@ def _pretty_list_tests(tests, truncate=True):
     table = [
         {
-            "Test Type": __test_classes[test_id].test_type,
+            "ID": test_id,
             "Name": test_id_to_name(test_id),
+            "Test Type": __test_classes[test_id].test_type,
             "Description": _test_description(__test_classes[test_id], truncate),
-            "ID": test_id,
+            "Required Inputs": __test_classes[test_id].required_inputs,
+            "Params": __test_classes[test_id].default_params or {},
         }
         for test_id in tests
     ]
@@ -339,7 +348,7 @@ def load_test(test_id: str, reload=False):
     return test
-def describe_test(test_id: str = None, raw: bool = False):
+def describe_test(test_id: str = None, raw: bool = False, show: bool = True):
     """Get or show details about the test
     This function can be used to see test details including the test name, description,
@@ -365,20 +374,34 @@ def describe_test(test_id: str = None, raw: bool = False):
     if raw:
         return details
+    html = test_content_block_html.format(
+        test_id=test_id,
+        uuid=str(uuid4()),
+        title=f'{details["Name"]}',
+        description=md_to_html(details["Description"].strip()),
+        required_inputs=", ".join(details["Required Inputs"] or ["None"]),
+        params_table="\n".join(
+            [
+                f"<tr><td>{param}</td><td>{pformat(value, indent=4)}</td></tr>"
+                for param, value in details["Params"].items()
+            ]
+        ),
+        table_display="table" if details["Params"] else "none",
+        example_inputs=json.dumps(
+            {name: f"my_vm_{name}" for name in (details["Required Inputs"] or [])},
+            indent=4,
+        ),
+        example_params=json.dumps(details["Params"] or {}, indent=4, cls=NumpyEncoder),
+        instructions_display="block" if show else "none",
+    )
+    if not show:
+        return html
     display(
-        HTML(
-            test_content_block_html.format(
-                title=f'{details["Name"]}',
-                description=mistune.html(details["Description"].strip()),
-                required_inputs=", ".join(details["Required Inputs"] or ["None"]),
-                params_table="\n".join(
-                    [
-                        f"<tr><td>{param}</td><td>{pformat(value, indent=4)}</td></tr>"
-                        for param, value in details["Params"].items()
-                    ]
-                ),
-                table_display="table" if details["Params"] else "none",
-            )
+        Accordion(
+            children=[HTML(html)],
+            titles=[f"Test Description: {details['Name']} ('{test_id}')"],
         )
     )

validmind/tests/data_validation/ANOVAOneWayTable.py CHANGED Viewed

@@ -74,7 +74,7 @@ class ANOVAOneWayTable(Metric):
         # Select all numerical features if none are specified
         if features is None:
-            features = self.inputs.dataset.get_numeric_features_columns()
+            features = self.inputs.dataset.feature_columns_numeric
         anova_results = self.anova_numerical_features(features, p_threshold)

validmind/tests/data_validation/ChiSquaredFeaturesTable.py CHANGED Viewed

@@ -72,7 +72,7 @@ class ChiSquaredFeaturesTable(Metric):
         # Ensure cat_features is provided
         if not cat_features:
-            cat_features = self.inputs.dataset.get_categorical_features_columns()
+            cat_features = self.inputs.dataset.feature_columns_categorical
         df = self.inputs.dataset.df

validmind/tests/data_validation/DescriptiveStatistics.py CHANGED Viewed

@@ -116,10 +116,8 @@ class DescriptiveStatistics(Metric):
     def run(self):
         feature_columns = self.inputs.dataset.feature_columns
-        numerical_feature_columns = self.inputs.dataset.get_numeric_features_columns()
-        categorical_feature_columns = (
-            self.inputs.dataset.get_categorical_features_columns()
-        )
+        numerical_feature_columns = self.inputs.dataset.feature_columns_numeric
+        categorical_feature_columns = self.inputs.dataset.feature_columns_categorical
         df = self.inputs.dataset.df[feature_columns]

validmind/tests/data_validation/Duplicates.py CHANGED Viewed

@@ -84,7 +84,7 @@ class Duplicates(ThresholdTest):
         if self.inputs.dataset.text_column:
             columns = self.inputs.dataset.text_column
         else:
-            columns = self.inputs.dataset.get_features_columns()
+            columns = self.inputs.dataset.feature_columns
         df = self.inputs.dataset.df[columns]
         # Find duplicate rows

validmind/tests/data_validation/IsolationForestOutliers.py CHANGED Viewed

@@ -64,13 +64,13 @@ class IsolationForestOutliers(Metric):
     def run(self):
         if self.params["features_columns"] is None:
-            features_list = self.inputs.dataset.get_features_columns()
+            features_list = self.inputs.dataset.feature_columns
         else:
             features_list = self.params["features_columns"]
         # Check if all elements from features_list are present in the feature columns
         all_present = all(
-            elem in self.inputs.dataset.get_features_columns() for elem in features_list
+            elem in self.inputs.dataset.feature_columns for elem in features_list
         )
         if not all_present:
             raise ValueError(

validmind/tests/data_validation/LaggedCorrelationHeatmap.py CHANGED Viewed

@@ -115,7 +115,7 @@ class LaggedCorrelationHeatmap(Metric):
         else:
             target_col = self.inputs.dataset.target_column
-        independent_vars = list(self.inputs.dataset.get_features_columns())
+        independent_vars = list(self.inputs.dataset.feature_columns)
         num_lags = self.params.get("num_lags", 10)
         if isinstance(target_col, list) and len(target_col) == 1:

validmind/tests/data_validation/TargetRateBarPlots.py CHANGED Viewed

@@ -57,7 +57,7 @@ class TargetRateBarPlots(Metric):
         # Use all categorical features if columns is not specified, else use selected columns
         if columns is None:
-            features = self.inputs.dataset.get_categorical_features_columns()
+            features = self.inputs.dataset.feature_columns_categorical
         else:
             features = columns

validmind/tests/data_validation/nlp/LanguageDetection.py ADDED Viewed

@@ -0,0 +1,59 @@
+# Copyright © 2023-2024 ValidMind Inc. All rights reserved.
+# See the LICENSE file in the root of this repository for details.
+# SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
+"""
+Metrics functions for any Pandas-compatible datasets
+"""
+import plotly.express as px
+from langdetect import LangDetectException, detect
+from validmind import tags, tasks
+@tags("nlp", "text_data", "visualization")
+@tasks("text_classification", "text_summarization")
+def LanguageDetection(dataset):
+    """
+    Detects the language of each text entry in a dataset and visualizes the distribution of languages
+    as a histogram.
+    This method checks for a specified text column in the dataset's dataframe, uses a language detection
+    library to determine the language of each text entry, and returns a histogram plot of the language
+    distribution.
+    Args:
+        dataset (Dataset): A dataset object which must have a `df` attribute (a pandas DataFrame)
+            and a `text_column` attribute indicating the name of the column containing text. If the
+            `text_column` attribute is not set, a ValueError is raised.
+    Returns:
+        plotly.graph_objs._figure.Figure: A Plotly histogram plot showing the distribution of detected
+        languages across the dataset's text entries.
+    Raises:
+        ValueError: If the `text_column` is not specified in the dataset object.
+    """
+    # check text column
+    if not dataset.text_column:
+        raise ValueError("Please set text_column name in the Validmind Dataset object")
+    # Function to detect language
+    def detect_language(text):
+        try:
+            return detect(text)
+        except LangDetectException:
+            return "Unknown"  # Return 'Unknown' if language detection fails
+    # Applying the language detection function to each text entry
+    languages = dataset.df[dataset.text_column].apply(detect_language)
+    fig = px.histogram(
+        languages,
+        x=languages,
+        title="Language Distribution",
+        labels={"x": "Language Codes"},
+    )
+    return fig

validmind/tests/data_validation/nlp/PolarityAndSubjectivity.py ADDED Viewed

@@ -0,0 +1,48 @@
+# Copyright © 2023-2024 ValidMind Inc. All rights reserved.
+# See the LICENSE file in the root of this repository for details.
+# SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
+import pandas as pd
+import plotly.express as px
+from textblob import TextBlob
+from validmind import tags, tasks
+@tags("data_validation")
+@tasks("nlp")
+def PolarityAndSubjectivity(dataset):
+    """
+    Analyzes the polarity and subjectivity of text data within a dataset.
+    This method processes a dataset containing textual data to compute the polarity and
+    subjectivity scores using TextBlob, and returns a Plotly scatter plot visualizing
+    these scores.
+    Args:
+        dataset (Dataset): A dataset object which must have a `df` attribute (a pandas DataFrame)
+            and a `text_column` attribute indicating the name of the column containing text.
+    Returns:
+        plotly.graph_objs._figure.Figure: A Plotly scatter plot of polarity vs subjectivity.
+    """
+    # Function to calculate sentiment and subjectivity
+    def analyze_sentiment(text):
+        analysis = TextBlob(text)
+        return analysis.sentiment.polarity, analysis.sentiment.subjectivity
+    data = pd.DataFrame()
+    # Apply the function to each row
+    data[["polarity", "subjectivity"]] = dataset.df[dataset.text_column].apply(
+        lambda x: pd.Series(analyze_sentiment(x))
+    )
+    # Create a Plotly scatter plot
+    fig = px.scatter(
+        data, x="polarity", y="subjectivity", title="Polarity vs Subjectivity"
+    )
+    fig.update_traces(textposition="top center")
+    fig.update_layout(xaxis_title="Polarity", yaxis_title="Subjectivity")
+    return fig

validmind/tests/data_validation/nlp/Punctuations.py CHANGED Viewed

@@ -72,25 +72,24 @@ class Punctuations(Metric):
         text_column = self.inputs.dataset.text_column
         corpus = create_corpus(self.inputs.dataset.df, text_column=text_column)
-        dic = defaultdict(int)
         special = string.punctuation
+        dic = defaultdict(int, {key: 0 for key in special})
         for i in corpus:
             if i in special:
                 dic[i] += 1
+        figures = []
+        # if dic:
         fig = plt.figure()
         x, y = zip(*dic.items())
         plt.bar(x, y, color="#17C37B")
+        figures.append(
+            Figure(
+                for_object=self,
+                key=self.key,
+                figure=fig,
+            )
+        )
         # Do this if you want to prevent the figure from being displayed
         plt.close("all")
-        return self.cache_results(
-            figures=[
-                Figure(
-                    for_object=self,
-                    key=self.key,
-                    figure=fig,
-                )
-            ]
-        )
+        return self.cache_results(figures=figures)

validmind/tests/data_validation/nlp/Sentiment.py ADDED Viewed

@@ -0,0 +1,57 @@
+# Copyright © 2023-2024 ValidMind Inc. All rights reserved.
+# See the LICENSE file in the root of this repository for details.
+# SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
+import matplotlib.pyplot as plt
+import nltk
+import seaborn as sns
+from nltk.sentiment import SentimentIntensityAnalyzer
+from validmind import tags, tasks
+@tags("data_validation")
+@tasks("nlp")
+def Sentiment(dataset):
+    """
+    Analyzes the sentiment of text data within a dataset using the VADER sentiment analysis tool.
+    This method initializes the VADER SentimentIntensityAnalyzer and applies it to each text entry
+    in the specified column of the dataset's dataframe. It returns a KDE plot visualizing the distribution
+    of sentiment scores across the dataset.
+    Args:
+        dataset (Dataset): A dataset object which must have a `df` attribute (a pandas DataFrame)
+            and a `text_column` attribute indicating the name of the column containing text.
+    Returns:
+        matplotlib.figure.Figure: A KDE plot visualizing the distribution of sentiment scores.
+    """
+    nltk.download("vader_lexicon", quiet=True)
+    # Initialize VADER
+    sia = SentimentIntensityAnalyzer()
+    # Function to get VADER sentiment scores
+    def get_vader_sentiment(text):
+        sentiment_score = sia.polarity_scores(text)
+        return sentiment_score["compound"]
+    # Apply the function to each row
+    vader_sentiment = dataset.df[dataset.text_column].apply(get_vader_sentiment)
+    fig = plt.figure()
+    ax = sns.kdeplot(
+        x=vader_sentiment,
+        fill=True,
+        common_norm=False,
+        palette="crest",
+        alpha=0.5,
+        linewidth=0,
+    )
+    ax.set_title(f"Sentiment score of {dataset.text_column} ")
+    ax.set_xlabel("Sentiment score")
+    plt.close("all")
+    return fig

validmind/tests/data_validation/nlp/Toxicity.py ADDED Viewed

@@ -0,0 +1,45 @@
+# Copyright © 2023-2024 ValidMind Inc. All rights reserved.
+# See the LICENSE file in the root of this repository for details.
+# SPDX-License-Identifier: AGPL-3.0 AND ValidMind Commercial
+import evaluate
+import matplotlib.pyplot as plt
+import seaborn as sns
+from validmind import tags, tasks
+@tags("data_validation")
+@tasks("nlp")
+def Toxicity(dataset):
+    """
+    Analyzes the toxicity of text data within a dataset using a pre-trained toxicity model.
+    This method loads a toxicity evaluation model and applies it to each text entry
+    in the specified column of the dataset's dataframe. It returns a KDE plot visualizing the distribution
+    of toxicity scores across the dataset.
+    Args:
+        dataset (Dataset): A dataset object which must have a `df` attribute (a pandas DataFrame)
+            and a `text_column` attribute indicating the name of the column containing text.
+    Returns:
+        matplotlib.figure.Figure: A KDE plot visualizing the distribution of toxicity scores.
+    """
+    toxicity = evaluate.load("toxicity")
+    input_text = dataset.df[dataset.text_column]
+    toxicity_scores = toxicity.compute(predictions=list(input_text.values))["toxicity"]
+    fig = plt.figure()
+    ax = sns.kdeplot(
+        x=toxicity_scores,
+        fill=True,
+        common_norm=False,
+        palette="crest",
+        alpha=0.5,
+        linewidth=0,
+    )
+    ax.set_title(f"Toxicity score of {dataset.text_column} ")
+    ax.set_xlabel("Toxicity score")
+    plt.close("all")
+    return fig

validmind/tests/decorator.py CHANGED Viewed

@@ -15,6 +15,7 @@ import pandas as pd
 from validmind.errors import MissingRequiredTestInputError
 from validmind.logging import get_logger
+from validmind.utils import get_description_metadata
 from validmind.vm_models import (
     Metric,
     MetricResult,
@@ -113,20 +114,24 @@ def _build_result(results, test_id, description, output_template, inputs):  # no
     else:
         process_item(results)
+    result_summary = ResultSummary(results=tables)
     return MetricResultWrapper(
         result_id=test_id,
         metric=MetricResult(
             key=test_id,
             ref_id=ref_id,
             value="Empty",
-            summary=ResultSummary(results=tables),
+            summary=result_summary,
         ),
         figures=figures,
         result_metadata=[
-            {
-                "content_id": f"metric_description:{test_id}",
-                "text": description,
-            }
+            get_description_metadata(
+                test_id=test_id,
+                default_description=description,
+                summary=result_summary.serialize(),
+                figures=figures,
+            )
         ],
         inputs=inputs,
         output_template=output_template,
@@ -153,7 +158,7 @@ def _get_run_method(func, inputs, params):
             test_id=self.test_id,
             description=inspect.getdoc(self),
             output_template=self.output_template,
-            inputs=list(inputs.keys()),
+            inputs=self.get_accessed_inputs(),
         )
         return self.result
@@ -264,7 +269,7 @@ def metric(func_or_id):
             {
                 "run": _get_run_method(func, inputs, params),
                 "required_inputs": list(inputs.keys()),
-                "default_parameters": params,
+                "default_params": {k: v["default"] for k, v in params.items()},
                 "__doc__": description,
                 "metadata": {
                     "task_types": tasks,

validmind 2.1.1__py3-none-any.whl → 2.2.4__py3-none-any.whl

validmind 2.1.1py3-none-any.whl → 2.2.4py3-none-any.whl