PyPI - validmind - Versions diffs - 2.1.1__py3-none-any.whl → 2.2.4__py3-none-any.whl - Mend

validmind 2.1.1py3-none-any.whl → 2.2.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (113) hide show

validmind/__version__.py +1 -1
validmind/ai.py +72 -49
validmind/api_client.py +42 -16
validmind/client.py +68 -25
validmind/datasets/llm/rag/__init__.py +11 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_1.csv +30 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_2.csv +30 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_3.csv +53 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_4.csv +53 -0
validmind/datasets/llm/rag/datasets/rfp_existing_questions_client_5.csv +53 -0
validmind/datasets/llm/rag/rfp.py +41 -0
validmind/errors.py +1 -1
validmind/html_templates/__init__.py +0 -0
validmind/html_templates/content_blocks.py +89 -14
validmind/models/__init__.py +7 -4
validmind/models/foundation.py +8 -34
validmind/models/function.py +51 -0
validmind/models/huggingface.py +16 -46
validmind/models/metadata.py +42 -0
validmind/models/pipeline.py +66 -0
validmind/models/pytorch.py +8 -42
validmind/models/r_model.py +33 -82
validmind/models/sklearn.py +39 -38
validmind/template.py +8 -26
validmind/tests/__init__.py +43 -20
validmind/tests/data_validation/ANOVAOneWayTable.py +1 -1
validmind/tests/data_validation/ChiSquaredFeaturesTable.py +1 -1
validmind/tests/data_validation/DescriptiveStatistics.py +2 -4
validmind/tests/data_validation/Duplicates.py +1 -1
validmind/tests/data_validation/IsolationForestOutliers.py +2 -2
validmind/tests/data_validation/LaggedCorrelationHeatmap.py +1 -1
validmind/tests/data_validation/TargetRateBarPlots.py +1 -1
validmind/tests/data_validation/nlp/LanguageDetection.py +59 -0
validmind/tests/data_validation/nlp/PolarityAndSubjectivity.py +48 -0
validmind/tests/data_validation/nlp/Punctuations.py +11 -12
validmind/tests/data_validation/nlp/Sentiment.py +57 -0
validmind/tests/data_validation/nlp/Toxicity.py +45 -0
validmind/tests/decorator.py +12 -7
validmind/tests/model_validation/BertScore.py +100 -98
validmind/tests/model_validation/BleuScore.py +93 -64
validmind/tests/model_validation/ContextualRecall.py +74 -91
validmind/tests/model_validation/MeteorScore.py +86 -74
validmind/tests/model_validation/RegardScore.py +103 -121
validmind/tests/model_validation/RougeScore.py +118 -0
validmind/tests/model_validation/TokenDisparity.py +84 -121
validmind/tests/model_validation/ToxicityScore.py +109 -123
validmind/tests/model_validation/embeddings/CosineSimilarityComparison.py +96 -0
validmind/tests/model_validation/embeddings/CosineSimilarityHeatmap.py +71 -0
validmind/tests/model_validation/embeddings/EuclideanDistanceComparison.py +92 -0
validmind/tests/model_validation/embeddings/EuclideanDistanceHeatmap.py +69 -0
validmind/tests/model_validation/embeddings/PCAComponentsPairwisePlots.py +78 -0
validmind/tests/model_validation/embeddings/StabilityAnalysis.py +35 -23
validmind/tests/model_validation/embeddings/StabilityAnalysisKeyword.py +3 -0
validmind/tests/model_validation/embeddings/StabilityAnalysisRandomNoise.py +7 -1
validmind/tests/model_validation/embeddings/StabilityAnalysisSynonyms.py +3 -0
validmind/tests/model_validation/embeddings/StabilityAnalysisTranslation.py +3 -0
validmind/tests/model_validation/embeddings/TSNEComponentsPairwisePlots.py +99 -0
validmind/tests/model_validation/ragas/AnswerCorrectness.py +131 -0
validmind/tests/model_validation/ragas/AnswerRelevance.py +134 -0
validmind/tests/model_validation/ragas/AnswerSimilarity.py +119 -0
validmind/tests/model_validation/ragas/AspectCritique.py +167 -0
validmind/tests/model_validation/ragas/ContextEntityRecall.py +133 -0
validmind/tests/model_validation/ragas/ContextPrecision.py +123 -0
validmind/tests/model_validation/ragas/ContextRecall.py +123 -0
validmind/tests/model_validation/ragas/ContextRelevancy.py +114 -0
validmind/tests/model_validation/ragas/Faithfulness.py +119 -0
validmind/tests/model_validation/ragas/utils.py +66 -0
validmind/tests/model_validation/sklearn/OverfitDiagnosis.py +3 -7
validmind/tests/model_validation/sklearn/PermutationFeatureImportance.py +8 -9
validmind/tests/model_validation/sklearn/PopulationStabilityIndex.py +5 -10
validmind/tests/model_validation/sklearn/PrecisionRecallCurve.py +3 -2
validmind/tests/model_validation/sklearn/ROCCurve.py +2 -1
validmind/tests/model_validation/sklearn/RegressionR2Square.py +1 -1
validmind/tests/model_validation/sklearn/RobustnessDiagnosis.py +2 -3
validmind/tests/model_validation/sklearn/SHAPGlobalImportance.py +7 -11
validmind/tests/model_validation/sklearn/WeakspotsDiagnosis.py +3 -4
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlot.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelForecastPlotLevels.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelInsampleComparison.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelOutsampleComparison.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelSummary.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelsCoeffs.py +1 -1
validmind/tests/model_validation/statsmodels/RegressionModelsPerformance.py +1 -1
validmind/tests/model_validation/statsmodels/ScorecardHistogram.py +5 -6
validmind/unit_metrics/__init__.py +26 -49
validmind/unit_metrics/composite.py +13 -7
validmind/unit_metrics/regression/sklearn/AdjustedRSquaredScore.py +1 -1
validmind/utils.py +99 -6
validmind/vm_models/__init__.py +1 -1
validmind/vm_models/dataset/__init__.py +7 -0
validmind/vm_models/dataset/dataset.py +560 -0
validmind/vm_models/dataset/utils.py +146 -0
validmind/vm_models/model.py +97 -72
validmind/vm_models/test/metric.py +9 -24
validmind/vm_models/test/result_wrapper.py +124 -28
validmind/vm_models/test/threshold_test.py +10 -28
validmind/vm_models/test_context.py +1 -1
validmind/vm_models/test_suite/summary.py +3 -4
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/METADATA +5 -3
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/RECORD +103 -78
validmind/models/catboost.py +0 -33
validmind/models/statsmodels.py +0 -50
validmind/models/xgboost.py +0 -30
validmind/tests/model_validation/BertScoreAggregate.py +0 -90
validmind/tests/model_validation/RegardHistogram.py +0 -148
validmind/tests/model_validation/RougeMetrics.py +0 -147
validmind/tests/model_validation/RougeMetricsAggregate.py +0 -133
validmind/tests/model_validation/SelfCheckNLIScore.py +0 -112
validmind/tests/model_validation/ToxicityHistogram.py +0 -136
validmind/vm_models/dataset.py +0 -1303
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/LICENSE +0 -0
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/WHEEL +0 -0
{validmind-2.1.1.dist-info → validmind-2.2.4.dist-info}/entry_points.txt +0 -0

validmind/vm_models/model.py CHANGED Viewed

@@ -7,9 +7,11 @@ Model class wrapper module
 """
 import importlib
 import inspect
-from abc import abstractmethod
+from abc import ABC, abstractmethod
 from dataclasses import dataclass
+from validmind.errors import MissingOrInvalidModelPredictFnError
 SUPPORTED_LIBRARIES = {
     "catboost": "CatBoostModel",
     "xgboost": "XGBoostModel",
@@ -17,6 +19,8 @@ SUPPORTED_LIBRARIES = {
     "statsmodels": "StatsModelsModel",
     "torch": "PyTorchModel",
     "transformers": "HFModel",
+    "function": "FunctionModel",
+    "pipeline": "PipelineModel",
     "custom": "SKlearnModel",
 }
@@ -32,6 +36,23 @@ R_MODEL_METHODS = [
 ]
+class ModelPipeline:
+    """Helper class for chaining models together
+    This shouldn't be used directly, it just gets used when chaining models with the
+    `|` operator since you can't use a list directly - you must use a type that
+    overloads the `|` operator.
+    """
+    def __init__(self, models):
+        self.models = models
+    def __or__(self, other):
+        self.models.append(other)
+        return self
 @dataclass
 class ModelAttributes:
     """
@@ -41,51 +62,67 @@ class ModelAttributes:
     architecture: str = None
     framework: str = None
     framework_version: str = None
+    language: str = None
+    @classmethod
+    def from_dict(cls, data):
+        """
+        Creates a ModelAttributes instance from a dictionary
+        """
+        return cls(
+            architecture=data.get("architecture"),
+            framework=data.get("framework"),
+            framework_version=data.get("framework_version"),
+            language=data.get("language"),
+        )
-class VMModel:
+class VMModel(ABC):
     """
     An base class that wraps a trained model instance and its associated data.
     Attributes:
-        attributes (ModelAttributes, optional): The attributes of the model. Defaults to None.
         model (object, optional): The trained model instance. Defaults to None.
-        device_type(str, optional) The device where model is trained
+        input_id (str, optional): The input ID for the model. Defaults to None.
+        attributes (ModelAttributes, optional): The attributes of the model. Defaults to None.
+        name (str, optional): The name of the model. Defaults to the class name.
     """
-    input_id: str = None
     def __init__(
         self,
         input_id: str = None,
         model: object = None,
         attributes: ModelAttributes = None,
+        name: str = None,
+        **kwargs,
     ):
-        self._model = model
-        self._input_id = input_id
-        self._attributes = attributes
+        self.model = model
+        self.input_id = input_id
-        # The device where model is trained
-        self._device_type = None
+        self.language = "Python"
+        self.library = self.__class__.__name__
+        self.library_version = "N/A"
+        self.class_ = self.__class__.__name__
-    @property
-    def attributes(self):
-        return self._attributes
+        self.name = name or self.__class__.__name__
-    @property
-    def input_id(self):
-        return self._input_id
+        self.attributes = attributes
-    @property
-    def model(self):
-        return self._model
+        # set any additional attributes passed in (likely for subclasses)
+        for key, value in kwargs.items():
+            setattr(self, key, value)
-    @property
-    def device_type(self):
-        """
-        The device where model is trained
-        """
-        return self._device_type
+        self.__post_init__()
+    def __post_init__(self):
+        """Allows child classes to add their own post-init logic"""
+        pass
+    def __or__(self, other):
+        if not isinstance(other, VMModel):
+            raise ValueError("Can only chain VMModel objects")
+        return ModelPipeline([self, other])
     def serialize(self):
         """
@@ -95,13 +132,11 @@ class VMModel:
             "attributes": self.attributes.__dict__,
         }
-    @abstractmethod
     def predict_proba(self, *args, **kwargs):
-        """
-        Predict probability for the model.
-        This is a wrapper around the model's if available
-        """
-        pass
+        """Predict probabilties - must be implemented by subclass if needed"""
+        raise MissingOrInvalidModelPredictFnError(
+            "`predict_proba()` method not implemented for this model"
+        )
     @abstractmethod
     def predict(self, *args, **kwargs):
@@ -110,42 +145,6 @@ class VMModel:
         """
         pass
-    @abstractmethod
-    def model_language(self, *args, **kwargs):
-        """
-        Programming language used to train the model. Assume Python if this
-        method is not implemented
-        """
-        pass
-    @abstractmethod
-    def model_library(self, *args, **kwargs):
-        """
-        Model framework library
-        """
-        pass
-    @abstractmethod
-    def model_library_version(self, *args, **kwargs):
-        """
-        Model framework library version
-        """
-        pass
-    @abstractmethod
-    def model_class(self, *args, **kwargs):
-        """
-        Predict method for the model. This is a wrapper around the model's
-        """
-        pass
-    @abstractmethod
-    def model_name(self, *args, **kwargs):
-        """
-        Model name
-        """
-        pass
 def has_method_with_arguments(cls, method_name, n_args):
     if not hasattr(cls, method_name):
@@ -195,11 +194,17 @@ def model_module(model):
     return module
-def get_model_class(model):
-    model_class_name = SUPPORTED_LIBRARIES.get(model_module(model), None)
+def get_model_class(model, predict_fn=None):
+    # TODO: more consistent way to determine this?!
+    if predict_fn is not None:
+        model_class_name = SUPPORTED_LIBRARIES["function"]
+    elif isinstance(model, ModelPipeline):
+        model_class_name = SUPPORTED_LIBRARIES["pipeline"]
+    else:
+        model_class_name = SUPPORTED_LIBRARIES.get(model_module(model), None)
-    if model_class_name is None:
-        raise Exception("Model library not supported")
+    if not model_class_name:
+        return None
     model_class = getattr(
         importlib.import_module("validmind.models"),
@@ -207,3 +212,23 @@ def get_model_class(model):
     )
     return model_class
+def is_model_metadata(model):
+    """
+    Checks if the model is a dictionary containing metadata about a model.
+    We want to check if the metadata dictionary contains at least the following keys:
+    - architecture
+    - language
+    """
+    if not isinstance(model, dict):
+        return False
+    if "architecture" not in model:
+        return False
+    if "language" not in model:
+        return False
+    return True

validmind/vm_models/test/metric.py CHANGED Viewed

@@ -6,15 +6,14 @@
 Class for storing ValidMind metric objects and associated
 data for display and reporting purposes
 """
-import os
 from abc import abstractmethod
 from dataclasses import dataclass
 from typing import ClassVar, List, Optional, Union
 import pandas as pd
-from ...ai import generate_description
 from ...errors import MissingCacheResultsArgumentsError
+from ...utils import get_description_metadata
 from ..figure import Figure
 from .metric_result import MetricResult
 from .result_wrapper import MetricResultWrapper
@@ -83,30 +82,16 @@ class Metric(Test):
             summary=self.summary(metric_value),
         )
-        if (
-            os.environ.get("VALIDMIND_LLM_DESCRIPTIONS_ENABLED", "false").lower()
-            == "true"
-        ):
-            revision_name = "Generated by ValidMind AI"
-            description = generate_description(
-                test_name=self.test_id,
-                test_description=self.description().splitlines()[0],
-                test_results=metric.serialize()["value"],
-                test_summary=metric.serialize()["summary"],
-                figures=figures,
-            )
-        else:
-            revision_name = "Default Description"
-            description = self.description()
-        description_metadata = {
-            "content_id": f"metric_description:{self.test_id}::{revision_name}",
-            "text": description,
-        }
         self.result = MetricResultWrapper(
             result_id=self.test_id,
-            result_metadata=[description_metadata],
+            result_metadata=[
+                get_description_metadata(
+                    test_id=self.test_id,
+                    default_description=self.description(),
+                    summary=metric.serialize()["summary"],
+                    figures=figures,
+                )
+            ],
             metric=metric,
             figures=figures,
             inputs=self.get_accessed_inputs(),

validmind/vm_models/test/result_wrapper.py CHANGED Viewed

@@ -12,20 +12,23 @@ from abc import ABC, abstractmethod
 from dataclasses import dataclass
 from typing import Dict, List, Optional, Union
-import ipywidgets as widgets
-import mistune
 import pandas as pd
-from IPython.display import display
+from ipywidgets import HTML, GridBox, Layout, VBox
 from ... import api_client
 from ...ai import DescriptionFuture
-from ...utils import NumpyEncoder, run_async, test_id_to_name
+from ...input_registry import input_registry
+from ...logging import get_logger
+from ...utils import NumpyEncoder, display, md_to_html, run_async, test_id_to_name
+from ..dataset import VMDataset
 from ..figure import Figure
 from .metric_result import MetricResult
 from .output_template import OutputTemplate
 from .result_summary import ResultSummary
 from .threshold_test_result import ThresholdTestResults
+logger = get_logger(__name__)
 async def update_metadata(content_id: str, text: str, _json: Union[Dict, List] = None):
     """
@@ -64,9 +67,9 @@ def plot_figures(figures: List[Figure]) -> None:
     plots = [figure.to_widget() for figure in figures]
     num_columns = 2 if len(figures) > 1 else 1
-    return widgets.GridBox(
+    return GridBox(
         plots,
-        layout=widgets.Layout(grid_template_columns=f"repeat({num_columns}, 1fr)"),
+        layout=Layout(grid_template_columns=f"repeat({num_columns}, 1fr)"),
     )
@@ -103,7 +106,7 @@ class ResultWrapper(ABC):
         """
         Convert a markdown string to html
         """
-        return mistune.html(description)
+        return md_to_html(description)
     def _summary_tables_to_widget(self, summary: ResultSummary):
         """
@@ -148,10 +151,59 @@ class ResultWrapper(ABC):
             )  # table.data is an orient=records dump
             if table.metadata and table.metadata.title:
-                tables.append(widgets.HTML(value=f"<h3>{table.metadata.title}</h3>"))
-            tables.append(widgets.HTML(value=summary_table))
+                tables.append(HTML(value=f"<h3>{table.metadata.title}</h3>"))
+            tables.append(HTML(value=summary_table))
         return tables
+    def _validate_section_id_for_block(self, section_id: str, position: int = None):
+        """
+        Validate the section_id exits on the template before logging. We validate
+        if the section exists and if the user provided position is within the bounds
+        of the section. When the position is None, we assume it goes to the end of the section.
+        """
+        if section_id is None:
+            return
+        api_client.reload()
+        found = False
+        client_config = api_client.client_config
+        for section in client_config.documentation_template["sections"]:
+            if section["id"] == section_id:
+                found = True
+                break
+        if not found:
+            raise ValueError(
+                f"Section with id {section_id} not found in the model's document"
+            )
+        # Check if the block already exists in the section
+        block_definition = {
+            "content_id": self.result_id,
+            "content_type": (
+                "metric" if isinstance(self, MetricResultWrapper) else "test"
+            ),
+        }
+        blocks = section.get("contents", [])
+        for block in blocks:
+            if (
+                block["content_id"] == block_definition["content_id"]
+                and block["content_type"] == block_definition["content_type"]
+            ):
+                logger.info(
+                    f"Test driven block with content_id {block_definition['content_id']} already exists in the document's section"
+                )
+                return
+        # Validate that the position is within the bounds of the section
+        if position is not None:
+            num_blocks = len(blocks)
+            if position < 0 or position > num_blocks:
+                raise ValueError(
+                    f"Invalid position {position}. Must be between 0 and {num_blocks}"
+                )
     def show(self):
         """Display the result... May be overridden by subclasses"""
         display(self.to_widget())
@@ -161,9 +213,11 @@ class ResultWrapper(ABC):
         """Log the result... Must be overridden by subclasses"""
         raise NotImplementedError
-    def log(self):
+    def log(self, section_id: str = None, position: int = None):
         """Log the result... May be overridden by subclasses"""
-        run_async(self.log_async)
+        self._validate_section_id_for_block(section_id, position)
+        run_async(self.log_async, section_id=section_id, position=position)
 @dataclass
@@ -180,9 +234,7 @@ class FailedResultWrapper(ResultWrapper):
         return f'FailedResult(result_id="{self.result_id}")'
     def to_widget(self):
-        return widgets.HTML(
-            value=f"<h3 style='color: red;'>{self.message}</h3><p>{self.error}</p>"
-        )
+        return HTML(f"<h3 style='color: red;'>{self.message}</h3><p>{self.error}</p>")
     async def log_async(self):
         pass
@@ -216,7 +268,7 @@ class MetricResultWrapper(ResultWrapper):
             return ""
         vbox_children = [
-            widgets.HTML(value=f"<h1>{test_id_to_name(self.result_id)}</h1>"),
+            HTML(value=f"<h1>{test_id_to_name(self.result_id)}</h1>"),
         ]
         if self.result_metadata:
@@ -226,9 +278,7 @@ class MetricResultWrapper(ResultWrapper):
                 self.result_metadata[0]["text"] = metric_description
             vbox_children.append(
-                widgets.HTML(
-                    value=self._markdown_description_to_html(metric_description)
-                )
+                HTML(value=self._markdown_description_to_html(metric_description))
             )
         if self.metric:
@@ -236,18 +286,18 @@ class MetricResultWrapper(ResultWrapper):
                 rendered_output = OutputTemplate(self.output_template).render(
                     value=self.metric.value
                 )
-                vbox_children.append(widgets.HTML(rendered_output))
+                vbox_children.append(HTML(rendered_output))
             elif self.metric.summary:
                 tables = self._summary_tables_to_widget(self.metric.summary)
                 vbox_children.extend(tables)
         if self.figures:
-            vbox_children.append(widgets.HTML(value="<h3>Plots</h3>"))
+            vbox_children.append(HTML(value="<h3>Plots</h3>"))
             plot_widgets = plot_figures(self.figures)
             vbox_children.append(plot_widgets)
         vbox_children.append(
-            widgets.HTML(
+            HTML(
                 value="""
         <style>
             .metric-result {
@@ -293,21 +343,63 @@ class MetricResultWrapper(ResultWrapper):
             )
         )
-        return widgets.VBox(vbox_children)
+        return VBox(vbox_children)
-    async def log_async(self):
+    def _get_filtered_summary(self):
+        """Check if the metric summary has columns from input datasets"""
+        dataset_columns = set()
+        for input_id in self.inputs:
+            input_obj = input_registry.get(input_id)
+            if isinstance(input_obj, VMDataset):
+                dataset_columns.update(input_obj.columns)
+        for table in [*self.metric.summary.results]:
+            columns = set()
+            if isinstance(table.data, pd.DataFrame):
+                columns.update(table.data.columns)
+            elif isinstance(table.data, list):
+                columns.update(table.data[0].keys())
+            else:
+                raise ValueError("Invalid data type in summary table")
+            if bool(columns.intersection(dataset_columns)):
+                logger.warning(
+                    "Sensitive data in metric summary table. Not logging to API automatically."
+                    " Pass `unsafe=True` to result.log() method to override manually."
+                )
+                logger.warning(
+                    f"The following columns are present in the table: {columns}"
+                    f" and also present in the dataset: {dataset_columns}"
+                )
+                self.metric.summary.results.remove(table)
+        return self.metric.summary
+    async def log_async(
+        self, section_id: str = None, position: int = None, unsafe=False
+    ):
         tasks = []  # collect tasks to run in parallel (async)
         if self.metric:
+            if self.metric.summary and not unsafe:
+                self.metric.summary = self._get_filtered_summary()
             tasks.append(
                 api_client.log_metrics(
                     metrics=[self.metric],
                     inputs=self.inputs,
                     output_template=self.output_template,
+                    section_id=section_id,
+                    position=position,
                 )
             )
         if self.figures:
             tasks.append(api_client.log_figures(self.figures))
         if hasattr(self, "result_metadata") and self.result_metadata:
             description = self.result_metadata[0].get("text", "")
             if isinstance(description, DescriptionFuture):
@@ -383,21 +475,25 @@ class ThresholdTestResultWrapper(ResultWrapper):
             """
         )
-        vbox_children.append(widgets.HTML(value="".join(description_html)))
+        vbox_children.append(HTML(value="".join(description_html)))
         if self.test_results.summary:
             tables = self._summary_tables_to_widget(self.test_results.summary)
             vbox_children.extend(tables)
         if self.figures:
-            vbox_children.append(widgets.HTML(value="<h3>Plots</h3>"))
+            vbox_children.append(HTML(value="<h3>Plots</h3>"))
             plot_widgets = plot_figures(self.figures)
             vbox_children.append(plot_widgets)
-        return widgets.VBox(vbox_children)
+        return VBox(vbox_children)
-    async def log_async(self):
-        tasks = [api_client.log_test_result(self.test_results, self.inputs)]
+    async def log_async(self, section_id: str = None, position: int = None):
+        tasks = [
+            api_client.log_test_result(
+                self.test_results, self.inputs, section_id, position
+            )
+        ]
         if self.figures:
             tasks.append(api_client.log_figures(self.figures))

validmind/vm_models/test/threshold_test.py CHANGED Viewed

@@ -8,11 +8,10 @@ Test (as test_results) but we'll refer to it as a ThresholdTest to
 avoid confusion with the "tests" in the general data science/modeling sense.
 """
-import os
 from dataclasses import dataclass
 from typing import ClassVar, List, Optional
-from ...ai import generate_description
+from ...utils import get_description_metadata
 from ..figure import Figure
 from .result_summary import ResultSummary, ResultTable
 from .result_wrapper import ThresholdTestResultWrapper
@@ -79,30 +78,16 @@ class ThresholdTest(Test):
         """
         result_summary = self.summary(test_results_list, passed)
-        if (
-            os.environ.get("VALIDMIND_LLM_DESCRIPTIONS_ENABLED", "false").lower()
-            == "true"
-        ):
-            revision_name = "Generated by ValidMind AI"
-            description = generate_description(
-                test_name=self.test_id,
-                test_description=self.description().splitlines()[0],
-                test_results=[result.serialize() for result in test_results_list],
-                test_summary=result_summary.serialize(),
-                figures=figures,
-            )
-        else:
-            revision_name = "Default Description"
-            description = self.description()
-        description_metadata = {
-            "content_id": f"test_description:{self.test_id}::{revision_name}",
-            "text": description,
-        }
         self.result = ThresholdTestResultWrapper(
             result_id=self.test_id,
-            result_metadata=[description_metadata],
+            result_metadata=[
+                get_description_metadata(
+                    test_id=self.test_id,
+                    default_description=self.description(),
+                    summary=result_summary.serialize(),
+                    figures=figures,
+                )
+            ],
             inputs=self.get_accessed_inputs(),
             test_results=ThresholdTestResults(
                 test_name=self.test_id,
@@ -112,10 +97,7 @@ class ThresholdTest(Test):
                 results=test_results_list,
                 summary=result_summary,
             ),
+            figures=figures,
         )
-        # Allow test results to attach figures to the test suite result
-        if figures:
-            self.result.figures = figures
         return self.result

validmind/vm_models/test_context.py CHANGED Viewed

@@ -20,7 +20,7 @@ from validmind.input_registry import input_registry
 from ..errors import MissingRequiredTestInputError
 from ..logging import get_logger
-from .dataset import VMDataset
+from .dataset.dataset import VMDataset
 from .model import VMModel
 # More human readable context names for error messages

validmind/vm_models/test_suite/summary.py CHANGED Viewed

@@ -6,10 +6,9 @@ from dataclasses import dataclass
 from typing import List, Optional
 import ipywidgets as widgets
-import mistune
-from IPython.display import display
 from ...logging import get_logger
+from ...utils import display, md_to_html
 from ..test.result_wrapper import FailedResultWrapper
 from .test_suite import TestSuiteSection, TestSuiteTest
@@ -36,7 +35,7 @@ class TestSuiteSectionSummary:
         self._build_summary()
     def _add_description(self):
-        description = f'<div class="result">{mistune.html(self.description)}</div>'
+        description = f'<div class="result">{md_to_html(self.description)}</div>'
         self._widgets.append(widgets.HTML(value=description))
     def _add_tests_summary(self):
@@ -101,7 +100,7 @@ class TestSuiteSummary:
         self._widgets.append(widgets.HTML(value=results_link))
     def _add_description(self):
-        description = f'<div class="result">{mistune.html(self.description)}</div>'
+        description = f'<div class="result">{md_to_html(self.description)}</div>'
         self._widgets.append(widgets.HTML(value=description))
     def _add_sections_summary(self):

validmind 2.1.1__py3-none-any.whl → 2.2.4__py3-none-any.whl

validmind 2.1.1py3-none-any.whl → 2.2.4py3-none-any.whl