PyPI - google-meridian - Versions diffs - 1.4.0__py3-none-any.whl → 1.5.0__py3-none-any.whl - Mend

google-meridian 1.4.0py3-none-any.whl → 1.5.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (47) hide show

{google_meridian-1.4.0.dist-info → google_meridian-1.5.0.dist-info}/METADATA +14 -11
{google_meridian-1.4.0.dist-info → google_meridian-1.5.0.dist-info}/RECORD +47 -43
{google_meridian-1.4.0.dist-info → google_meridian-1.5.0.dist-info}/WHEEL +1 -1
meridian/analysis/analyzer.py +558 -398
meridian/analysis/optimizer.py +90 -68
meridian/analysis/review/reviewer.py +4 -1
meridian/analysis/summarizer.py +6 -1
meridian/analysis/test_utils.py +2898 -2538
meridian/analysis/visualizer.py +28 -9
meridian/backend/__init__.py +106 -0
meridian/constants.py +1 -0
meridian/data/input_data.py +30 -52
meridian/data/input_data_builder.py +2 -9
meridian/data/test_utils.py +25 -41
meridian/data/validator.py +48 -0
meridian/mlflow/autolog.py +19 -9
meridian/model/adstock_hill.py +3 -5
meridian/model/context.py +134 -0
meridian/model/eda/constants.py +334 -4
meridian/model/eda/eda_engine.py +723 -312
meridian/model/eda/eda_outcome.py +177 -33
meridian/model/model.py +159 -110
meridian/model/model_test_data.py +38 -0
meridian/model/posterior_sampler.py +103 -62
meridian/model/prior_sampler.py +114 -94
meridian/model/spec.py +23 -14
meridian/templates/card.html.jinja +9 -7
meridian/templates/chart.html.jinja +1 -6
meridian/templates/finding.html.jinja +19 -0
meridian/templates/findings.html.jinja +33 -0
meridian/templates/formatter.py +41 -5
meridian/templates/formatter_test.py +127 -0
meridian/templates/style.css +66 -9
meridian/templates/style.scss +85 -4
meridian/templates/table.html.jinja +1 -0
meridian/version.py +1 -1
scenarioplanner/linkingapi/constants.py +1 -1
scenarioplanner/mmm_ui_proto_generator.py +1 -0
schema/processors/marketing_processor.py +11 -10
schema/processors/model_processor.py +4 -1
schema/serde/distribution.py +12 -7
schema/serde/hyperparameters.py +54 -107
schema/serde/meridian_serde.py +6 -1
schema/utils/__init__.py +1 -0
schema/utils/proto_enum_converter.py +127 -0
{google_meridian-1.4.0.dist-info → google_meridian-1.5.0.dist-info}/licenses/LICENSE +0 -0
{google_meridian-1.4.0.dist-info → google_meridian-1.5.0.dist-info}/top_level.txt +0 -0

meridian/model/eda/eda_outcome.py CHANGED Viewed

@@ -14,26 +14,32 @@
 """Meridian EDA Outcome."""
+from collections.abc import Sequence
 import dataclasses
 import enum
 import typing
 import pandas as pd
 import xarray as xr
-__all__ = [
+__all__ = (
     "EDASeverity",
     "EDAFinding",
     "AnalysisLevel",
     "AnalysisArtifact",
+    "FindingCause",
     "PairwiseCorrArtifact",
     "StandardDeviationArtifact",
     "VIFArtifact",
     "KpiInvariabilityArtifact",
     "CostPerMediaUnitArtifact",
+    "VariableGeoTimeCollinearityArtifact",
+    "PopulationCorrelationArtifact",
+    "PriorProbabilityArtifact",
     "EDACheckType",
     "ArtifactType",
     "EDAOutcome",
-]
+    "CriticalCheckEDAOutcomes",
+)
 @enum.unique
@@ -48,19 +54,31 @@ class EDASeverity(enum.Enum):
   ERROR = enum.auto()
-@dataclasses.dataclass(frozen=True)
-class EDAFinding:
-  """Encapsulates a single, specific finding from an EDA check.
+@enum.unique
+class FindingCause(enum.Enum):
+  """Enumeration for the type of finding, mapping to specific data tables.
   Attributes:
-      severity: The severity level of the finding.
-      explanation: A human-readable description about the EDA check and a
-        potential actionable guidance on how to address or interpret this
-        specific finding.
+    NONE: For informational findings that do not indicate a data issue.
+    MULTICOLLINEARITY: For findings related to multicollinearity between
+      variables (e.g. from VIF or pairwise correlation checks).
+    VARIABILITY: For findings related to variables with extreme variability
+      issues, such as no variation (e.g. KPI invariability check or standard
+      deviation checks).
+    INCONSISTENT_DATA: For findings related to inconsistent data points (e.g.
+      zero cost with positive media units, from cost per media unit check).
+    RUNTIME_ERROR: For findings that indicate a runtime error during an EDA
+      check.
+    OUTLIER: For findings related to outliers in data (e.g. cost per media unit
+      outlier check).
   """
-  severity: EDASeverity
-  explanation: str
+  NONE = enum.auto()
+  MULTICOLLINEARITY = enum.auto()
+  VARIABILITY = enum.auto()
+  INCONSISTENT_DATA = enum.auto()
+  RUNTIME_ERROR = enum.auto()
+  OUTLIER = enum.auto()
 @enum.unique
@@ -95,9 +113,30 @@ class AnalysisArtifact:
   level: AnalysisLevel
+@dataclasses.dataclass(frozen=True, kw_only=True)
+class EDAFinding:
+  """A single, specific finding from an EDA check.
+  Attributes:
+      severity: The severity level of the finding.
+      explanation: A human-readable description about the EDA check and a
+        potential actionable guidance on how to address or interpret this
+        specific finding.
+      finding_cause: The type of finding, mapping to specific data tables.
+      associated_artifact: The artifact associated with the finding, if any.
+  """
+  __hash__ = None
+  severity: EDASeverity
+  explanation: str
+  finding_cause: FindingCause
+  associated_artifact: AnalysisArtifact | None = None
 @dataclasses.dataclass(frozen=True)
 class PairwiseCorrArtifact(AnalysisArtifact):
-  """Encapsulates artifacts from a single pairwise correlation analysis.
+  """Artifacts from a single pairwise correlation analysis.
   Attributes:
     corr_matrix: Pairwise correlation matrix.
@@ -115,7 +154,7 @@ class PairwiseCorrArtifact(AnalysisArtifact):
 @dataclasses.dataclass(frozen=True)
 class StandardDeviationArtifact(AnalysisArtifact):
-  """Encapsulates artifacts from a standard deviation analysis.
+  """Artifacts from a standard deviation analysis.
   Attributes:
     variable: The variable for which standard deviation is calculated.
@@ -130,7 +169,7 @@ class StandardDeviationArtifact(AnalysisArtifact):
 @dataclasses.dataclass(frozen=True)
 class VIFArtifact(AnalysisArtifact):
-  """Encapsulates artifacts from a single VIF analysis.
+  """Artifacts from a single VIF analysis.
   Attributes:
     vif_da: DataArray with VIF values.
@@ -138,12 +177,13 @@ class VIFArtifact(AnalysisArtifact):
   """
   vif_da: xr.DataArray
+  # TODO: change this naming
   outlier_df: pd.DataFrame
 @dataclasses.dataclass(frozen=True)
 class KpiInvariabilityArtifact(AnalysisArtifact):
-  """Encapsulates artifacts from a KPI invariability analysis.
+  """Artifacts from a KPI invariability analysis.
   Attributes:
     kpi_da: DataArray of the KPI that is examined for variability.
@@ -157,14 +197,15 @@ class KpiInvariabilityArtifact(AnalysisArtifact):
 @dataclasses.dataclass(frozen=True)
 class CostPerMediaUnitArtifact(AnalysisArtifact):
-  """Encapsulates artifacts from a Cost per Media Unit analysis.
+  """Artifacts from a Cost per Media Unit analysis.
   Attributes:
     cost_per_media_unit_da: DataArray of cost per media unit.
     cost_media_unit_inconsistency_df: DataFrame of time periods where cost and
       media units are inconsistent (e.g., zero cost with positive media units,
       or positive cost with zero media units).
-    outlier_df: DataFrame with outliers of cost per media unit.
+    outlier_df: DataFrame with outliers of cost per media unit, along with the
+      spend, and media units.
   """
   cost_per_media_unit_da: xr.DataArray
@@ -172,6 +213,47 @@ class CostPerMediaUnitArtifact(AnalysisArtifact):
   outlier_df: pd.DataFrame
+@dataclasses.dataclass(frozen=True)
+class VariableGeoTimeCollinearityArtifact(AnalysisArtifact):
+  """Artifacts from a Geo/Time Collinearity analysis for Treatment/Control variables.
+  Attributes:
+    rsquared_ds: Dataset containing adjusted R-squared values for treatments and
+      controls regressed against 'geo' and 'time'.
+  """
+  rsquared_ds: xr.Dataset
+@dataclasses.dataclass(frozen=True)
+class PopulationCorrelationArtifact(AnalysisArtifact):
+  """Artifacts from population correlation analysis.
+  Attributes:
+    correlation_ds: Dataset with Spearman correlation coefficients between
+      population and time-averaged treatments/controls. Each data variable in
+      the dataset corresponds to a variable in treatment_control_scaled_ds, and
+      its dimensions reflect the non-geo, non-time dimensions (e.g., 'channel').
+  """
+  correlation_ds: xr.Dataset
+@dataclasses.dataclass(frozen=True)
+class PriorProbabilityArtifact(AnalysisArtifact):
+  """Artifact for prior probability check.
+  Attributes:
+    prior_negative_baseline_prob: A float value for prior probability of
+      negative baseline.
+    mean_prior_contribution_da: The array containing the prior mean of each
+      treatment's contribution.
+  """
+  prior_negative_baseline_prob: float
+  mean_prior_contribution_da: xr.DataArray
 @enum.unique
 class EDACheckType(enum.Enum):
   """Enumeration for the type of an EDA check."""
@@ -181,9 +263,12 @@ class EDACheckType(enum.Enum):
   MULTICOLLINEARITY = enum.auto()
   KPI_INVARIABILITY = enum.auto()
   COST_PER_MEDIA_UNIT = enum.auto()
+  VARIABLE_GEO_TIME_COLLINEARITY = enum.auto()
+  POPULATION_CORRELATION = enum.auto()
+  PRIOR_PROBABILITY = enum.auto()
-ArtifactType = typing.TypeVar("ArtifactType", bound="AnalysisArtifact")
+ArtifactType = typing.TypeVar("ArtifactType", bound=AnalysisArtifact)
 @dataclasses.dataclass(frozen=True)
@@ -203,18 +288,77 @@ class EDAOutcome(typing.Generic[ArtifactType]):
   findings: list[EDAFinding]
   analysis_artifacts: list[ArtifactType]
-  @property
-  def get_geo_artifact(self) -> ArtifactType | None:
-    """Returns the geo-level analysis artifact."""
-    for artifact in self.analysis_artifacts:
-      if artifact.level == AnalysisLevel.GEO:
-        return artifact
-    return None
-  @property
-  def get_national_artifact(self) -> ArtifactType | None:
-    """Returns the national-level analysis artifact."""
-    for artifact in self.analysis_artifacts:
-      if artifact.level == AnalysisLevel.NATIONAL:
-        return artifact
-    return None
+  def _get_artifacts_by_level(self, level: AnalysisLevel) -> list[ArtifactType]:
+    """Helper method to retrieve artifacts by level.
+    Args:
+      level: The AnalysisLevel to filter artifacts by.
+    Returns:
+      A list of AnalysisArtifacts at the specified level.
+    Raises:
+      ValueError: If no artifacts of the specified level are found.
+    """
+    artifacts = [
+        artifact
+        for artifact in self.analysis_artifacts
+        if artifact.level == level
+    ]
+    if not artifacts:
+      raise ValueError(
+          f"The EDAOutcome for {self.check_type.name} check does not have "
+          f"{level.name.lower()} artifacts."
+      )
+    return artifacts
+  def get_geo_artifacts(self) -> list[ArtifactType]:
+    """Returns the geo-level analysis artifacts.
+    Returns a list to account for checks that produce multiple artifacts
+    at the same level (e.g. Standard Deviation check).
+    """
+    return self._get_artifacts_by_level(AnalysisLevel.GEO)
+  def get_national_artifacts(self) -> list[ArtifactType]:
+    """Returns the national-level analysis artifacts.
+    Returns a list to account for checks that produce multiple artifacts
+    at the same level.
+    """
+    return self._get_artifacts_by_level(AnalysisLevel.NATIONAL)
+  def get_overall_artifacts(self) -> list[ArtifactType]:
+    """Returns the overall-level analysis artifacts.
+    Returns a list to account for checks that produce multiple artifacts
+    at the same level.
+    """
+    return self._get_artifacts_by_level(AnalysisLevel.OVERALL)
+  def get_findings_by_cause_and_severity(
+      self, finding_cause: FindingCause, severity: EDASeverity
+  ) -> Sequence[EDAFinding]:
+    """Helper method to retrieve findings by cause and severity."""
+    return [
+        finding
+        for finding in self.findings
+        if finding.finding_cause == finding_cause
+        and finding.severity == severity
+    ]
+@dataclasses.dataclass(frozen=True, kw_only=True)
+class CriticalCheckEDAOutcomes:
+  """Outcomes of all critical EDA checks.
+  Attributes:
+    kpi_invariability: Outcome of the KPI invariability check.
+    multicollinearity: Outcome of the multicollinearity (VIF) check.
+    pairwise_correlation: Outcome of the pairwise correlation check.
+  """
+  kpi_invariability: EDAOutcome[KpiInvariabilityArtifact]
+  multicollinearity: EDAOutcome[VIFArtifact]
+  pairwise_correlation: EDAOutcome[PairwiseCorrArtifact]

google-meridian 1.4.0__py3-none-any.whl → 1.5.0__py3-none-any.whl

google-meridian 1.4.0py3-none-any.whl → 1.5.0py3-none-any.whl