PyPI - google-meridian - Versions diffs - 1.3.2__py3-none-any.whl → 1.5.0__py3-none-any.whl - Mend

google-meridian 1.3.2py3-none-any.whl → 1.5.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (78) hide show

{google_meridian-1.3.2.dist-info → google_meridian-1.5.0.dist-info}/METADATA +18 -11
google_meridian-1.5.0.dist-info/RECORD +112 -0
{google_meridian-1.3.2.dist-info → google_meridian-1.5.0.dist-info}/WHEEL +1 -1
{google_meridian-1.3.2.dist-info → google_meridian-1.5.0.dist-info}/top_level.txt +1 -0
meridian/analysis/analyzer.py +558 -398
meridian/analysis/optimizer.py +90 -68
meridian/analysis/review/reviewer.py +4 -1
meridian/analysis/summarizer.py +13 -3
meridian/analysis/test_utils.py +2911 -2102
meridian/analysis/visualizer.py +37 -14
meridian/backend/__init__.py +106 -0
meridian/constants.py +2 -0
meridian/data/input_data.py +30 -52
meridian/data/input_data_builder.py +2 -9
meridian/data/test_utils.py +107 -51
meridian/data/validator.py +48 -0
meridian/mlflow/autolog.py +19 -9
meridian/model/__init__.py +2 -0
meridian/model/adstock_hill.py +3 -5
meridian/model/context.py +1059 -0
meridian/model/eda/constants.py +335 -4
meridian/model/eda/eda_engine.py +723 -312
meridian/model/eda/eda_outcome.py +177 -33
meridian/model/equations.py +418 -0
meridian/model/knots.py +58 -47
meridian/model/model.py +228 -878
meridian/model/model_test_data.py +38 -0
meridian/model/posterior_sampler.py +103 -62
meridian/model/prior_sampler.py +114 -94
meridian/model/spec.py +23 -14
meridian/templates/card.html.jinja +9 -7
meridian/templates/chart.html.jinja +1 -6
meridian/templates/finding.html.jinja +19 -0
meridian/templates/findings.html.jinja +33 -0
meridian/templates/formatter.py +41 -5
meridian/templates/formatter_test.py +127 -0
meridian/templates/style.css +66 -9
meridian/templates/style.scss +85 -4
meridian/templates/table.html.jinja +1 -0
meridian/version.py +1 -1
scenarioplanner/__init__.py +42 -0
scenarioplanner/converters/__init__.py +25 -0
scenarioplanner/converters/dataframe/__init__.py +28 -0
scenarioplanner/converters/dataframe/budget_opt_converters.py +383 -0
scenarioplanner/converters/dataframe/common.py +71 -0
scenarioplanner/converters/dataframe/constants.py +137 -0
scenarioplanner/converters/dataframe/converter.py +42 -0
scenarioplanner/converters/dataframe/dataframe_model_converter.py +70 -0
scenarioplanner/converters/dataframe/marketing_analyses_converters.py +543 -0
scenarioplanner/converters/dataframe/rf_opt_converters.py +314 -0
scenarioplanner/converters/mmm.py +743 -0
scenarioplanner/converters/mmm_converter.py +58 -0
scenarioplanner/converters/sheets.py +156 -0
scenarioplanner/converters/test_data.py +714 -0
scenarioplanner/linkingapi/__init__.py +47 -0
scenarioplanner/linkingapi/constants.py +27 -0
scenarioplanner/linkingapi/url_generator.py +131 -0
scenarioplanner/mmm_ui_proto_generator.py +355 -0
schema/__init__.py +5 -2
schema/mmm_proto_generator.py +71 -0
schema/model_consumer.py +133 -0
schema/processors/__init__.py +77 -0
schema/processors/budget_optimization_processor.py +832 -0
schema/processors/common.py +64 -0
schema/processors/marketing_processor.py +1137 -0
schema/processors/model_fit_processor.py +367 -0
schema/processors/model_kernel_processor.py +117 -0
schema/processors/model_processor.py +415 -0
schema/processors/reach_frequency_optimization_processor.py +584 -0
schema/serde/distribution.py +12 -7
schema/serde/hyperparameters.py +54 -107
schema/serde/meridian_serde.py +6 -1
schema/test_data.py +380 -0
schema/utils/__init__.py +2 -0
schema/utils/date_range_bucketing.py +117 -0
schema/utils/proto_enum_converter.py +127 -0
google_meridian-1.3.2.dist-info/RECORD +0 -76
{google_meridian-1.3.2.dist-info → google_meridian-1.5.0.dist-info}/licenses/LICENSE +0 -0

meridian/data/test_utils.py CHANGED Viewed

@@ -642,6 +642,7 @@ def random_media_da(
     channel_variable_name: str = 'media_channel',
     channel_prefix: str = 'ch_',
     integer_geos: bool = False,
+    nonzero_shift: float = 0.0,
 ) -> xr.DataArray:
   """Generates a sample `media` DataArray.
@@ -662,6 +663,7 @@ def random_media_da(
     channel_variable_name: The name of the channel variable
     channel_prefix: The prefix of the channel names
     integer_geos: If True, the geos will be integers.
+    nonzero_shift: A scalar value to add to the generated data.
   Returns:
     A DataArray containing random data.
@@ -695,6 +697,8 @@ def random_media_da(
         )
     )
+  media = media + nonzero_shift
   if explicit_geo_names is None:
     geos = sample_geos(n_geos, integer_geos)
   else:
@@ -736,6 +740,7 @@ def random_organic_media_da(
     explicit_time_index: Sequence[str] | None = None,
     explicit_media_channel_names: Sequence[str] | None = None,
     integer_geos: bool = False,
+    nonzero_shift: float = 0.0,
 ) -> xr.DataArray:
   """Generates a sample `organic_media` DataArray."""
   return random_media_da(
@@ -751,6 +756,7 @@ def random_organic_media_da(
       channel_variable_name='organic_media_channel',
       channel_prefix='organic_media_',
       integer_geos=integer_geos,
+      nonzero_shift=nonzero_shift,
   )
@@ -761,6 +767,7 @@ def random_media_spend_nd_da(
     seed=0,
     integer_geos: bool = False,
     explicit_media_channel_names: Sequence[str] | None = None,
+    nonzero_shift: float = 0.0,
 ) -> xr.DataArray:
   """Generates a sample N-dimensional `media_spend` DataArray.
@@ -781,6 +788,7 @@ def random_media_spend_nd_da(
     integer_geos: If True, the geos will be integers.
     explicit_media_channel_names: If given, ignore `n_media_channels` and use
       this as is.
+    nonzero_shift: A scalar value to add to the generated data.
   Returns:
     A DataArray containing the generated `media_spend` data with the given
@@ -818,7 +826,7 @@ def random_media_spend_nd_da(
         f'Shape {dims} not supported by the random_media_spend_nd_da function.'
     )
-  media_spend = abs(np.random.normal(1, 1, size=shape))
+  media_spend = abs(np.random.normal(1, 1, size=shape)) + nonzero_shift
   return xr.DataArray(
       media_spend,
@@ -1007,8 +1015,27 @@ def random_reach_da(
     channel_variable_name: str = 'rf_channel',
     channel_prefix: str = 'rf_ch_',
     integer_geos: bool = False,
+    nonzero_shift: float = 0.0,
 ) -> xr.DataArray:
-  """Generates a sample `reach` DataArray."""
+  """Generates a sample `reach` DataArray.
+  Args:
+    n_geos: Number of geos
+    n_times: Number of time periods
+    n_media_times: Number of media time periods
+    n_rf_channels: Number of reach and frequency channels
+    seed: Random seed used by `np.random.seed()`
+    explicit_rf_channel_names: If given, ignore `n_rf_channels` and use this as
+      is
+    array_name: The name of the array to be created
+    channel_variable_name: The name of the channel variable
+    channel_prefix: The prefix of the channel names
+    integer_geos: If True, the geos will be integers.
+    nonzero_shift: A scalar value to add to the generated data.
+  Returns:
+    A DataArray containing random data.
+  """
   np.random.seed(seed)
@@ -1016,12 +1043,15 @@ def random_reach_da(
   if n_times < n_media_times:
     start_date -= datetime.timedelta(weeks=(n_media_times - n_times))
-  reach = np.round(
-      abs(
-          np.random.normal(
-              3000, 100, size=(n_geos, n_media_times, n_rf_channels)
+  reach = (
+      np.round(
+          abs(
+              np.random.normal(
+                  3000, 100, size=(n_geos, n_media_times, n_rf_channels)
+              )
           )
       )
+      + nonzero_shift
   )
   channels = (
@@ -1051,6 +1081,7 @@ def random_organic_reach_da(
     seed: int = 0,
     explicit_organic_rf_channel_names: Sequence[str] | None = None,
     integer_geos: bool = False,
+    nonzero_shift: float = 0.0,
 ) -> xr.DataArray:
   """Generates a sample `organic_reach` DataArray."""
   return random_reach_da(
@@ -1064,6 +1095,7 @@ def random_organic_reach_da(
       channel_variable_name='organic_rf_channel',
       channel_prefix='organic_rf_ch_',
       integer_geos=integer_geos,
+      nonzero_shift=nonzero_shift,
   )
@@ -1078,8 +1110,27 @@ def random_frequency_da(
     channel_variable_name: str = 'rf_channel',
     channel_prefix: str = 'rf_ch_',
     integer_geos: bool = False,
+    nonzero_shift: float = 0.0,
 ) -> xr.DataArray:
-  """Generates a sample `frequency` DataArray."""
+  """Generates a sample `frequency` DataArray.
+  Args:
+    n_geos: Number of geos
+    n_times: Number of time periods
+    n_media_times: Number of media time periods
+    n_rf_channels: Number of reach and frequency channels
+    seed: Random seed used by `np.random.seed()`
+    explicit_rf_channel_names: If given, ignore `n_rf_channels` and use this as
+      is
+    array_name: The name of the array to be created
+    channel_variable_name: The name of the channel variable
+    channel_prefix: The prefix of the channel names
+    integer_geos: If True, the geos will be integers.
+    nonzero_shift: A scalar value to add to the generated data.
+  Returns:
+    A DataArray containing random data.
+  """
   np.random.seed(seed)
@@ -1087,8 +1138,9 @@ def random_frequency_da(
   if n_times < n_media_times:
     start_date -= datetime.timedelta(weeks=(n_media_times - n_times))
-  frequency = abs(
-      np.random.normal(3, 5, size=(n_geos, n_media_times, n_rf_channels))
+  frequency = (
+      abs(np.random.normal(3, 5, size=(n_geos, n_media_times, n_rf_channels)))
+      + nonzero_shift
   )
   channels = (
@@ -1119,6 +1171,7 @@ def random_organic_frequency_da(
     seed: int = 0,
     explicit_organic_rf_channel_names: Sequence[str] | None = None,
     integer_geos: bool = False,
+    nonzero_shift: float = 0.0,
 ) -> xr.DataArray:
   """Generates a sample `organic_frequency` DataArray."""
   return random_frequency_da(
@@ -1132,6 +1185,7 @@ def random_organic_frequency_da(
       channel_variable_name='organic_rf_channel',
       channel_prefix='organic_rf_ch_',
       integer_geos=integer_geos,
+      nonzero_shift=nonzero_shift,
   )
@@ -1141,6 +1195,7 @@ def random_rf_spend_nd_da(
     n_rf_channels: int | None = None,
     seed=0,
     integer_geos: bool = False,
+    nonzero_shift: float = 0.0,
 ) -> xr.DataArray:
   """Generates a sample N-dimensional `rf_spend` DataArray.
@@ -1157,6 +1212,7 @@ def random_rf_spend_nd_da(
     n_rf_channels: Number of channels in the created `rf_spend` array.
     seed: Random seed used by `np.random.seed()`.
     integer_geos: If True, the geos will be integers.
+    nonzero_shift: A scalar value to add to the generated data.
   Returns:
     A DataArray containing the generated `rf_spend` data with the given
@@ -1187,7 +1243,7 @@ def random_rf_spend_nd_da(
         f'Shape {dims} not supported by the random_rf_spend_nd_da function.'
     )
-  rf_spend = abs(np.random.normal(1, 1, size=shape))
+  rf_spend = abs(np.random.normal(1, 1, size=shape)) + nonzero_shift
   return xr.DataArray(
       rf_spend,
@@ -1206,6 +1262,7 @@ def random_non_media_treatments_da(
     date_format: str = c.DATE_FORMAT,
     explicit_time_index: Sequence[str] | None = None,
     integer_geos: bool = False,
+    nonzero_shift: float = 0.0,
 ) -> xr.DataArray:
   """Generates a sample `non_media_treatments` DataArray.
@@ -1218,6 +1275,7 @@ def random_non_media_treatments_da(
     date_format: The date format to use for time coordinate labels
     explicit_time_index: If given, ignore `date_format` and use this as is
     integer_geos: If True, the geos will be integers.
+    nonzero_shift: A scalar value to add to the generated data.
   Returns:
     A DataArray containing random non-media variable.
@@ -1232,6 +1290,8 @@ def random_non_media_treatments_da(
       non_media_channel,
       size=(n_geos, n_times, n_non_media_channels),
   )
+  non_media_treatments = non_media_treatments + nonzero_shift
   return xr.DataArray(
       non_media_treatments,
       dims=['geo', 'time', 'non_media_channel'],
@@ -1268,6 +1328,7 @@ def random_dataset(
     remove_media_time: bool = False,
     integer_geos: bool = False,
     kpi_data_pattern: str = '',
+    nonzero_shift: float = 0.0,
 ) -> xr.Dataset:
   """Generates a random dataset."""
   if n_media_channels:
@@ -1280,6 +1341,7 @@ def random_dataset(
         integer_geos=integer_geos,
         explicit_media_channel_names=explicit_media_channel_names,
         media_value_scales=media_value_scales,
+        nonzero_shift=nonzero_shift,
     )
     media_spend = random_media_spend_nd_da(
         n_geos=n_geos,
@@ -1288,6 +1350,7 @@ def random_dataset(
         explicit_media_channel_names=explicit_media_channel_names,
         seed=seed,
         integer_geos=integer_geos,
+        nonzero_shift=nonzero_shift,
     )
   else:
     media = None
@@ -1301,6 +1364,7 @@ def random_dataset(
         n_rf_channels=n_rf_channels,
         seed=seed,
         integer_geos=integer_geos,
+        nonzero_shift=nonzero_shift,
     )
     frequency = random_frequency_da(
         n_geos=n_geos,
@@ -1309,6 +1373,7 @@ def random_dataset(
         n_rf_channels=n_rf_channels,
         seed=seed,
         integer_geos=integer_geos,
+        nonzero_shift=nonzero_shift,
     )
     rf_spend = random_rf_spend_nd_da(
         n_geos=n_geos,
@@ -1316,6 +1381,7 @@ def random_dataset(
         n_rf_channels=n_rf_channels,
         seed=seed,
         integer_geos=integer_geos,
+        nonzero_shift=nonzero_shift,
     )
   else:
     reach = None
@@ -1352,6 +1418,7 @@ def random_dataset(
         n_non_media_channels=n_non_media_channels,
         seed=seed,
         integer_geos=integer_geos,
+        nonzero_shift=nonzero_shift,
     )
   else:
     non_media_treatments = None
@@ -1364,6 +1431,7 @@ def random_dataset(
         n_organic_media_channels=n_organic_media_channels,
         seed=seed,
         integer_geos=integer_geos,
+        nonzero_shift=nonzero_shift,
     )
   else:
     organic_media = None
@@ -1376,6 +1444,7 @@ def random_dataset(
         n_organic_rf_channels=n_organic_rf_channels,
         seed=seed,
         integer_geos=integer_geos,
+        nonzero_shift=nonzero_shift,
     )
     organic_frequency = random_organic_frequency_da(
         n_geos=n_geos,
@@ -1384,6 +1453,7 @@ def random_dataset(
         n_organic_rf_channels=n_organic_rf_channels,
         seed=seed,
         integer_geos=integer_geos,
+        nonzero_shift=nonzero_shift,
     )
   else:
     organic_reach = None
@@ -1406,53 +1476,37 @@ def random_dataset(
       constant_value=constant_population_value,
   )
-  dataset = xr.combine_by_coords(
-      [kpi, population] + ([controls] if controls is not None else [])
-  )
+  to_merge = [kpi, population]
+  if controls is not None:
+    to_merge.append(controls)
   if revenue_per_kpi is not None:
-    dataset = xr.combine_by_coords([dataset, revenue_per_kpi])
+    to_merge.append(revenue_per_kpi)
   if media is not None:
-    media_renamed = (
-        media.rename({'media_time': 'time'}) if remove_media_time else media
-    )
-    dataset = xr.combine_by_coords([dataset, media_renamed, media_spend])
+    if remove_media_time:
+      media = media.rename({'media_time': 'time'})
+    to_merge.append(media)
+    to_merge.append(media_spend)
   if reach is not None:
-    reach_renamed = (
-        reach.rename({'media_time': 'time'}) if remove_media_time else reach
-    )
-    frequency_renamed = (
-        frequency.rename({'media_time': 'time'})
-        if remove_media_time
-        else frequency
-    )
-    dataset = xr.combine_by_coords(
-        [dataset, reach_renamed, frequency_renamed, rf_spend]
-    )
+    if remove_media_time:
+      reach = reach.rename({'media_time': 'time'})
+      frequency = frequency.rename({'media_time': 'time'})
+    to_merge.append(reach)
+    to_merge.append(frequency)
+    to_merge.append(rf_spend)
   if non_media_treatments is not None:
-    dataset = xr.combine_by_coords([dataset, non_media_treatments])
+    to_merge.append(non_media_treatments)
   if organic_media is not None:
-    organic_media_renamed = (
-        organic_media.rename({'media_time': 'time'})
-        if remove_media_time
-        else organic_media
-    )
-    dataset = xr.combine_by_coords([dataset, organic_media_renamed])
+    if remove_media_time:
+      organic_media = organic_media.rename({'media_time': 'time'})
+    to_merge.append(organic_media)
   if organic_reach is not None:
-    organic_reach_renamed = (
-        organic_reach.rename({'media_time': 'time'})
-        if remove_media_time
-        else organic_reach
-    )
-    organic_frequency_renamed = (
-        organic_frequency.rename({'media_time': 'time'})
-        if remove_media_time
-        else organic_frequency
-    )
-    dataset = xr.combine_by_coords(
-        [dataset, organic_reach_renamed, organic_frequency_renamed]
-    )
-  return dataset
+    if remove_media_time:
+      organic_reach = organic_reach.rename({'media_time': 'time'})
+      organic_frequency = organic_frequency.rename({'media_time': 'time'})
+    to_merge.append(organic_reach)
+    to_merge.append(organic_frequency)
+  return xr.merge(to_merge, join='outer', compat='no_conflicts')
 def dataset_to_dataframe(
@@ -1794,6 +1848,7 @@ def sample_input_data_non_revenue_revenue_per_kpi(
     n_organic_media_channels: int | None = None,
     n_organic_rf_channels: int | None = None,
     seed: int = 0,
+    nonzero_shift: float = 0.0,
 ) -> input_data.InputData:
   """Generates sample InputData for `non_revenue` KPI w/ revenue_per_kpi."""
   dataset = random_dataset(
@@ -1807,6 +1862,7 @@ def sample_input_data_non_revenue_revenue_per_kpi(
       n_organic_media_channels=n_organic_media_channels,
       n_organic_rf_channels=n_organic_rf_channels,
       seed=seed,
+      nonzero_shift=nonzero_shift,
   )
   return input_data.InputData(
       kpi=dataset.kpi,

meridian/data/validator.py ADDED Viewed

@@ -0,0 +1,48 @@
+# Copyright 2025 The Meridian Authors.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+"""This module contains common validation functions for Meridian data."""
+import datetime as dt
+from meridian import constants
+import xarray as xr
+def validate_time_coord_format(array: xr.DataArray | None):
+  """Validates the `time` dimensions format of the selected DataArray.
+  The `time` dimension of the selected array must have labels that are
+  formatted in the Meridian conventional `"yyyy-mm-dd"` format.
+  Args:
+    array: An optional DataArray to validate.
+  """
+  if array is None:
+    return
+  # The component data arrays from the input data builders that call this helper
+  # method should only have one of either `media_time` or `time` as its time
+  # dimension.
+  target_coords = [constants.TIME, constants.MEDIA_TIME]
+  for coord_name in target_coords:
+    if (values := array.coords.get(coord_name)) is not None:
+      for time in values:
+        try:
+          dt.datetime.strptime(time.item(), constants.DATE_FORMAT)
+        except (TypeError, ValueError) as exc:
+          raise ValueError(
+              f"Invalid {coord_name} label: {time.item()!r}. "
+              f"Expected format: '{constants.DATE_FORMAT}'"
+          ) from exc

meridian/mlflow/autolog.py CHANGED Viewed

@@ -70,6 +70,7 @@ import dataclasses
 import inspect
 import json
 from typing import Any, Callable
+import warnings
 import arviz as az
 from meridian import backend
@@ -180,16 +181,25 @@ def autolog(
           f"sample_posterior.{param}", kwargs.get(param, "default")
       )
-    original(self, *args, **kwargs)
+    result = original(self, *args, **kwargs)
     if log_metrics:
-      model_diagnostics = visualizer.ModelDiagnostics(self.model)
-      df_diag = model_diagnostics.predictive_accuracy_table()
-      get_metric = lambda n: df_diag[df_diag.metric == n].value.to_list()[0]
-      mlflow.log_metric("R_Squared", get_metric("R_Squared"))
-      mlflow.log_metric("MAPE", get_metric("MAPE"))
-      mlflow.log_metric("wMAPE", get_metric("wMAPE"))
+      # TODO: Direct injection of `model.Meridian` object into
+      # `PosteriorMCMCSampler` is deprecated. Revisit patching method here.
+      if self.model is not None:
+        model_diagnostics = visualizer.ModelDiagnostics(self.model)
+        df_diag = model_diagnostics.predictive_accuracy_table()
+        get_metric = lambda n: df_diag[df_diag.metric == n].value.to_list()[0]
+        mlflow.log_metric("R_Squared", get_metric("R_Squared"))
+        mlflow.log_metric("MAPE", get_metric("MAPE"))
+        mlflow.log_metric("wMAPE", get_metric("wMAPE"))
+      else:
+        warnings.warn(
+            "log_metrics=True is not supported when PosteriorMCMCSampler is"
+            " initialized with model_context."
+        )
+    return result
   safe_patch(FLAVOR_NAME, model.Meridian, "__init__", patch_meridian_init)
   safe_patch(

meridian/model/__init__.py CHANGED Viewed

@@ -15,7 +15,9 @@
 """The Meridian API module that models the data."""
 from meridian.model import adstock_hill
+from meridian.model import context
 from meridian.model import eda
+from meridian.model import equations
 from meridian.model import knots
 from meridian.model import media
 from meridian.model import model

meridian/model/adstock_hill.py CHANGED Viewed

@@ -279,10 +279,6 @@ def _adstock(
     media = backend.concatenate([backend.zeros(pad_shape), media], axis=-2)
   # Adstock calculation.
-  window_list = [None] * window_size
-  for i in range(window_size):
-    window_list[i] = media[..., i : i + n_times_output, :]
-  windowed = backend.stack(window_list)
   l_range = backend.arange(window_size - 1, -1, -1, dtype=backend.float32)
   weights = compute_decay_weights(
       alpha=alpha,
@@ -291,7 +287,9 @@ def _adstock(
       decay_functions=decay_functions,
       normalize=True,
   )
-  return backend.einsum('...mw,w...gtm->...gtm', weights, windowed)
+  return backend.adstock_process(
+      media=media, weights=weights, n_times_output=n_times_output
+  )
 def _map_alpha_for_binomial_decay(x: backend.Tensor):

google-meridian 1.3.2__py3-none-any.whl → 1.5.0__py3-none-any.whl

google-meridian 1.3.2py3-none-any.whl → 1.5.0py3-none-any.whl