PyPI - google-meridian - Versions diffs - 1.2.1__py3-none-any.whl → 1.3.1__py3-none-any.whl - Mend

google-meridian 1.2.1py3-none-any.whl → 1.3.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (55) hide show

google_meridian-1.3.1.dist-info/METADATA +209 -0
google_meridian-1.3.1.dist-info/RECORD +76 -0
{google_meridian-1.2.1.dist-info → google_meridian-1.3.1.dist-info}/top_level.txt +1 -0
meridian/analysis/__init__.py +2 -0
meridian/analysis/analyzer.py +179 -105
meridian/analysis/formatter.py +2 -2
meridian/analysis/optimizer.py +227 -87
meridian/analysis/review/__init__.py +20 -0
meridian/analysis/review/checks.py +721 -0
meridian/analysis/review/configs.py +110 -0
meridian/analysis/review/constants.py +40 -0
meridian/analysis/review/results.py +544 -0
meridian/analysis/review/reviewer.py +186 -0
meridian/analysis/summarizer.py +21 -34
meridian/analysis/templates/chips.html.jinja +12 -0
meridian/analysis/test_utils.py +27 -5
meridian/analysis/visualizer.py +41 -57
meridian/backend/__init__.py +457 -118
meridian/backend/test_utils.py +162 -0
meridian/constants.py +39 -3
meridian/model/__init__.py +1 -0
meridian/model/eda/__init__.py +3 -0
meridian/model/eda/constants.py +21 -0
meridian/model/eda/eda_engine.py +1309 -196
meridian/model/eda/eda_outcome.py +200 -0
meridian/model/eda/eda_spec.py +84 -0
meridian/model/eda/meridian_eda.py +220 -0
meridian/model/knots.py +55 -49
meridian/model/media.py +10 -8
meridian/model/model.py +79 -16
meridian/model/model_test_data.py +53 -0
meridian/model/posterior_sampler.py +39 -32
meridian/model/prior_distribution.py +12 -2
meridian/model/prior_sampler.py +146 -90
meridian/model/spec.py +7 -8
meridian/model/transformers.py +11 -3
meridian/version.py +1 -1
schema/__init__.py +18 -0
schema/serde/__init__.py +26 -0
schema/serde/constants.py +48 -0
schema/serde/distribution.py +515 -0
schema/serde/eda_spec.py +192 -0
schema/serde/function_registry.py +143 -0
schema/serde/hyperparameters.py +363 -0
schema/serde/inference_data.py +105 -0
schema/serde/marketing_data.py +1321 -0
schema/serde/meridian_serde.py +413 -0
schema/serde/serde.py +47 -0
schema/serde/test_data.py +4608 -0
schema/utils/__init__.py +17 -0
schema/utils/time_record.py +156 -0
google_meridian-1.2.1.dist-info/METADATA +0 -409
google_meridian-1.2.1.dist-info/RECORD +0 -52
{google_meridian-1.2.1.dist-info → google_meridian-1.3.1.dist-info}/WHEEL +0 -0
{google_meridian-1.2.1.dist-info → google_meridian-1.3.1.dist-info}/licenses/LICENSE +0 -0

meridian/analysis/visualizer.py CHANGED Viewed

@@ -46,9 +46,10 @@ alt.data_transformers.disable_max_rows()
 class ModelDiagnostics:
   """Generates model diagnostics plots from the Meridian model fitting."""
-  def __init__(self, meridian: model.Meridian):
+  def __init__(self, meridian: model.Meridian, use_kpi: bool = False):
     self._meridian = meridian
     self._analyzer = analyzer.Analyzer(meridian)
+    self._use_kpi = self._analyzer._use_kpi(use_kpi)
   @functools.lru_cache(maxsize=128)
   def _predictive_accuracy_dataset(
@@ -82,6 +83,7 @@ class ModelDiagnostics:
     return self._analyzer.predictive_accuracy(
         selected_geos=selected_geos_list,
         selected_times=selected_times_list,
+        use_kpi=self._use_kpi,
         batch_size=batch_size,
     )
@@ -366,19 +368,23 @@ class ModelFit:
   def __init__(
       self,
       meridian: model.Meridian,
+      use_kpi: bool = False,
       confidence_level: float = c.DEFAULT_CONFIDENCE_LEVEL,
   ):
     """Initializes the dataset based on the model and confidence level.
     Args:
       meridian: Media mix model with the raw data from the model fitting.
+      use_kpi: If `True`, plots the incremental KPI. Otherwise, plots the
+        incremental revenue using the revenue per KPI (if available).
       confidence_level: Confidence level for expected outcome credible intervals
         represented as a value between zero and one. Default is `0.9`.
     """
     self._meridian = meridian
     self._analyzer = analyzer.Analyzer(meridian)
+    self._use_kpi = self._analyzer._use_kpi(use_kpi)
     self._model_fit_data = self._analyzer.expected_vs_actual_data(
-        confidence_level=confidence_level
+        use_kpi=self._use_kpi, confidence_level=confidence_level
     )
   @property
@@ -430,11 +436,7 @@ class ModelFit:
     Returns:
       An Altair plot showing the model fit.
     """
-    outcome = (
-        c.REVENUE
-        if self._meridian.input_data.revenue_per_kpi is not None
-        else c.KPI.upper()
-    )
+    outcome = c.KPI.upper() if self._use_kpi else c.REVENUE
     self._validate_times_to_plot(selected_times)
     self._validate_geos_to_plot(
         selected_geos, n_top_largest_geos, show_geo_level
@@ -459,10 +461,10 @@ class ModelFit:
     title = summary_text.EXPECTED_ACTUAL_OUTCOME_CHART_TITLE.format(
         outcome=outcome
     )
-    if self._meridian.input_data.revenue_per_kpi is not None:
-      y_axis_label = summary_text.REVENUE_LABEL
-    else:
+    if self._use_kpi:
       y_axis_label = summary_text.KPI_LABEL
+    else:
+      y_axis_label = summary_text.REVENUE_LABEL
     plot = (
         alt.Chart(model_fit_df, width=c.VEGALITE_FACET_EXTRA_LARGE_WIDTH)
         .mark_line()
@@ -638,7 +640,7 @@ class ReachAndFrequency:
       self,
       meridian: model.Meridian,
       selected_times: Sequence[str] | None = None,
-      use_kpi: bool | None = None,
+      use_kpi: bool = False,
   ):
     """Initializes the reach and frequency dataset for the model data.
@@ -651,15 +653,7 @@ class ReachAndFrequency:
     self._meridian = meridian
     self._analyzer = analyzer.Analyzer(meridian)
     self._selected_times = selected_times
-    # TODO Adapt the mechanisms to choose between KPI and REVENUE
-    # from Analyzer.
-    if use_kpi is None:
-      self._use_kpi = (
-          meridian.input_data.kpi_type == c.NON_REVENUE
-          and meridian.input_data.revenue_per_kpi is None
-      )
-    else:
-      self._use_kpi = use_kpi
+    self._use_kpi = self._analyzer._use_kpi(use_kpi)
     self._optimal_frequency_data = self._analyzer.optimal_freq(
         selected_times=selected_times,
         use_kpi=self._use_kpi,
@@ -844,6 +838,7 @@ class MediaEffects:
       self,
       meridian: model.Meridian,
       by_reach: bool = True,
+      use_kpi: bool = False,
   ):
     """Initializes the Media Effects based on the model data and params.
@@ -852,10 +847,13 @@ class MediaEffects:
       by_reach: For the channel w/ reach and frequency, return the response
         curves by reach given fixed frequency if true; return the response
         curves by frequency given fixed reach if false.
+      use_kpi: If `True`, calculate the incremental KPI. Otherwise, calculate
+        the incremental revenue using the revenue per KPI (if available).
     """
     self._meridian = meridian
     self._analyzer = analyzer.Analyzer(meridian)
     self._by_reach = by_reach
+    self._use_kpi = self._analyzer._use_kpi(use_kpi)
   @functools.lru_cache(maxsize=128)
   def response_curves_data(
@@ -863,7 +861,6 @@ class MediaEffects:
       confidence_level: float = c.DEFAULT_CONFIDENCE_LEVEL,
       selected_times: frozenset[str] | None = None,
       by_reach: bool = True,
-      use_kpi: bool = False,
   ) -> xr.Dataset:
     """Dataset holding the calculated response curves data.
@@ -887,20 +884,17 @@ class MediaEffects:
       by_reach: For the channel w/ reach and frequency, return the response
         curves by reach given fixed frequency if true; return the response
         curves by frequency given fixed reach if false.
-      use_kpi: If `True`, calculate the incremental KPI. Otherwise, calculate
-        the incremental revenue using the revenue per KPI (if available).
     Returns:
       A Dataset displaying the response curves data.
     """
     selected_times_list = list(selected_times) if selected_times else None
-    use_kpi = use_kpi or self._meridian.input_data.revenue_per_kpi is None
     return self._analyzer.response_curves(
         spend_multipliers=list(np.arange(0, 2.2, c.RESPONSE_CURVE_STEP_SIZE)),
         confidence_level=confidence_level,
         selected_times=selected_times_list,
         by_reach=by_reach,
-        use_kpi=use_kpi,
+        use_kpi=self._use_kpi,
     )
   @functools.lru_cache(maxsize=128)
@@ -964,7 +958,6 @@ class MediaEffects:
       confidence_level: float = c.DEFAULT_CONFIDENCE_LEVEL,
       selected_times: frozenset[str] | None = None,
       by_reach: bool = True,
-      use_kpi: bool = False,
       plot_separately: bool = True,
       include_ci: bool = True,
       num_channels_displayed: int | None = None,
@@ -990,8 +983,6 @@ class MediaEffects:
       by_reach: For the channel w/ reach and frequency, return the response
         curves by reach given fixed frequency if true; return the response
         curves by frequency given fixed reach if false.
-      use_kpi: If `True`, calculate the incremental KPI. Otherwise, calculate
-        the incremental revenue using the revenue per KPI (if available).
       plot_separately: If `True`, the plots are faceted. If `False`, the plots
         are layered to create one plot with all of the channels.
       include_ci: If `True`, plots the credible interval. Defaults to `True`.
@@ -1027,11 +1018,10 @@ class MediaEffects:
         confidence_level=confidence_level,
         selected_times=selected_times,
         by_reach=by_reach,
-        use_kpi=use_kpi,
     )
     y_axis_label = (
         summary_text.INC_KPI_LABEL
-        if use_kpi or self._meridian.input_data.revenue_per_kpi is None
+        if self._use_kpi
         else summary_text.INC_OUTCOME_LABEL
     )
     base = (
@@ -1341,7 +1331,6 @@ class MediaEffects:
       selected_times: frozenset[str] | None = None,
       confidence_level: float = c.DEFAULT_CONFIDENCE_LEVEL,
       by_reach: bool = True,
-      use_kpi: bool = False,
   ) -> pd.DataFrame:
     """Returns DataFrame with top channels by spend for the layered plot.
@@ -1356,7 +1345,6 @@ class MediaEffects:
       by_reach: For the channel w/ reach and frequency, return the response
         curves by reach given fixed frequency if true; return the response
         curves by frequency given fixed reach if false.
-      use_kpi: If `True`, use KPI instead of revenue.
     Returns:
       A DataFrame containing the top chosen channels
@@ -1367,7 +1355,6 @@ class MediaEffects:
         confidence_level=confidence_level,
         selected_times=selected_times,
         by_reach=by_reach,
-        use_kpi=use_kpi,
     )
     list_sorted_channels_cost = list(
         data.sel(spend_multiplier=1)
@@ -1415,6 +1402,7 @@ class MediaSummary:
       selected_times: Sequence[str] | None = None,
       marginal_roi_by_reach: bool = True,
       non_media_baseline_values: Sequence[float] | None = None,
+      use_kpi: bool = False,
   ):
     """Initializes the media summary metrics based on the model data and params.
@@ -1434,6 +1422,7 @@ class MediaSummary:
         value which will be used as baseline for the given channel. If `None`,
         the values defined with `ModelSpec.non_media_baseline_values` will be
         used.
+      use_kpi: If `True`, use KPI instead of revenue.
     """
     self._meridian = meridian
     self._analyzer = analyzer.Analyzer(meridian)
@@ -1441,6 +1430,7 @@ class MediaSummary:
     self._selected_times = selected_times
     self._marginal_roi_by_reach = marginal_roi_by_reach
     self._non_media_baseline_values = non_media_baseline_values
+    self._use_kpi = self._analyzer._use_kpi(use_kpi)
   @property
   def paid_summary_metrics(self):
@@ -1475,7 +1465,7 @@ class MediaSummary:
     return self._analyzer.summary_metrics(
         selected_times=self._selected_times,
         marginal_roi_by_reach=self._marginal_roi_by_reach,
-        use_kpi=self._meridian.input_data.revenue_per_kpi is None,
+        use_kpi=self._use_kpi,
         confidence_level=self._confidence_level,
         include_non_paid_channels=False,
         aggregate_times=aggregate_times,
@@ -1508,7 +1498,7 @@ class MediaSummary:
     """
     return self._analyzer.summary_metrics(
         selected_times=self._selected_times,
-        use_kpi=self._meridian.input_data.revenue_per_kpi is None,
+        use_kpi=self._use_kpi,
         confidence_level=self._confidence_level,
         include_non_paid_channels=True,
         non_media_baseline_values=self._non_media_baseline_values,
@@ -1520,6 +1510,7 @@ class MediaSummary:
       include_prior: bool = True,
       include_posterior: bool = True,
       include_non_paid_channels: bool = False,
+      currency: str = c.DEFAULT_CURRENCY,
   ) -> pd.DataFrame:
     """Returns a formatted dataframe table of the summary metrics.
@@ -1536,6 +1527,7 @@ class MediaSummary:
         reported. If `False`, only the paid channels (media, reach and
         frequency) are included but the summary contains also the metrics
         dependent on spend. Default: `False`.
+      currency: The currency to use for the monetary values. Default: `'$'`.
     Returns:
       pandas.DataFrame of formatted summary metrics.
@@ -1545,7 +1537,7 @@ class MediaSummary:
           'At least one of `include_posterior` or `include_prior` must be True.'
       )
-    use_revenue = self._meridian.input_data.revenue_per_kpi is not None
+    use_revenue = not self._use_kpi
     distribution = [c.PRIOR] * include_prior + [c.POSTERIOR] * include_posterior
     percentage_metrics = [
@@ -1618,7 +1610,7 @@ class MediaSummary:
     # Format monetary values.
     for k in monetary_metrics:
       if k in df.columns:
-        df[k] = '$' + df[k].astype(str)
+        df[k] = currency + df[k].astype(str)
     # Format the model result data variables as central_tendency (ci_lo, ci_hi).
     index_vars = [c.CHANNEL, c.DISTRIBUTION]
@@ -1731,11 +1723,7 @@ class MediaSummary:
             ),
             y=alt.Y(
                 f'{c.INCREMENTAL_OUTCOME}:Q',
-                title=(
-                    c.REVENUE.title()
-                    if self._meridian.input_data.revenue_per_kpi is not None
-                    else c.KPI.upper()
-                ),
+                title=(c.KPI.upper() if self._use_kpi else c.REVENUE.title()),
                 axis=alt.Axis(
                     ticks=False,
                     domain=False,
@@ -1901,11 +1889,7 @@ class MediaSummary:
     Returns:
       An Altair plot showing the contributions per channel.
     """
-    outcome = (
-        c.REVENUE.title()
-        if self._meridian.input_data.revenue_per_kpi is not None
-        else c.KPI.upper()
-    )
+    outcome = c.KPI.upper() if self._use_kpi else c.REVENUE.title()
     outcome_df = self.contribution_metrics(include_non_paid=True)
     pct = c.PCT_OF_CONTRIBUTION
     value = c.INCREMENTAL_OUTCOME
@@ -1918,7 +1902,7 @@ class MediaSummary:
     num_channels = len(outcome_df[c.CHANNEL])
     base = (
-        alt.Chart(outcome_df, width=c.VEGALITE_FACET_LARGE_WIDTH)
+        alt.Chart(outcome_df)
         .transform_window(
             sum_outcome=f'sum({c.PCT_OF_CONTRIBUTION})',
             kwargs=f'lead({c.CHANNEL})',
@@ -1934,7 +1918,10 @@ class MediaSummary:
             y=alt.Y(
                 f'{c.CHANNEL}:N',
                 axis=alt.Axis(
-                    ticks=False, labelPadding=c.PADDING_10, domain=False
+                    ticks=False,
+                    labelPadding=c.PADDING_10,
+                    domain=False,
+                    labelLimit=0,
                 ),
                 title=None,
                 sort=None,
@@ -1977,6 +1964,7 @@ class MediaSummary:
             title=formatter.custom_title_params(
                 summary_text.CHANNEL_DRIVERS_CHART_TITLE
             ),
+            width=c.VEGALITE_FACET_LARGE_WIDTH,
             height=c.BAR_SIZE * num_channels
             + c.BAR_SIZE * 2 * c.SCALED_PADDING,
         )
@@ -2039,11 +2027,7 @@ class MediaSummary:
     Returns:
       An Altair plot showing the spend versus outcome percentages per channel.
     """
-    outcome = (
-        c.REVENUE
-        if self._meridian.input_data.revenue_per_kpi is not None
-        else c.KPI.upper()
-    )
+    outcome = c.KPI.upper() if self._use_kpi else c.REVENUE
     df = self._transform_contribution_spend_metrics()
     domain = [
         f'% {outcome.title() if outcome == c.REVENUE else outcome}',
@@ -2567,10 +2551,10 @@ class MediaSummary:
       A dataframe of spend and outcome percentages and ROI per channel.
     """
     paid_summary_metrics = self.get_paid_summary_metrics()
-    if self._meridian.input_data.revenue_per_kpi is not None:
-      outcome = summary_text.REVENUE_LABEL
-    else:
+    if self._use_kpi:
       outcome = summary_text.KPI_LABEL
+    else:
+      outcome = summary_text.REVENUE_LABEL
     total_media_outcome = (
         paid_summary_metrics[c.INCREMENTAL_OUTCOME]
         .sel(

google-meridian 1.2.1__py3-none-any.whl → 1.3.1__py3-none-any.whl

google-meridian 1.2.1py3-none-any.whl → 1.3.1py3-none-any.whl