PyPI - replay-rec - Versions diffs - 0.16.0rc0__py3-none-any.whl → 0.17.0__py3-none-any.whl - Mend

replay-rec 0.16.0rc0py3-none-any.whl → 0.17.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (162) hide show

replay/__init__.py +1 -1
replay/data/__init__.py +1 -1
replay/data/dataset.py +45 -42
replay/data/dataset_utils/dataset_label_encoder.py +6 -7
replay/data/nn/__init__.py +1 -1
replay/data/nn/schema.py +20 -33
replay/data/nn/sequence_tokenizer.py +217 -87
replay/data/nn/sequential_dataset.py +6 -22
replay/data/nn/torch_sequential_dataset.py +20 -11
replay/data/nn/utils.py +7 -9
replay/data/schema.py +17 -17
replay/data/spark_schema.py +0 -1
replay/metrics/base_metric.py +38 -79
replay/metrics/categorical_diversity.py +24 -58
replay/metrics/coverage.py +25 -49
replay/metrics/descriptors.py +4 -13
replay/metrics/experiment.py +3 -8
replay/metrics/hitrate.py +3 -6
replay/metrics/map.py +3 -6
replay/metrics/mrr.py +1 -4
replay/metrics/ndcg.py +4 -7
replay/metrics/novelty.py +10 -29
replay/metrics/offline_metrics.py +26 -61
replay/metrics/precision.py +3 -6
replay/metrics/recall.py +3 -6
replay/metrics/rocauc.py +7 -10
replay/metrics/surprisal.py +13 -30
replay/metrics/torch_metrics_builder.py +0 -4
replay/metrics/unexpectedness.py +15 -20
replay/models/__init__.py +1 -2
replay/models/als.py +7 -15
replay/models/association_rules.py +12 -28
replay/models/base_neighbour_rec.py +21 -36
replay/models/base_rec.py +92 -215
replay/models/cat_pop_rec.py +9 -22
replay/models/cluster.py +17 -28
replay/models/extensions/ann/ann_mixin.py +7 -12
replay/models/extensions/ann/entities/base_hnsw_param.py +1 -1
replay/models/extensions/ann/entities/hnswlib_param.py +0 -6
replay/models/extensions/ann/entities/nmslib_hnsw_param.py +0 -6
replay/models/extensions/ann/index_builders/driver_hnswlib_index_builder.py +4 -10
replay/models/extensions/ann/index_builders/driver_nmslib_index_builder.py +7 -11
replay/models/extensions/ann/index_builders/executor_hnswlib_index_builder.py +5 -12
replay/models/extensions/ann/index_builders/executor_nmslib_index_builder.py +11 -18
replay/models/extensions/ann/index_builders/nmslib_index_builder_mixin.py +1 -4
replay/models/extensions/ann/index_inferers/base_inferer.py +3 -10
replay/models/extensions/ann/index_inferers/hnswlib_filter_index_inferer.py +7 -17
replay/models/extensions/ann/index_inferers/hnswlib_index_inferer.py +6 -14
replay/models/extensions/ann/index_inferers/nmslib_filter_index_inferer.py +14 -28
replay/models/extensions/ann/index_inferers/nmslib_index_inferer.py +15 -25
replay/models/extensions/ann/index_inferers/utils.py +2 -9
replay/models/extensions/ann/index_stores/hdfs_index_store.py +4 -9
replay/models/extensions/ann/index_stores/shared_disk_index_store.py +2 -6
replay/models/extensions/ann/index_stores/spark_files_index_store.py +8 -14
replay/models/extensions/ann/index_stores/utils.py +5 -2
replay/models/extensions/ann/utils.py +3 -5
replay/models/kl_ucb.py +16 -22
replay/models/knn.py +37 -59
replay/models/nn/optimizer_utils/__init__.py +1 -6
replay/models/nn/optimizer_utils/optimizer_factory.py +3 -6
replay/models/nn/sequential/bert4rec/__init__.py +1 -1
replay/models/nn/sequential/bert4rec/dataset.py +6 -7
replay/models/nn/sequential/bert4rec/lightning.py +53 -56
replay/models/nn/sequential/bert4rec/model.py +12 -25
replay/models/nn/sequential/callbacks/__init__.py +1 -1
replay/models/nn/sequential/callbacks/prediction_callbacks.py +23 -25
replay/models/nn/sequential/callbacks/validation_callback.py +27 -30
replay/models/nn/sequential/postprocessors/postprocessors.py +1 -1
replay/models/nn/sequential/sasrec/dataset.py +8 -7
replay/models/nn/sequential/sasrec/lightning.py +53 -48
replay/models/nn/sequential/sasrec/model.py +4 -17
replay/models/pop_rec.py +9 -10
replay/models/query_pop_rec.py +7 -15
replay/models/random_rec.py +10 -18
replay/models/slim.py +8 -13
replay/models/thompson_sampling.py +13 -14
replay/models/ucb.py +11 -22
replay/models/wilson.py +5 -14
replay/models/word2vec.py +24 -69
replay/optimization/optuna_objective.py +13 -27
replay/preprocessing/__init__.py +1 -2
replay/preprocessing/converter.py +2 -7
replay/preprocessing/filters.py +67 -142
replay/preprocessing/history_based_fp.py +44 -116
replay/preprocessing/label_encoder.py +106 -68
replay/preprocessing/sessionizer.py +1 -11
replay/scenarios/fallback.py +3 -8
replay/splitters/base_splitter.py +43 -15
replay/splitters/cold_user_random_splitter.py +18 -31
replay/splitters/k_folds.py +14 -24
replay/splitters/last_n_splitter.py +33 -43
replay/splitters/new_users_splitter.py +31 -55
replay/splitters/random_splitter.py +16 -23
replay/splitters/ratio_splitter.py +30 -54
replay/splitters/time_splitter.py +13 -18
replay/splitters/two_stage_splitter.py +44 -79
replay/utils/__init__.py +1 -1
replay/utils/common.py +65 -0
replay/utils/dataframe_bucketizer.py +25 -31
replay/utils/distributions.py +3 -15
replay/utils/model_handler.py +36 -33
replay/utils/session_handler.py +11 -15
replay/utils/spark_utils.py +51 -85
replay/utils/time.py +8 -22
replay/utils/types.py +1 -3
{replay_rec-0.16.0rc0.dist-info → replay_rec-0.17.0.dist-info}/METADATA +2 -10
replay_rec-0.17.0.dist-info/RECORD +127 -0
{replay_rec-0.16.0rc0.dist-info → replay_rec-0.17.0.dist-info}/WHEEL +1 -1
replay/experimental/__init__.py +0 -0
replay/experimental/metrics/__init__.py +0 -61
replay/experimental/metrics/base_metric.py +0 -661
replay/experimental/metrics/coverage.py +0 -117
replay/experimental/metrics/experiment.py +0 -200
replay/experimental/metrics/hitrate.py +0 -27
replay/experimental/metrics/map.py +0 -31
replay/experimental/metrics/mrr.py +0 -19
replay/experimental/metrics/ncis_precision.py +0 -32
replay/experimental/metrics/ndcg.py +0 -50
replay/experimental/metrics/precision.py +0 -23
replay/experimental/metrics/recall.py +0 -26
replay/experimental/metrics/rocauc.py +0 -50
replay/experimental/metrics/surprisal.py +0 -102
replay/experimental/metrics/unexpectedness.py +0 -74
replay/experimental/models/__init__.py +0 -10
replay/experimental/models/admm_slim.py +0 -216
replay/experimental/models/base_neighbour_rec.py +0 -222
replay/experimental/models/base_rec.py +0 -1361
replay/experimental/models/base_torch_rec.py +0 -247
replay/experimental/models/cql.py +0 -468
replay/experimental/models/ddpg.py +0 -1007
replay/experimental/models/dt4rec/__init__.py +0 -0
replay/experimental/models/dt4rec/dt4rec.py +0 -193
replay/experimental/models/dt4rec/gpt1.py +0 -411
replay/experimental/models/dt4rec/trainer.py +0 -128
replay/experimental/models/dt4rec/utils.py +0 -274
replay/experimental/models/extensions/spark_custom_models/__init__.py +0 -0
replay/experimental/models/extensions/spark_custom_models/als_extension.py +0 -733
replay/experimental/models/implicit_wrap.py +0 -138
replay/experimental/models/lightfm_wrap.py +0 -327
replay/experimental/models/mult_vae.py +0 -374
replay/experimental/models/neuromf.py +0 -462
replay/experimental/models/scala_als.py +0 -311
replay/experimental/nn/data/__init__.py +0 -1
replay/experimental/nn/data/schema_builder.py +0 -58
replay/experimental/preprocessing/__init__.py +0 -3
replay/experimental/preprocessing/data_preparator.py +0 -929
replay/experimental/preprocessing/padder.py +0 -231
replay/experimental/preprocessing/sequence_generator.py +0 -218
replay/experimental/scenarios/__init__.py +0 -1
replay/experimental/scenarios/obp_wrapper/__init__.py +0 -8
replay/experimental/scenarios/obp_wrapper/obp_optuna_objective.py +0 -86
replay/experimental/scenarios/obp_wrapper/replay_offline.py +0 -271
replay/experimental/scenarios/obp_wrapper/utils.py +0 -88
replay/experimental/scenarios/two_stages/reranker.py +0 -116
replay/experimental/scenarios/two_stages/two_stages_scenario.py +0 -843
replay/experimental/utils/__init__.py +0 -0
replay/experimental/utils/logger.py +0 -24
replay/experimental/utils/model_handler.py +0 -213
replay/experimental/utils/session_handler.py +0 -47
replay_rec-0.16.0rc0.dist-info/NOTICE +0 -41
replay_rec-0.16.0rc0.dist-info/RECORD +0 -178
{replay_rec-0.16.0rc0.dist-info → replay_rec-0.17.0.dist-info}/LICENSE +0 -0

replay/metrics/coverage.py CHANGED Viewed

@@ -1,16 +1,20 @@
+import functools
+import operator
 from typing import Dict, List, Union
 import polars as pl
-from replay.utils import PYSPARK_AVAILABLE, PandasDataFrame, SparkDataFrame, PolarsDataFrame
+from replay.utils import PYSPARK_AVAILABLE, PandasDataFrame, PolarsDataFrame, SparkDataFrame
 from .base_metric import Metric, MetricsDataFrameLike, MetricsMeanReturnType, MetricsReturnType
 if PYSPARK_AVAILABLE:
-    from pyspark.sql import Window
-    from pyspark.sql import functions as sf
+    from pyspark.sql import (
+        Window,
+        functions as sf,
+    )
-# pylint: disable=too-few-public-methods
 class Coverage(Metric):
     """
     Metric calculation is as follows:
@@ -54,7 +58,6 @@ class Coverage(Metric):
     <BLANKLINE>
     """
-    # pylint: disable=too-many-arguments
     def __init__(
         self,
         topk: Union[List, int],
@@ -79,7 +82,6 @@ class Coverage(Metric):
         )
         self._allow_caching = allow_caching
-    # pylint: disable=arguments-differ
     def _get_enriched_recommendations(
         self,
         recommendations: Union[PolarsDataFrame, SparkDataFrame],
@@ -89,16 +91,9 @@ class Coverage(Metric):
         else:
             return self._get_enriched_recommendations_polars(recommendations)
-    # pylint: disable=arguments-differ
-    def _get_enriched_recommendations_spark(
-        self, recommendations: SparkDataFrame
-    ) -> SparkDataFrame:
-        window = Window.partitionBy(self.query_column).orderBy(
-            sf.col(self.rating_column).desc()
-        )
-        sorted_by_score_recommendations = recommendations.withColumn(
-            "rank", sf.row_number().over(window)
-        )
+    def _get_enriched_recommendations_spark(self, recommendations: SparkDataFrame) -> SparkDataFrame:
+        window = Window.partitionBy(self.query_column).orderBy(sf.col(self.rating_column).desc())
+        sorted_by_score_recommendations = recommendations.withColumn("rank", sf.row_number().over(window))
         grouped_recs = (
             sorted_by_score_recommendations.select(self.item_column, "rank")
             .groupBy(self.item_column)
@@ -106,10 +101,7 @@ class Coverage(Metric):
         )
         return grouped_recs
-    # pylint: disable=arguments-differ
-    def _get_enriched_recommendations_polars(
-        self, recommendations: PolarsDataFrame
-    ) -> PolarsDataFrame:
+    def _get_enriched_recommendations_polars(self, recommendations: PolarsDataFrame) -> PolarsDataFrame:
         sorted_by_score_recommendations = recommendations.select(
             pl.all().sort_by(self.rating_column, descending=True).over(self.query_column)
         )
@@ -119,17 +111,13 @@ class Coverage(Metric):
             )
         )
         grouped_recs = (
-            sorted_by_score_recommendations
-            .select(self.item_column, "rank")
+            sorted_by_score_recommendations.select(self.item_column, "rank")
             .group_by(self.item_column)
             .agg(pl.col("rank").min().alias("best_position"))
         )
         return grouped_recs
-    # pylint: disable=arguments-differ
-    def _spark_compute(
-        self, recs: SparkDataFrame, train: SparkDataFrame
-    ) -> MetricsMeanReturnType:
+    def _spark_compute(self, recs: SparkDataFrame, train: SparkDataFrame) -> MetricsMeanReturnType:
         """
         Calculating metrics for PySpark DataFrame.
         """
@@ -144,10 +132,9 @@ class Coverage(Metric):
                 recs.filter(sf.col("best_position") <= k)
                 .select(self.item_column)
                 .distinct()
-                .join(
-                    train.select(self.item_column).distinct(), on=self.item_column
-                )
-                .count() / item_count
+                .join(train.select(self.item_column).distinct(), on=self.item_column)
+                .count()
+                / item_count
             )
             metrics.append(res)
@@ -156,10 +143,7 @@ class Coverage(Metric):
         return self._aggregate_results(metrics)
-    # pylint: disable=arguments-differ
-    def _polars_compute(
-        self, recs: PolarsDataFrame, train: PolarsDataFrame
-    ) -> MetricsMeanReturnType:
+    def _polars_compute(self, recs: PolarsDataFrame, train: PolarsDataFrame) -> MetricsMeanReturnType:
         """
         Calculating metrics for Polars DataFrame.
         """
@@ -172,44 +156,38 @@ class Coverage(Metric):
                 .select(self.item_column)
                 .unique()
                 .join(train.select(self.item_column).unique(), on=self.item_column)
-                .count() / item_count
+                .count()
+                / item_count
             ).rows()[0][0]
             metrics.append(res)
         return self._aggregate_results(metrics)
-    # pylint: disable=arguments-renamed
-    def _spark_call(
-        self, recommendations: SparkDataFrame, train: SparkDataFrame
-    ) -> MetricsReturnType:
+    def _spark_call(self, recommendations: SparkDataFrame, train: SparkDataFrame) -> MetricsReturnType:
         """
         Implementation for Pyspark DataFrame.
         """
         recs = self._get_enriched_recommendations(recommendations)
         return self._spark_compute(recs, train)
-    # pylint: disable=arguments-renamed
-    def _polars_call(
-        self, recommendations: PolarsDataFrame, train: PolarsDataFrame
-    ) -> MetricsReturnType:
+    def _polars_call(self, recommendations: PolarsDataFrame, train: PolarsDataFrame) -> MetricsReturnType:
         """
         Implementation for Polars DataFrame.
         """
         recs = self._get_enriched_recommendations(recommendations)
         return self._polars_compute(recs, train)
-    # pylint: disable=arguments-differ
     def _dict_call(self, recommendations: Dict, train: Dict) -> MetricsReturnType:
         """
         Calculating metrics in dict format.
         """
-        train_items = set(sum(train.values(), []))
+        train_items = set(functools.reduce(operator.iconcat, train.values(), []))
         len_train_items = len(train_items)
         metrics = []
         for k in self.topk:
             pred_items = set()
-            for _, items in recommendations.items():
+            for items in recommendations.values():
                 for item in items[:k]:
                     pred_items.add(item)
             metrics.append(len(pred_items & train_items) / len_train_items)
@@ -250,9 +228,7 @@ class Coverage(Metric):
             else self._convert_dict_to_dict_with_score(recommendations)
         )
         self._check_duplicates_dict(recommendations)
-        train = (
-            self._convert_pandas_to_dict_without_score(train) if is_pandas else train
-        )
+        train = self._convert_pandas_to_dict_without_score(train) if is_pandas else train
         assert isinstance(train, dict)
         return self._dict_call(recommendations, train)

replay/metrics/descriptors.py CHANGED Viewed

@@ -4,7 +4,7 @@ from typing import Union
 import numpy as np
 from scipy.stats import norm, sem
-from replay.utils import PYSPARK_AVAILABLE, SparkDataFrame, PolarsDataFrame
+from replay.utils import PYSPARK_AVAILABLE, PolarsDataFrame, SparkDataFrame
 if PYSPARK_AVAILABLE:
     from pyspark.sql import functions as sf
@@ -66,9 +66,7 @@ class Median(CalculationDescriptor):
     def spark(self, distribution: SparkDataFrame):
         column_name = distribution.columns[0]
-        return distribution.select(
-            sf.expr(f"percentile_approx({column_name}, 0.5)")
-        ).first()[0]
+        return distribution.select(sf.expr(f"percentile_approx({column_name}, 0.5)")).first()[0]
     def cpu(self, distribution: Union[np.array, PolarsDataFrame]):
         if isinstance(distribution, PolarsDataFrame):
@@ -119,12 +117,5 @@ class ConfidenceInterval(CalculationDescriptor):
         column_name = distribution.columns[0]
         quantile = norm.ppf((1 + self.alpha) / 2)
         count = distribution.select(column_name).count().rows()[0][0]
-        std = (
-            distribution
-            .select(column_name)
-            .std()
-            .fill_null(0.0)
-            .fill_nan(0.0)
-            .rows()[0][0]
-        )
-        return quantile * std / (count ** 0.5)
+        std = distribution.select(column_name).std().fill_null(0.0).fill_nan(0.0).rows()[0][0]
+        return quantile * std / (count**0.5)

replay/metrics/experiment.py CHANGED Viewed

@@ -6,8 +6,6 @@ from .base_metric import Metric, MetricsDataFrameLike
 from .offline_metrics import OfflineMetrics
-# pylint: disable=too-many-instance-attributes
-# pylint: disable=too-few-public-methods
 class Experiment:
     """
     The class is designed for calculating, storing and comparing metrics
@@ -102,15 +100,12 @@ class Experiment:
     <BLANKLINE>
     """
-    # pylint: disable=too-many-arguments
     def __init__(
         self,
         metrics: List[Metric],
         ground_truth: MetricsDataFrameLike,
         train: Optional[MetricsDataFrameLike] = None,
-        base_recommendations: Optional[
-            Union[MetricsDataFrameLike, Dict[str, MetricsDataFrameLike]]
-        ] = None,
+        base_recommendations: Optional[Union[MetricsDataFrameLike, Dict[str, MetricsDataFrameLike]]] = None,
         query_column: str = "query_id",
         item_column: str = "item_id",
         rating_column: str = "rating",
@@ -182,7 +177,6 @@ class Experiment:
         for metric, value in cur_metrics.items():
             self.results.at[name, metric] = value
-    # pylint: disable=not-an-iterable
     def compare(self, name: str) -> pd.DataFrame:
         """
         Show results as a percentage difference to record ``name``.
@@ -191,7 +185,8 @@ class Experiment:
         :return: results table in a percentage format
         """
         if name not in self.results.index:
-            raise ValueError(f"No results for model {name}")
+            msg = f"No results for model {name}"
+            raise ValueError(msg)
         columns = [column for column in self.results.columns if column[-1].isdigit()]
         data_frame = self.results[columns].copy()
         baseline = data_frame.loc[name]

replay/metrics/hitrate.py CHANGED Viewed

@@ -3,17 +3,16 @@ from typing import List
 from .base_metric import Metric
-# pylint: disable=too-few-public-methods
 class HitRate(Metric):
     """
     Percentage of users that have at least one correctly recommended item\
         among top-k.
     .. math::
-        HitRate@K(i) = \max_{j \in [1..K]}\mathbb{1}_{r_{ij}}
+        HitRate@K(i) = \\max_{j \\in [1..K]}\\mathbb{1}_{r_{ij}}
     .. math::
-        HitRate@K = \\frac {\sum_{i=1}^{N}HitRate@K(i)}{N}
+        HitRate@K = \\frac {\\sum_{i=1}^{N}HitRate@K(i)}{N}
     :math:`\\mathbb{1}_{r_{ij}}` -- indicator function stating that user :math:`i` interacted with item :math:`j`
@@ -63,9 +62,7 @@ class HitRate(Metric):
     """
     @staticmethod
-    def _get_metric_value_by_user(  # pylint: disable=arguments-differ
-        ks: List[int], ground_truth: List, pred: List
-    ) -> List[float]:
+    def _get_metric_value_by_user(ks: List[int], ground_truth: List, pred: List) -> List[float]:
         if not ground_truth or not pred:
             return [0.0 for _ in ks]
         set_gt = set(ground_truth)

replay/metrics/map.py CHANGED Viewed

@@ -3,16 +3,15 @@ from typing import List
 from .base_metric import Metric
-# pylint: disable=too-few-public-methods
 class MAP(Metric):
     """
     Mean Average Precision -- average the ``Precision`` at relevant positions \
         for each user, and then calculate the mean across all users.
     .. math::
-        &AP@K(i) = \\frac {1}{\min(K, |Rel_i|)} \sum_{j=1}^{K}\mathbb{1}_{r_{ij}}Precision@j(i)
+        &AP@K(i) = \\frac {1}{\\min(K, |Rel_i|)} \\sum_{j=1}^{K}\\mathbb{1}_{r_{ij}}Precision@j(i)
-        &MAP@K = \\frac {\sum_{i=1}^{N}AP@K(i)}{N}
+        &MAP@K = \\frac {\\sum_{i=1}^{N}AP@K(i)}{N}
     :math:`\\mathbb{1}_{r_{ij}}` -- indicator function showing if user :math:`i` interacted with item :math:`j`
@@ -64,9 +63,7 @@ class MAP(Metric):
     """
     @staticmethod
-    def _get_metric_value_by_user(  # pylint: disable=arguments-differ
-        ks: List[int], ground_truth: List, pred: List
-    ) -> List[float]:
+    def _get_metric_value_by_user(ks: List[int], ground_truth: List, pred: List) -> List[float]:
         if not ground_truth or not pred:
             return [0.0 for _ in ks]
         res = []

replay/metrics/mrr.py CHANGED Viewed

@@ -3,7 +3,6 @@ from typing import List
 from .base_metric import Metric
-# pylint: disable=too-few-public-methods
 class MRR(Metric):
     """
     Mean Reciprocal Rank -- Reciprocal Rank is the inverse position of the
@@ -56,9 +55,7 @@ class MRR(Metric):
     """
     @staticmethod
-    def _get_metric_value_by_user(  # pylint: disable=arguments-differ
-        ks: List[int], ground_truth: List, pred: List
-    ) -> List[float]:
+    def _get_metric_value_by_user(ks: List[int], ground_truth: List, pred: List) -> List[float]:
         if not ground_truth or not pred:
             return [0.0 for _ in ks]
         set_gt = set(ground_truth)

replay/metrics/ndcg.py CHANGED Viewed

@@ -4,7 +4,6 @@ from typing import List
 from .base_metric import Metric
-# pylint: disable=too-few-public-methods
 class NDCG(Metric):
     """
     Normalized Discounted Cumulative Gain is a metric
@@ -14,7 +13,7 @@ class NDCG(Metric):
     whether the item was consumed or not, relevance value is ignored.
     .. math::
-        DCG@K(i) = \sum_{j=1}^{K}\\frac{\mathbb{1}_{r_{ij}}}{\log_2 (j+1)}
+        DCG@K(i) = \\sum_{j=1}^{K}\\frac{\\mathbb{1}_{r_{ij}}}{\\log_2 (j+1)}
     :math:`\\mathbb{1}_{r_{ij}}` -- indicator function showing that user :math:`i` interacted with item :math:`j`
@@ -23,7 +22,7 @@ class NDCG(Metric):
     for user :math:`i` and recommendation length :math:`K`.
     .. math::
-        IDCG@K(i) = max(DCG@K(i)) = \sum_{j=1}^{K}\\frac{\mathbb{1}_{j\le|Rel_i|}}{\log_2 (j+1)}
+        IDCG@K(i) = max(DCG@K(i)) = \\sum_{j=1}^{K}\\frac{\\mathbb{1}_{j\\le|Rel_i|}}{\\log_2 (j+1)}
     .. math::
         nDCG@K(i) = \\frac {DCG@K(i)}{IDCG@K(i)}
@@ -33,7 +32,7 @@ class NDCG(Metric):
     Metric is averaged by users.
     .. math::
-        nDCG@K = \\frac {\sum_{i=1}^{N}nDCG@K(i)}{N}
+        nDCG@K = \\frac {\\sum_{i=1}^{N}nDCG@K(i)}{N}
     >>> recommendations
        query_id  item_id  rating
@@ -81,9 +80,7 @@ class NDCG(Metric):
     """
     @staticmethod
-    def _get_metric_value_by_user(  # pylint: disable=arguments-differ
-        ks: List[int], ground_truth: List, pred: List
-    ) -> List[float]:
+    def _get_metric_value_by_user(ks: List[int], ground_truth: List, pred: List) -> List[float]:
         if not pred or not ground_truth:
             return [0.0 for _ in ks]
         set_gt = set(ground_truth)

replay/metrics/novelty.py CHANGED Viewed

@@ -1,6 +1,6 @@
 from typing import TYPE_CHECKING, List, Type
-from replay.utils import PandasDataFrame, SparkDataFrame, PolarsDataFrame
+from replay.utils import PandasDataFrame, PolarsDataFrame, SparkDataFrame
 from .base_metric import Metric, MetricsDataFrameLike, MetricsReturnType
@@ -8,7 +8,6 @@ if TYPE_CHECKING:  # pragma: no cover
     __class__: Type
-# pylint: disable=too-few-public-methods
 class Novelty(Metric):
     """
     Measure the fraction of shown items in recommendation list, that users\
@@ -16,11 +15,11 @@ class Novelty(Metric):
     .. math::
         Novelty@K(i) = \\frac
-        {\parallel {R^{i}_{1..\min(K, \parallel R^{i} \parallel)} \setminus train^{i}} \parallel}
+        {\\parallel {R^{i}_{1..\\min(K, \\parallel R^{i} \\parallel)} \\setminus train^{i}} \\parallel}
         {K}
     .. math::
-        Novelty@K = \\frac {1}{N}\sum_{i=1}^{N}Novelty@K(i)
+        Novelty@K = \\frac {1}{N}\\sum_{i=1}^{N}Novelty@K(i)
     :math:`R^{i}` -- the recommendations for the :math:`i`-th user.
@@ -114,9 +113,7 @@ class Novelty(Metric):
             else self._convert_dict_to_dict_with_score(recommendations)
         )
         self._check_duplicates_dict(recommendations)
-        train = (
-            self._convert_pandas_to_dict_without_score(train) if is_pandas else train
-        )
+        train = self._convert_pandas_to_dict_without_score(train) if is_pandas else train
         assert isinstance(train, dict)
         return self._dict_call(
@@ -125,41 +122,25 @@ class Novelty(Metric):
             train=train,
         )
-    # pylint: disable=arguments-renamed
-    def _spark_call(
-        self, recommendations: SparkDataFrame, train: SparkDataFrame
-    ) -> MetricsReturnType:
+    def _spark_call(self, recommendations: SparkDataFrame, train: SparkDataFrame) -> MetricsReturnType:
         """
         Implementation for Pyspark DataFrame.
         """
-        recs = self._get_enriched_recommendations(
-            recommendations, train
-        ).withColumnRenamed("ground_truth", "train")
+        recs = self._get_enriched_recommendations(recommendations, train).withColumnRenamed("ground_truth", "train")
         recs = self._rearrange_columns(recs)
         return self._spark_compute(recs)
-    # pylint: disable=arguments-renamed
-    def _polars_call(
-        self, recommendations: PolarsDataFrame, train: PolarsDataFrame
-    ) -> MetricsReturnType:
+    def _polars_call(self, recommendations: PolarsDataFrame, train: PolarsDataFrame) -> MetricsReturnType:
         """
         Implementation for Polars DataFrame.
         """
-        recs = self._get_enriched_recommendations(
-            recommendations, train
-        ).rename({"ground_truth": "train"})
+        recs = self._get_enriched_recommendations(recommendations, train).rename({"ground_truth": "train"})
         recs = self._rearrange_columns(recs)
         return self._polars_compute(recs)
-    # pylint: disable=arguments-differ
     @staticmethod
-    def _get_metric_value_by_user(
-        ks: List[int], pred: List, train: List
-    ) -> List[float]:
+    def _get_metric_value_by_user(ks: List[int], pred: List, train: List) -> List[float]:
         if not train or not pred:
             return [1.0 for _ in ks]
         set_train = set(train)
-        res = []
-        for k in ks:
-            res.append(1.0 - len(set(pred[:k]) & set_train) / len(pred[:k]))
-        return res
+        return [1.0 - len(set(pred[:k]) & set_train) / len(pred[:k]) for k in ks]

replay-rec 0.16.0rc0__py3-none-any.whl → 0.17.0__py3-none-any.whl

replay-rec 0.16.0rc0py3-none-any.whl → 0.17.0py3-none-any.whl