PyPI - nextrec - Versions diffs - 0.3.6__py3-none-any.whl → 0.4.2__py3-none-any.whl - Mend

nextrec 0.3.6py3-none-any.whl → 0.4.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (62) hide show

nextrec/__init__.py +1 -1
nextrec/__version__.py +1 -1
nextrec/basic/activation.py +10 -5
nextrec/basic/callback.py +1 -0
nextrec/basic/features.py +30 -22
nextrec/basic/layers.py +244 -113
nextrec/basic/loggers.py +62 -43
nextrec/basic/metrics.py +268 -119
nextrec/basic/model.py +1373 -443
nextrec/basic/session.py +10 -3
nextrec/cli.py +498 -0
nextrec/data/__init__.py +19 -25
nextrec/data/batch_utils.py +11 -3
nextrec/data/data_processing.py +42 -24
nextrec/data/data_utils.py +26 -15
nextrec/data/dataloader.py +303 -96
nextrec/data/preprocessor.py +320 -199
nextrec/loss/listwise.py +17 -9
nextrec/loss/loss_utils.py +7 -8
nextrec/loss/pairwise.py +2 -0
nextrec/loss/pointwise.py +30 -12
nextrec/models/generative/hstu.py +106 -40
nextrec/models/match/dssm.py +82 -69
nextrec/models/match/dssm_v2.py +72 -58
nextrec/models/match/mind.py +175 -108
nextrec/models/match/sdm.py +104 -88
nextrec/models/match/youtube_dnn.py +73 -60
nextrec/models/multi_task/esmm.py +53 -39
nextrec/models/multi_task/mmoe.py +70 -47
nextrec/models/multi_task/ple.py +107 -50
nextrec/models/multi_task/poso.py +121 -41
nextrec/models/multi_task/share_bottom.py +54 -38
nextrec/models/ranking/afm.py +172 -45
nextrec/models/ranking/autoint.py +84 -61
nextrec/models/ranking/dcn.py +59 -42
nextrec/models/ranking/dcn_v2.py +64 -23
nextrec/models/ranking/deepfm.py +36 -26
nextrec/models/ranking/dien.py +158 -102
nextrec/models/ranking/din.py +88 -60
nextrec/models/ranking/fibinet.py +55 -35
nextrec/models/ranking/fm.py +32 -26
nextrec/models/ranking/masknet.py +95 -34
nextrec/models/ranking/pnn.py +34 -31
nextrec/models/ranking/widedeep.py +37 -29
nextrec/models/ranking/xdeepfm.py +63 -41
nextrec/utils/__init__.py +61 -32
nextrec/utils/config.py +490 -0
nextrec/utils/device.py +52 -12
nextrec/utils/distributed.py +141 -0
nextrec/utils/embedding.py +1 -0
nextrec/utils/feature.py +1 -0
nextrec/utils/file.py +32 -11
nextrec/utils/initializer.py +61 -16
nextrec/utils/optimizer.py +25 -9
nextrec/utils/synthetic_data.py +531 -0
nextrec/utils/tensor.py +24 -13
{nextrec-0.3.6.dist-info → nextrec-0.4.2.dist-info}/METADATA +15 -5
nextrec-0.4.2.dist-info/RECORD +69 -0
nextrec-0.4.2.dist-info/entry_points.txt +2 -0
nextrec-0.3.6.dist-info/RECORD +0 -64
{nextrec-0.3.6.dist-info → nextrec-0.4.2.dist-info}/WHEEL +0 -0
{nextrec-0.3.6.dist-info → nextrec-0.4.2.dist-info}/licenses/LICENSE +0 -0

nextrec/models/match/mind.py CHANGED Viewed

@@ -6,6 +6,7 @@ Reference:
     [1] Li C, Liu Z, Wu M, et al. Multi-interest network with dynamic routing for recommendation at Tmall[C]
         //Proceedings of the 28th ACM international conference on information and knowledge management. 2019: 2615-2623.
 """
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
@@ -15,6 +16,7 @@ from nextrec.basic.model import BaseMatchModel
 from nextrec.basic.features import DenseFeature, SparseFeature, SequenceFeature
 from nextrec.basic.layers import MLP, EmbeddingLayer
 class MultiInterestSA(nn.Module):
     """Multi-interest self-attention extractor from MIND (Li et al., 2019)."""
@@ -22,19 +24,25 @@ class MultiInterestSA(nn.Module):
         super(MultiInterestSA, self).__init__()
         self.embedding_dim = embedding_dim
         self.interest_num = interest_num
-        if hidden_dim == None:
+        if hidden_dim is None:
             self.hidden_dim = self.embedding_dim * 4
-        self.W1 = torch.nn.Parameter(torch.rand(self.embedding_dim, self.hidden_dim), requires_grad=True)
-        self.W2 = torch.nn.Parameter(torch.rand(self.hidden_dim, self.interest_num), requires_grad=True)
-        self.W3 = torch.nn.Parameter(torch.rand(self.embedding_dim, self.embedding_dim), requires_grad=True)
+        self.W1 = torch.nn.Parameter(
+            torch.rand(self.embedding_dim, self.hidden_dim), requires_grad=True
+        )
+        self.W2 = torch.nn.Parameter(
+            torch.rand(self.hidden_dim, self.interest_num), requires_grad=True
+        )
+        self.W3 = torch.nn.Parameter(
+            torch.rand(self.embedding_dim, self.embedding_dim), requires_grad=True
+        )
     def forward(self, seq_emb, mask=None):
-        H = torch.einsum('bse, ed -> bsd', seq_emb, self.W1).tanh()
-        if mask != None:
-            A = torch.einsum('bsd, dk -> bsk', H, self.W2) + -1.e9 * (1 - mask.float())
+        H = torch.einsum("bse, ed -> bsd", seq_emb, self.W1).tanh()
+        if mask is not None:
+            A = torch.einsum("bsd, dk -> bsk", H, self.W2) + -1.0e9 * (1 - mask.float())
             A = F.softmax(A, dim=1)
         else:
-            A = F.softmax(torch.einsum('bsd, dk -> bsk', H, self.W2), dim=1)
+            A = F.softmax(torch.einsum("bsd, dk -> bsk", H, self.W2), dim=1)
         A = A.permute(0, 2, 1)
         multi_interest_emb = torch.matmul(A, seq_emb)
         return multi_interest_emb
@@ -43,7 +51,15 @@ class MultiInterestSA(nn.Module):
 class CapsuleNetwork(nn.Module):
     """Dynamic routing capsule network used in MIND (Li et al., 2019)."""
-    def __init__(self, embedding_dim, seq_len, bilinear_type=2, interest_num=4, routing_times=3, relu_layer=False):
+    def __init__(
+        self,
+        embedding_dim,
+        seq_len,
+        bilinear_type=2,
+        interest_num=4,
+        routing_times=3,
+        relu_layer=False,
+    ):
         super(CapsuleNetwork, self).__init__()
         self.embedding_dim = embedding_dim  # h
         self.seq_len = seq_len  # s
@@ -53,13 +69,24 @@ class CapsuleNetwork(nn.Module):
         self.relu_layer = relu_layer
         self.stop_grad = True
-        self.relu = nn.Sequential(nn.Linear(self.embedding_dim, self.embedding_dim, bias=False), nn.ReLU())
+        self.relu = nn.Sequential(
+            nn.Linear(self.embedding_dim, self.embedding_dim, bias=False), nn.ReLU()
+        )
         if self.bilinear_type == 0:  # MIND
             self.linear = nn.Linear(self.embedding_dim, self.embedding_dim, bias=False)
         elif self.bilinear_type == 1:
-            self.linear = nn.Linear(self.embedding_dim, self.embedding_dim * self.interest_num, bias=False)
+            self.linear = nn.Linear(
+                self.embedding_dim, self.embedding_dim * self.interest_num, bias=False
+            )
         else:
-            self.w = nn.Parameter(torch.Tensor(1, self.seq_len, self.interest_num * self.embedding_dim, self.embedding_dim))
+            self.w = nn.Parameter(
+                torch.Tensor(
+                    1,
+                    self.seq_len,
+                    self.interest_num * self.embedding_dim,
+                    self.embedding_dim,
+                )
+            )
             nn.init.xavier_uniform_(self.w)
     def forward(self, item_eb, mask):
@@ -70,11 +97,15 @@ class CapsuleNetwork(nn.Module):
             item_eb_hat = self.linear(item_eb)
         else:
             u = torch.unsqueeze(item_eb, dim=2)
-            item_eb_hat = torch.sum(self.w[:, :self.seq_len, :, :] * u, dim=3)
+            item_eb_hat = torch.sum(self.w[:, : self.seq_len, :, :] * u, dim=3)
-        item_eb_hat = torch.reshape(item_eb_hat, (-1, self.seq_len, self.interest_num, self.embedding_dim))
+        item_eb_hat = torch.reshape(
+            item_eb_hat, (-1, self.seq_len, self.interest_num, self.embedding_dim)
+        )
         item_eb_hat = torch.transpose(item_eb_hat, 1, 2).contiguous()
-        item_eb_hat = torch.reshape(item_eb_hat, (-1, self.interest_num, self.seq_len, self.embedding_dim))
+        item_eb_hat = torch.reshape(
+            item_eb_hat, (-1, self.interest_num, self.seq_len, self.embedding_dim)
+        )
         if self.stop_grad:
             item_eb_hat_iter = item_eb_hat.detach()
@@ -82,34 +113,47 @@ class CapsuleNetwork(nn.Module):
             item_eb_hat_iter = item_eb_hat
         if self.bilinear_type > 0:
-            capsule_weight = torch.zeros(item_eb_hat.shape[0],
-                                         self.interest_num,
-                                         self.seq_len,
-                                         device=item_eb.device,
-                                         requires_grad=False)
+            capsule_weight = torch.zeros(
+                item_eb_hat.shape[0],
+                self.interest_num,
+                self.seq_len,
+                device=item_eb.device,
+                requires_grad=False,
+            )
         else:
-            capsule_weight = torch.randn(item_eb_hat.shape[0],
-                                         self.interest_num,
-                                         self.seq_len,
-                                         device=item_eb.device,
-                                         requires_grad=False)
+            capsule_weight = torch.randn(
+                item_eb_hat.shape[0],
+                self.interest_num,
+                self.seq_len,
+                device=item_eb.device,
+                requires_grad=False,
+            )
         for i in range(self.routing_times):  # 动态路由传播3次
             atten_mask = torch.unsqueeze(mask, 1).repeat(1, self.interest_num, 1)
             paddings = torch.zeros_like(atten_mask, dtype=torch.float)
             capsule_softmax_weight = F.softmax(capsule_weight, dim=-1)
-            capsule_softmax_weight = torch.where(torch.eq(atten_mask, 0), paddings, capsule_softmax_weight)
+            capsule_softmax_weight = torch.where(
+                torch.eq(atten_mask, 0), paddings, capsule_softmax_weight
+            )
             capsule_softmax_weight = torch.unsqueeze(capsule_softmax_weight, 2)
             if i < 2:
-                interest_capsule = torch.matmul(capsule_softmax_weight, item_eb_hat_iter)
+                interest_capsule = torch.matmul(
+                    capsule_softmax_weight, item_eb_hat_iter
+                )
                 cap_norm = torch.sum(torch.square(interest_capsule), -1, True)
                 scalar_factor = cap_norm / (1 + cap_norm) / torch.sqrt(cap_norm + 1e-9)
                 interest_capsule = scalar_factor * interest_capsule
-                delta_weight = torch.matmul(item_eb_hat_iter, torch.transpose(interest_capsule, 2, 3).contiguous())
-                delta_weight = torch.reshape(delta_weight, (-1, self.interest_num, self.seq_len))
+                delta_weight = torch.matmul(
+                    item_eb_hat_iter,
+                    torch.transpose(interest_capsule, 2, 3).contiguous(),
+                )
+                delta_weight = torch.reshape(
+                    delta_weight, (-1, self.interest_num, self.seq_len)
+                )
                 capsule_weight = capsule_weight + delta_weight
             else:
                 interest_capsule = torch.matmul(capsule_softmax_weight, item_eb_hat)
@@ -117,7 +161,9 @@ class CapsuleNetwork(nn.Module):
                 scalar_factor = cap_norm / (1 + cap_norm) / torch.sqrt(cap_norm + 1e-9)
                 interest_capsule = scalar_factor * interest_capsule
-        interest_capsule = torch.reshape(interest_capsule, (-1, self.interest_num, self.embedding_dim))
+        interest_capsule = torch.reshape(
+            interest_capsule, (-1, self.interest_num, self.embedding_dim)
+        )
         if self.relu_layer:
             interest_capsule = self.relu(interest_capsule)
@@ -129,45 +175,52 @@ class MIND(BaseMatchModel):
     @property
     def model_name(self) -> str:
         return "MIND"
     @property
     def support_training_modes(self) -> list[str]:
         """MIND only supports pointwise training mode"""
-        return ['pointwise']
-    def __init__(self,
-                 user_dense_features: list[DenseFeature] | None = None,
-                 user_sparse_features: list[SparseFeature] | None = None,
-                 user_sequence_features: list[SequenceFeature] | None = None,
-                 item_dense_features: list[DenseFeature] | None = None,
-                 item_sparse_features: list[SparseFeature] | None = None,
-                 item_sequence_features: list[SequenceFeature] | None = None,
-                 embedding_dim: int = 64,
-                 num_interests: int = 4,
-                 capsule_bilinear_type: int = 2,
-                 routing_times: int = 3,
-                 relu_layer: bool = False,
-                 item_dnn_hidden_units: list[int] = [256, 128],
-                 dnn_activation: str = 'relu',
-                 dnn_dropout: float = 0.0,
-                 training_mode: Literal['pointwise', 'pairwise', 'listwise'] = 'pointwise',
-                 num_negative_samples: int = 100,
-                 temperature: float = 1.0,
-                 similarity_metric: Literal['dot', 'cosine', 'euclidean'] = 'dot',
-                 device: str = 'cpu',
-                 embedding_l1_reg: float = 0.0,
-                 dense_l1_reg: float = 0.0,
-                 embedding_l2_reg: float = 0.0,
-                 dense_l2_reg: float = 0.0,
-                 early_stop_patience: int = 20,
-                 optimizer: str | torch.optim.Optimizer = "adam",
-                 optimizer_params: dict | None = None,
-                 scheduler: str | torch.optim.lr_scheduler._LRScheduler | type[torch.optim.lr_scheduler._LRScheduler] | None = None,
-                 scheduler_params: dict | None = None,
-                 loss: str | nn.Module | list[str | nn.Module] | None = "bce",
-                 loss_params: dict | list[dict] | None = None,
-                 **kwargs):
+        return ["pointwise"]
+    def __init__(
+        self,
+        user_dense_features: list[DenseFeature] | None = None,
+        user_sparse_features: list[SparseFeature] | None = None,
+        user_sequence_features: list[SequenceFeature] | None = None,
+        item_dense_features: list[DenseFeature] | None = None,
+        item_sparse_features: list[SparseFeature] | None = None,
+        item_sequence_features: list[SequenceFeature] | None = None,
+        embedding_dim: int = 64,
+        num_interests: int = 4,
+        capsule_bilinear_type: int = 2,
+        routing_times: int = 3,
+        relu_layer: bool = False,
+        item_dnn_hidden_units: list[int] = [256, 128],
+        dnn_activation: str = "relu",
+        dnn_dropout: float = 0.0,
+        training_mode: Literal["pointwise", "pairwise", "listwise"] = "pointwise",
+        num_negative_samples: int = 100,
+        temperature: float = 1.0,
+        similarity_metric: Literal["dot", "cosine", "euclidean"] = "dot",
+        device: str = "cpu",
+        embedding_l1_reg: float = 0.0,
+        dense_l1_reg: float = 0.0,
+        embedding_l2_reg: float = 0.0,
+        dense_l2_reg: float = 0.0,
+        early_stop_patience: int = 20,
+        optimizer: str | torch.optim.Optimizer = "adam",
+        optimizer_params: dict | None = None,
+        scheduler: (
+            str
+            | torch.optim.lr_scheduler._LRScheduler
+            | type[torch.optim.lr_scheduler._LRScheduler]
+            | None
+        ) = None,
+        scheduler_params: dict | None = None,
+        loss: str | nn.Module | list[str | nn.Module] | None = "bce",
+        loss_params: dict | list[dict] | None = None,
+        **kwargs,
+    ):
         super(MIND, self).__init__(
             user_dense_features=user_dense_features,
             user_sparse_features=user_sparse_features,
@@ -184,10 +237,9 @@ class MIND(BaseMatchModel):
             dense_l1_reg=dense_l1_reg,
             embedding_l2_reg=embedding_l2_reg,
             dense_l2_reg=dense_l2_reg,
-            early_stop_patience=early_stop_patience,
-            **kwargs
+            **kwargs,
         )
         self.embedding_dim = embedding_dim
         self.num_interests = num_interests
         self.item_dnn_hidden_units = item_dnn_hidden_units
@@ -199,16 +251,20 @@ class MIND(BaseMatchModel):
             user_features.extend(user_sparse_features)
         if user_sequence_features:
             user_features.extend(user_sequence_features)
         if len(user_features) > 0:
             self.user_embedding = EmbeddingLayer(user_features)
             if not user_sequence_features or len(user_sequence_features) == 0:
                 raise ValueError("MIND requires at least one user sequence feature")
-            seq_max_len = user_sequence_features[0].max_len if user_sequence_features[0].max_len else 50
+            seq_max_len = (
+                user_sequence_features[0].max_len
+                if user_sequence_features[0].max_len
+                else 50
+            )
             seq_embedding_dim = user_sequence_features[0].embedding_dim
             # Capsule Network for multi-interest extraction
             self.capsule_network = CapsuleNetwork(
                 embedding_dim=seq_embedding_dim,
@@ -216,15 +272,17 @@ class MIND(BaseMatchModel):
                 bilinear_type=capsule_bilinear_type,
                 interest_num=num_interests,
                 routing_times=routing_times,
-                relu_layer=relu_layer
+                relu_layer=relu_layer,
             )
             if seq_embedding_dim != embedding_dim:
-                self.interest_projection = nn.Linear(seq_embedding_dim, embedding_dim, bias=False)
+                self.interest_projection = nn.Linear(
+                    seq_embedding_dim, embedding_dim, bias=False
+                )
                 nn.init.xavier_uniform_(self.interest_projection.weight)
             else:
                 self.interest_projection = None
         # Item tower
         item_features = []
         if item_dense_features:
@@ -233,10 +291,10 @@ class MIND(BaseMatchModel):
             item_features.extend(item_sparse_features)
         if item_sequence_features:
             item_features.extend(item_sequence_features)
         if len(item_features) > 0:
             self.item_embedding = EmbeddingLayer(item_features)
             item_input_dim = 0
             for feat in item_dense_features or []:
                 item_input_dim += 1
@@ -244,7 +302,7 @@ class MIND(BaseMatchModel):
                 item_input_dim += feat.embedding_dim
             for feat in item_sequence_features or []:
                 item_input_dim += feat.embedding_dim
             # Item DNN
             if len(item_dnn_hidden_units) > 0:
                 item_dnn_units = item_dnn_hidden_units + [embedding_dim]
@@ -253,20 +311,19 @@ class MIND(BaseMatchModel):
                     dims=item_dnn_units,
                     output_layer=False,
                     dropout=dnn_dropout,
-                    activation=dnn_activation
+                    activation=dnn_activation,
                 )
             else:
                 self.item_dnn = None
         self.register_regularization_weights(
-            embedding_attr='user_embedding',
-            include_modules=['capsule_network']
+            embedding_attr="user_embedding", include_modules=["capsule_network"]
         )
         self.register_regularization_weights(
-            embedding_attr='item_embedding',
-            include_modules=['item_dnn'] if self.item_dnn else []
+            embedding_attr="item_embedding",
+            include_modules=["item_dnn"] if self.item_dnn else [],
         )
         self.compile(
             optimizer=optimizer,
             optimizer_params=optimizer_params,
@@ -277,11 +334,11 @@ class MIND(BaseMatchModel):
         )
         self.to(device)
     def user_tower(self, user_input: dict) -> torch.Tensor:
         """
         User tower with multi-interest extraction
         Returns:
             user_interests: [batch_size, num_interests, embedding_dim]
         """
@@ -292,43 +349,53 @@ class MIND(BaseMatchModel):
         seq_emb = embed(seq_input.long())  # [batch_size, seq_len, embedding_dim]
         mask = (seq_input != seq_feature.padding_idx).float()  # [batch_size, seq_len]
-        multi_interests = self.capsule_network(seq_emb, mask)  # [batch_size, num_interests, seq_embedding_dim]
+        multi_interests = self.capsule_network(
+            seq_emb, mask
+        )  # [batch_size, num_interests, seq_embedding_dim]
         if self.interest_projection is not None:
-            multi_interests = self.interest_projection(multi_interests)  # [batch_size, num_interests, embedding_dim]
+            multi_interests = self.interest_projection(
+                multi_interests
+            )  # [batch_size, num_interests, embedding_dim]
         # L2 normalization
         multi_interests = F.normalize(multi_interests, p=2, dim=-1)
         return multi_interests
     def item_tower(self, item_input: dict) -> torch.Tensor:
         """Item tower"""
-        all_item_features = self.item_dense_features + self.item_sparse_features + self.item_sequence_features
+        all_item_features = (
+            self.item_dense_features
+            + self.item_sparse_features
+            + self.item_sequence_features
+        )
         item_emb = self.item_embedding(item_input, all_item_features, squeeze_dim=True)
         if self.item_dnn is not None:
             item_emb = self.item_dnn(item_emb)
         # L2 normalization
         item_emb = F.normalize(item_emb, p=2, dim=1)
         return item_emb
-    def compute_similarity(self, user_emb: torch.Tensor, item_emb: torch.Tensor) -> torch.Tensor:
+    def compute_similarity(
+        self, user_emb: torch.Tensor, item_emb: torch.Tensor
+    ) -> torch.Tensor:
         item_emb_expanded = item_emb.unsqueeze(1)
-        if self.similarity_metric == 'dot':
+        if self.similarity_metric == "dot":
             similarities = torch.sum(user_emb * item_emb_expanded, dim=-1)
-        elif self.similarity_metric == 'cosine':
+        elif self.similarity_metric == "cosine":
             similarities = F.cosine_similarity(user_emb, item_emb_expanded, dim=-1)
-        elif self.similarity_metric == 'euclidean':
+        elif self.similarity_metric == "euclidean":
             similarities = -torch.sum((user_emb - item_emb_expanded) ** 2, dim=-1)
         else:
             raise ValueError(f"Unknown similarity metric: {self.similarity_metric}")
         max_similarity, _ = torch.max(similarities, dim=1)  # [batch_size]
         max_similarity = max_similarity / self.temperature
         return max_similarity

nextrec 0.3.6__py3-none-any.whl → 0.4.2__py3-none-any.whl

nextrec 0.3.6py3-none-any.whl → 0.4.2py3-none-any.whl