PyPI - nextrec - Versions diffs - 0.4.20__py3-none-any.whl → 0.4.21__py3-none-any.whl - Mend

nextrec 0.4.20py3-none-any.whl → 0.4.21py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (54) hide show

nextrec/__version__.py +1 -1
nextrec/basic/activation.py +9 -4
nextrec/basic/callback.py +39 -87
nextrec/basic/features.py +149 -28
nextrec/basic/heads.py +4 -1
nextrec/basic/layers.py +375 -94
nextrec/basic/loggers.py +236 -39
nextrec/basic/model.py +209 -316
nextrec/basic/session.py +2 -2
nextrec/basic/summary.py +323 -0
nextrec/cli.py +3 -3
nextrec/data/data_processing.py +45 -1
nextrec/data/dataloader.py +2 -2
nextrec/data/preprocessor.py +2 -2
nextrec/loss/loss_utils.py +5 -30
nextrec/models/multi_task/esmm.py +4 -6
nextrec/models/multi_task/mmoe.py +4 -6
nextrec/models/multi_task/ple.py +6 -8
nextrec/models/multi_task/poso.py +5 -7
nextrec/models/multi_task/share_bottom.py +6 -8
nextrec/models/ranking/afm.py +4 -6
nextrec/models/ranking/autoint.py +4 -6
nextrec/models/ranking/dcn.py +8 -7
nextrec/models/ranking/dcn_v2.py +4 -6
nextrec/models/ranking/deepfm.py +5 -7
nextrec/models/ranking/dien.py +8 -7
nextrec/models/ranking/din.py +8 -7
nextrec/models/ranking/eulernet.py +5 -7
nextrec/models/ranking/ffm.py +5 -7
nextrec/models/ranking/fibinet.py +4 -6
nextrec/models/ranking/fm.py +4 -6
nextrec/models/ranking/lr.py +4 -6
nextrec/models/ranking/masknet.py +8 -9
nextrec/models/ranking/pnn.py +4 -6
nextrec/models/ranking/widedeep.py +5 -7
nextrec/models/ranking/xdeepfm.py +8 -7
nextrec/models/retrieval/dssm.py +4 -10
nextrec/models/retrieval/dssm_v2.py +0 -6
nextrec/models/retrieval/mind.py +4 -10
nextrec/models/retrieval/sdm.py +4 -10
nextrec/models/retrieval/youtube_dnn.py +4 -10
nextrec/models/sequential/hstu.py +1 -3
nextrec/utils/__init__.py +12 -14
nextrec/utils/config.py +15 -5
nextrec/utils/console.py +2 -2
nextrec/utils/feature.py +2 -2
nextrec/utils/torch_utils.py +57 -112
nextrec/utils/types.py +59 -0
{nextrec-0.4.20.dist-info → nextrec-0.4.21.dist-info}/METADATA +7 -5
nextrec-0.4.21.dist-info/RECORD +81 -0
nextrec-0.4.20.dist-info/RECORD +0 -79
{nextrec-0.4.20.dist-info → nextrec-0.4.21.dist-info}/WHEEL +0 -0
{nextrec-0.4.20.dist-info → nextrec-0.4.21.dist-info}/entry_points.txt +0 -0
{nextrec-0.4.20.dist-info → nextrec-0.4.21.dist-info}/licenses/LICENSE +0 -0

nextrec/models/retrieval/sdm.py CHANGED Viewed

@@ -49,12 +49,10 @@ class SDM(BaseMatchModel):
         num_negative_samples: int = 4,
         temperature: float = 1.0,
         similarity_metric: Literal["dot", "cosine", "euclidean"] = "dot",
-        device: str = "cpu",
-        embedding_l1_reg: float = 0.0,
-        dense_l1_reg: float = 0.0,
-        embedding_l2_reg: float = 0.0,
-        dense_l2_reg: float = 0.0,
-        early_stop_patience: int = 20,
+        embedding_l1_reg=0.0,
+        dense_l1_reg=0.0,
+        embedding_l2_reg=0.0,
+        dense_l2_reg=0.0,
         optimizer: str | torch.optim.Optimizer = "adam",
         optimizer_params: dict | None = None,
         scheduler: (
@@ -80,12 +78,10 @@ class SDM(BaseMatchModel):
             num_negative_samples=num_negative_samples,
             temperature=temperature,
             similarity_metric=similarity_metric,
-            device=device,
             embedding_l1_reg=embedding_l1_reg,
             dense_l1_reg=dense_l1_reg,
             embedding_l2_reg=embedding_l2_reg,
             dense_l2_reg=dense_l2_reg,
-            early_stop_patience=early_stop_patience,
             **kwargs,
         )
@@ -202,8 +198,6 @@ class SDM(BaseMatchModel):
             loss_params=loss_params,
         )
-        self.to(device)
     def user_tower(self, user_input: dict) -> torch.Tensor:
         seq_feature = self.user_sequence_features[0]
         seq_input = user_input[seq_feature.name]

nextrec/models/retrieval/youtube_dnn.py CHANGED Viewed

@@ -50,12 +50,10 @@ class YoutubeDNN(BaseMatchModel):
         num_negative_samples: int = 100,
         temperature: float = 1.0,
         similarity_metric: Literal["dot", "cosine", "euclidean"] = "dot",
-        device: str = "cpu",
-        embedding_l1_reg: float = 0.0,
-        dense_l1_reg: float = 0.0,
-        embedding_l2_reg: float = 0.0,
-        dense_l2_reg: float = 0.0,
-        early_stop_patience: int = 20,
+        embedding_l1_reg=0.0,
+        dense_l1_reg=0.0,
+        embedding_l2_reg=0.0,
+        dense_l2_reg=0.0,
         optimizer: str | torch.optim.Optimizer = "adam",
         optimizer_params: dict | None = None,
         scheduler: (
@@ -81,12 +79,10 @@ class YoutubeDNN(BaseMatchModel):
             num_negative_samples=num_negative_samples,
             temperature=temperature,
             similarity_metric=similarity_metric,
-            device=device,
             embedding_l1_reg=embedding_l1_reg,
             dense_l1_reg=dense_l1_reg,
             embedding_l2_reg=embedding_l2_reg,
             dense_l2_reg=dense_l2_reg,
-            early_stop_patience=early_stop_patience,
             **kwargs,
         )
@@ -169,8 +165,6 @@ class YoutubeDNN(BaseMatchModel):
             loss_params=loss_params,
         )
-        self.to(device)
     def user_tower(self, user_input: dict) -> torch.Tensor:
         """
         User tower to encode historical behavior sequences and user features.

nextrec/models/sequential/hstu.py CHANGED Viewed

@@ -332,7 +332,6 @@ class HSTU(BaseModel):
         dense_l1_reg: float = 0.0,
         embedding_l2_reg: float = 0.0,
         dense_l2_reg: float = 0.0,
-        device: str = "cpu",
         **kwargs,
     ):
         raise NotImplementedError(
@@ -348,7 +347,7 @@ class HSTU(BaseModel):
         )[0]
         self.hidden_dim = hidden_dim or max(
-            int(getattr(self.item_history_feature, "embedding_dim", 0) or 0), 32
+            int(self.item_history_feature.embedding_dim or 0), 32
         )
         # Make hidden_dim divisible by num_heads
         if self.hidden_dim % num_heads != 0:
@@ -368,7 +367,6 @@ class HSTU(BaseModel):
             sequence_features=sequence_features,
             target=target,
             task=task or self.default_task,
-            device=device,
             embedding_l1_reg=embedding_l1_reg,
             dense_l1_reg=dense_l1_reg,
             embedding_l2_reg=embedding_l2_reg,

nextrec/utils/__init__.py CHANGED Viewed

@@ -14,6 +14,7 @@ from .config import (
     load_model_class,
     register_processor_features,
     resolve_path,
+    safe_value,
     select_features,
 )
 from .console import (
@@ -35,23 +36,19 @@ from .data import (
     resolve_file_paths,
 )
 from .embedding import get_auto_embedding_dim
-from .feature import normalize_to_list
+from .feature import to_list
 from .model import compute_pair_scores, get_mlp_output_dim, merge_features
 from .torch_utils import (
     add_distributed_sampler,
-    concat_tensors,
-    configure_device,
+    get_device,
     gather_numpy,
-    get_device_info,
     get_initializer,
     get_optimizer,
     get_scheduler,
     init_process_group,
-    pad_sequence_tensors,
-    resolve_device,
-    stack_tensors,
     to_tensor,
 )
+from .types import LossName, OptimizerName, SchedulerName, ActivationName
 __all__ = [
     # Console utilities
@@ -67,17 +64,12 @@ __all__ = [
     # Embedding utilities
     "get_auto_embedding_dim",
     # Device utilities (torch utils)
-    "resolve_device",
-    "get_device_info",
-    "configure_device",
+    "get_device",
     "init_process_group",
     "gather_numpy",
     "add_distributed_sampler",
     # Tensor utilities
     "to_tensor",
-    "stack_tensors",
-    "concat_tensors",
-    "pad_sequence_tensors",
     # Data utilities
     "resolve_file_paths",
     "read_table",
@@ -90,9 +82,10 @@ __all__ = [
     "get_mlp_output_dim",
     "compute_pair_scores",
     # Feature utilities
-    "normalize_to_list",
+    "to_list",
     # Config utilities
     "resolve_path",
+    "safe_value",
     "register_processor_features",
     "build_feature_objects",
     "extract_feature_groups",
@@ -109,4 +102,9 @@ __all__ = [
     "data",
     "embedding",
     "torch_utils",
+    # Type aliases
+    "OptimizerName",
+    "SchedulerName",
+    "LossName",
+    "ActivationName",
 ]

nextrec/utils/config.py CHANGED Viewed

@@ -21,7 +21,7 @@ from typing import TYPE_CHECKING, Any, Dict, List, Tuple
 import pandas as pd
 import torch
-from nextrec.utils.feature import normalize_to_list
+from nextrec.utils.feature import to_list
 if TYPE_CHECKING:
     from nextrec.basic.features import DenseFeature, SequenceFeature, SparseFeature
@@ -52,6 +52,16 @@ def resolve_path(
     )
+def safe_value(value: Any):
+    if isinstance(value, (str, int, float, bool)) or value is None:
+        return value
+    if isinstance(value, dict):
+        return {str(k): safe_value(v) for k, v in value.items()}
+    if isinstance(value, (list, tuple)):
+        return [safe_value(v) for v in value]
+    return str(value)
 def select_features(
     feature_cfg: Dict[str, Any], df_columns: List[str]
 ) -> Tuple[List[str], List[str], List[str]]:
@@ -152,9 +162,9 @@ def build_feature_objects(
         dense_features.append(
             DenseFeature(
                 name=name,
-                embedding_dim=embed_cfg.get("embedding_dim"),
+                proj_dim=embed_cfg.get("proj_dim"),
                 input_dim=embed_cfg.get("input_dim", 1),
-                use_embedding=embed_cfg.get("use_embedding", False),
+                use_projection=embed_cfg.get("use_projection", False),
             )
         )
@@ -239,7 +249,7 @@ def extract_feature_groups(
     collected: List[str] = []
     for group_name, names in feature_groups.items():
-        name_list = normalize_to_list(names)
+        name_list = to_list(names)
         filtered = []
         missing_defined = [n for n in name_list if n not in defined]
         missing_cols = [n for n in name_list if n not in available_cols]
@@ -441,7 +451,7 @@ def build_model_instance(
             direct_features = binding.get("features") or binding.get("feature_names")
             if direct_features and (accepts(param_name) or accepts_var_kwargs):
                 init_kwargs[param_name] = _select(
-                    normalize_to_list(direct_features),
+                    to_list(direct_features),
                     feature_pool,
                     f"feature_bindings.{param_name}",
                 )

nextrec/utils/console.py CHANGED Viewed

@@ -36,7 +36,7 @@ from rich.progress import (
 from rich.table import Table
 from rich.text import Text
-from nextrec.utils.feature import as_float, normalize_to_list
+from nextrec.utils.feature import as_float, to_list
 T = TypeVar("T")
@@ -283,7 +283,7 @@ def display_metrics_table(
     if not is_main_process:
         return
-    target_list = normalize_to_list(target_names)
+    target_list = to_list(target_names)
     task_order, grouped = group_metrics_by_task(metrics, target_names=target_names)
     if isinstance(loss, np.ndarray) and target_list:

nextrec/utils/feature.py CHANGED Viewed

@@ -2,7 +2,7 @@
 Feature processing utilities for NextRec
 Date: create on 03/12/2025
-Checkpoint: edit on 19/12/2025
+Checkpoint: edit on 27/12/2025
 Author: Yang Zhou, zyaztec@gmail.com
 """
@@ -10,7 +10,7 @@ import numbers
 from typing import Any
-def normalize_to_list(value: str | list[str] | None) -> list[str]:
+def to_list(value: str | list[str] | None) -> list[str]:
     if value is None:
         return []
     if isinstance(value, str):

nextrec/utils/torch_utils.py CHANGED Viewed

@@ -3,12 +3,16 @@ PyTorch-related utilities for NextRec.
 This module groups device setup, distributed helpers, optimizers/schedulers,
 initialization, and tensor helpers.
+Date: create on 27/10/2025
+Checkpoint: edit on 27/12/2025
+Author: Yang Zhou, zyaztec@gmail.com
 """
 from __future__ import annotations
 import logging
-from typing import Any, Dict, Iterable, Set
+from typing import Any, Dict, Iterable, Literal
 import numpy as np
 import torch
@@ -18,26 +22,25 @@ from torch.utils.data import DataLoader, IterableDataset
 from torch.utils.data.distributed import DistributedSampler
 from nextrec.basic.loggers import colorize
-KNOWN_NONLINEARITIES: Set[str] = {
-    "linear",
-    "conv1d",
-    "conv2d",
-    "conv3d",
-    "conv_transpose1d",
-    "conv_transpose2d",
-    "conv_transpose3d",
-    "sigmoid",
-    "tanh",
-    "relu",
-    "leaky_relu",
-    "selu",
-    "gelu",
-}
+from nextrec.utils.types import OptimizerName, SchedulerName
 def resolve_nonlinearity(activation: str) -> str:
-    if activation in KNOWN_NONLINEARITIES:
+    if activation in [
+        "linear",
+        "conv1d",
+        "conv2d",
+        "conv3d",
+        "conv_transpose1d",
+        "conv_transpose2d",
+        "conv_transpose3d",
+        "sigmoid",
+        "tanh",
+        "relu",
+        "leaky_relu",
+        "selu",
+        "gelu",
+    ]:
         return activation
     return "linear"
@@ -53,8 +56,30 @@ def resolve_gain(activation: str, param: Dict[str, Any]) -> float:
 def get_initializer(
-    init_type: str = "normal",
-    activation: str = "linear",
+    init_type: Literal[
+        "xavier_uniform",
+        "xavier_normal",
+        "kaiming_uniform",
+        "kaiming_normal",
+        "orthogonal",
+        "normal",
+        "uniform",
+    ] = "normal",
+    activation: Literal[
+        "linear",
+        "conv1d",
+        "conv2d",
+        "conv3d",
+        "conv_transpose1d",
+        "conv_transpose2d",
+        "conv_transpose3d",
+        "sigmoid",
+        "tanh",
+        "relu",
+        "leaky_relu",
+        "selu",
+        "gelu",
+    ] = "linear",
     param: Dict[str, Any] | None = None,
 ):
     param = param or {}
@@ -89,47 +114,14 @@ def get_initializer(
     return initializer_fn
-def resolve_device() -> str:
-    if torch.cuda.is_available():
-        return "cuda"
-    if torch.backends.mps.is_available():
-        import platform
-        mac_ver = platform.mac_ver()[0]
-        try:
-            major, _ = (int(x) for x in mac_ver.split(".")[:2])
-        except Exception:
-            major, _ = 0, 0
-        if major >= 14:
-            return "mps"
-    return "cpu"
-def get_device_info() -> dict:
-    info = {
-        "cuda_available": torch.cuda.is_available(),
-        "cuda_device_count": (
-            torch.cuda.device_count() if torch.cuda.is_available() else 0
-        ),
-        "mps_available": torch.backends.mps.is_available(),
-        "current_device": resolve_device(),
-    }
-    if torch.cuda.is_available():
-        info["cuda_device_name"] = torch.cuda.get_device_name(0)
-        info["cuda_capability"] = torch.cuda.get_device_capability(0)
-    return info
-def configure_device(
+def get_device(
     distributed: bool, local_rank: int, base_device: torch.device | str = "cpu"
 ) -> torch.device:
     try:
         device = torch.device(base_device)
     except Exception:
         logging.warning(
-            "[configure_device Warning] Invalid base_device, falling back to CPU."
+            "[get_device Warning] Invalid base_device, falling back to CPU."
         )
         return torch.device("cpu")
@@ -158,7 +150,7 @@ def configure_device(
 def get_optimizer(
-    optimizer: str | torch.optim.Optimizer = "adam",
+    optimizer: OptimizerName | torch.optim.Optimizer = "adam",
     params: Iterable[torch.nn.Parameter] | None = None,
     **optimizer_params,
 ):
@@ -191,7 +183,7 @@ def get_optimizer(
 def get_scheduler(
     scheduler: (
-        str
+        SchedulerName
         | torch.optim.lr_scheduler._LRScheduler
         | torch.optim.lr_scheduler.LRScheduler
         | type[torch.optim.lr_scheduler._LRScheduler]
@@ -241,51 +233,6 @@ def to_tensor(
     return tensor
-def stack_tensors(tensors: list[torch.Tensor], dim: int = 0) -> torch.Tensor:
-    if not tensors:
-        raise ValueError("[Tensor Utils Error] Cannot stack empty list of tensors.")
-    return torch.stack(tensors, dim=dim)
-def concat_tensors(tensors: list[torch.Tensor], dim: int = 0) -> torch.Tensor:
-    if not tensors:
-        raise ValueError(
-            "[Tensor Utils Error] Cannot concatenate empty list of tensors."
-        )
-    return torch.cat(tensors, dim=dim)
-def pad_sequence_tensors(
-    tensors: list[torch.Tensor],
-    max_len: int | None = None,
-    padding_value: float = 0.0,
-    padding_side: str = "right",
-) -> torch.Tensor:
-    if not tensors:
-        raise ValueError("[Tensor Utils Error] Cannot pad empty list of tensors.")
-    if max_len is None:
-        max_len = max(t.size(0) for t in tensors)
-    batch_size = len(tensors)
-    padded = torch.full(
-        (batch_size, max_len),
-        padding_value,
-        dtype=tensors[0].dtype,
-        device=tensors[0].device,
-    )
-    for i, tensor in enumerate(tensors):
-        length = min(tensor.size(0), max_len)
-        if padding_side == "right":
-            padded[i, :length] = tensor[:length]
-        elif padding_side == "left":
-            padded[i, -length:] = tensor[:length]
-        else:
-            raise ValueError(
-                f"[Tensor Utils Error] padding_side must be 'right' or 'left', got {padding_side}"
-            )
-    return padded
 def init_process_group(
     distributed: bool, rank: int, world_size: int, device_id: int | None = None
 ) -> None:
@@ -350,7 +297,7 @@ def add_distributed_sampler(
     # return if already has DistributedSampler
     if isinstance(loader.sampler, DistributedSampler):
         return loader, loader.sampler
-    dataset = getattr(loader, "dataset", None)
+    dataset = loader.dataset
     if dataset is None:
         return loader, None
     if isinstance(dataset, IterableDataset):
@@ -379,25 +326,23 @@ def add_distributed_sampler(
         "collate_fn": loader.collate_fn,
         "drop_last": drop_last,
     }
-    if getattr(loader, "pin_memory", False):
+    if loader.pin_memory:
         loader_kwargs["pin_memory"] = True
-    pin_memory_device = getattr(loader, "pin_memory_device", None)
+    pin_memory_device = loader.pin_memory_device
     if pin_memory_device:
         loader_kwargs["pin_memory_device"] = pin_memory_device
-    timeout = getattr(loader, "timeout", None)
+    timeout = loader.timeout
     if timeout:
         loader_kwargs["timeout"] = timeout
-    worker_init_fn = getattr(loader, "worker_init_fn", None)
+    worker_init_fn = loader.worker_init_fn
     if worker_init_fn is not None:
         loader_kwargs["worker_init_fn"] = worker_init_fn
-    generator = getattr(loader, "generator", None)
+    generator = loader.generator
     if generator is not None:
         loader_kwargs["generator"] = generator
     if loader.num_workers > 0:
-        loader_kwargs["persistent_workers"] = getattr(
-            loader, "persistent_workers", False
-        )
-        prefetch_factor = getattr(loader, "prefetch_factor", None)
+        loader_kwargs["persistent_workers"] = loader.persistent_workers
+        prefetch_factor = loader.prefetch_factor
         if prefetch_factor is not None:
             loader_kwargs["prefetch_factor"] = prefetch_factor
     distributed_loader = DataLoader(dataset, **loader_kwargs)

nextrec/utils/types.py ADDED Viewed

@@ -0,0 +1,59 @@
+"""
+Shared type aliases for NextRec.
+Keep Literal-based public string options centralized to avoid drift.
+"""
+from typing import Literal
+OptimizerName = Literal["adam", "sgd", "adamw", "adagrad", "rmsprop"]
+SchedulerName = Literal["step", "cosine"]
+LossName = Literal[
+    "bce",
+    "binary_crossentropy",
+    "weighted_bce",
+    "focal",
+    "focal_loss",
+    "cb_focal",
+    "class_balanced_focal",
+    "crossentropy",
+    "ce",
+    "mse",
+    "mae",
+    "bpr",
+    "hinge",
+    "triplet",
+    "sampled_softmax",
+    "softmax",
+    "infonce",
+    "listnet",
+    "listmle",
+    "approx_ndcg",
+]
+ActivationName = Literal[
+        "dice",
+        "relu",
+        "relu6",
+        "elu",
+        "selu",
+        "leaky_relu",
+        "prelu",
+        "gelu",
+        "sigmoid",
+        "tanh",
+        "softplus",
+        "softsign",
+        "hardswish",
+        "mish",
+        "silu",
+        "swish",
+        "hardsigmoid",
+        "tanhshrink",
+        "softshrink",
+        "none",
+        "linear",
+        "identity",
+    ]

{nextrec-0.4.20.dist-info → nextrec-0.4.21.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: nextrec
-Version: 0.4.20
+Version: 0.4.21
 Summary: A comprehensive recommendation library with match, ranking, and multi-task learning models
 Project-URL: Homepage, https://github.com/zerolovesea/NextRec
 Project-URL: Repository, https://github.com/zerolovesea/NextRec
@@ -42,9 +42,11 @@ Requires-Dist: scipy<1.12,>=1.8; sys_platform == 'linux' and python_version < '3
 Requires-Dist: scipy>=1.10.0; sys_platform == 'darwin'
 Requires-Dist: scipy>=1.10.0; sys_platform == 'win32'
 Requires-Dist: scipy>=1.11.0; sys_platform == 'linux' and python_version >= '3.12'
+Requires-Dist: swanlab>=0.7.2
 Requires-Dist: torch>=2.0.0
 Requires-Dist: torchvision>=0.15.0
 Requires-Dist: transformers>=4.38.0
+Requires-Dist: wandb>=0.23.1
 Provides-Extra: dev
 Requires-Dist: jupyter>=1.0.0; extra == 'dev'
 Requires-Dist: matplotlib>=3.7.0; extra == 'dev'
@@ -67,7 +69,7 @@ Description-Content-Type: text/markdown
 ![Python](https://img.shields.io/badge/Python-3.10+-blue.svg)
 ![PyTorch](https://img.shields.io/badge/PyTorch-1.10+-ee4c2c.svg)
 ![License](https://img.shields.io/badge/License-Apache%202.0-green.svg)
-![Version](https://img.shields.io/badge/Version-0.4.20-orange.svg)
+![Version](https://img.shields.io/badge/Version-0.4.21-orange.svg)
 [![Ask DeepWiki](https://deepwiki.com/badge.svg)](https://deepwiki.com/zerolovesea/NextRec)
 中文文档 | [English Version](README_en.md)
@@ -100,7 +102,7 @@ NextRec是一个基于PyTorch的现代推荐系统框架，旨在为研究工程
 - **高效训练与评估**：内置多种优化器、学习率调度、早停、模型检查点与详细的日志管理，开箱即用。
 ## NextRec近期进展
+- **28/12/2025** 在v0.4.21中加入了对SwanLab和Wandb的支持，通过model的`fit`方法进行配置：`use_swanlab=True, swanlab_kwargs={"project": "NextRec","name":"tutorial_movielens_deepfm"},`
 - **21/12/2025** 在v0.4.16中加入了对[GradNorm](/nextrec/loss/grad_norm.py)的支持，通过compile的`loss_weight='grad_norm'`进行配置
 - **12/12/2025** 在v0.4.9中加入了[RQ-VAE](/nextrec/models/representation/rqvae.py)模块。配套的[数据集](/dataset/ecommerce_task.csv)和[代码](tutorials/notebooks/zh/使用RQ-VAE构建语义ID.ipynb)已经同步在仓库中
 - **07/12/2025** 发布了NextRec CLI命令行工具，它允许用户根据配置文件进行一键训练和推理，我们提供了相关的[教程](/nextrec_cli_preset/NextRec-CLI_zh.md)和[教学代码](/nextrec_cli_preset)
@@ -245,11 +247,11 @@ nextrec --mode=predict --predict_config=path/to/predict_config.yaml
 预测结果固定保存到 `{checkpoint_path}/predictions/{name}.{save_data_format}`。
-> 截止当前版本0.4.20，NextRec CLI支持单机训练，分布式训练相关功能尚在开发中。
+> 截止当前版本0.4.21，NextRec CLI支持单机训练，分布式训练相关功能尚在开发中。
 ## 兼容平台
-当前最新版本为0.4.20，所有模型和测试代码均已在以下平台通过验证，如果开发者在使用中遇到兼容问题，请在issue区提出错误报告及系统版本：
+当前最新版本为0.4.21，所有模型和测试代码均已在以下平台通过验证，如果开发者在使用中遇到兼容问题，请在issue区提出错误报告及系统版本：
 | 平台 | 配置 |
 |------|------|

nextrec 0.4.20__py3-none-any.whl → 0.4.21__py3-none-any.whl

nextrec 0.4.20py3-none-any.whl → 0.4.21py3-none-any.whl