PyPI - nextrec - Versions diffs - 0.4.1__py3-none-any.whl → 0.4.3__py3-none-any.whl - Mend

nextrec 0.4.1py3-none-any.whl → 0.4.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (63) hide show

nextrec/__init__.py +1 -1
nextrec/__version__.py +1 -1
nextrec/basic/activation.py +10 -5
nextrec/basic/callback.py +1 -0
nextrec/basic/features.py +30 -22
nextrec/basic/layers.py +250 -112
nextrec/basic/loggers.py +63 -44
nextrec/basic/metrics.py +270 -120
nextrec/basic/model.py +1084 -402
nextrec/basic/session.py +10 -3
nextrec/cli.py +492 -0
nextrec/data/__init__.py +19 -25
nextrec/data/batch_utils.py +11 -3
nextrec/data/data_processing.py +51 -45
nextrec/data/data_utils.py +26 -15
nextrec/data/dataloader.py +273 -96
nextrec/data/preprocessor.py +320 -199
nextrec/loss/listwise.py +17 -9
nextrec/loss/loss_utils.py +7 -8
nextrec/loss/pairwise.py +2 -0
nextrec/loss/pointwise.py +30 -12
nextrec/models/generative/hstu.py +103 -38
nextrec/models/match/dssm.py +82 -68
nextrec/models/match/dssm_v2.py +72 -57
nextrec/models/match/mind.py +175 -107
nextrec/models/match/sdm.py +104 -87
nextrec/models/match/youtube_dnn.py +73 -59
nextrec/models/multi_task/esmm.py +69 -46
nextrec/models/multi_task/mmoe.py +91 -53
nextrec/models/multi_task/ple.py +117 -58
nextrec/models/multi_task/poso.py +163 -55
nextrec/models/multi_task/share_bottom.py +63 -36
nextrec/models/ranking/afm.py +80 -45
nextrec/models/ranking/autoint.py +74 -57
nextrec/models/ranking/dcn.py +110 -48
nextrec/models/ranking/dcn_v2.py +265 -45
nextrec/models/ranking/deepfm.py +39 -24
nextrec/models/ranking/dien.py +335 -146
nextrec/models/ranking/din.py +158 -92
nextrec/models/ranking/fibinet.py +134 -52
nextrec/models/ranking/fm.py +68 -26
nextrec/models/ranking/masknet.py +95 -33
nextrec/models/ranking/pnn.py +128 -58
nextrec/models/ranking/widedeep.py +40 -28
nextrec/models/ranking/xdeepfm.py +67 -40
nextrec/utils/__init__.py +59 -34
nextrec/utils/config.py +496 -0
nextrec/utils/device.py +30 -20
nextrec/utils/distributed.py +36 -9
nextrec/utils/embedding.py +1 -0
nextrec/utils/feature.py +1 -0
nextrec/utils/file.py +33 -11
nextrec/utils/initializer.py +61 -16
nextrec/utils/model.py +22 -0
nextrec/utils/optimizer.py +25 -9
nextrec/utils/synthetic_data.py +283 -165
nextrec/utils/tensor.py +24 -13
{nextrec-0.4.1.dist-info → nextrec-0.4.3.dist-info}/METADATA +53 -24
nextrec-0.4.3.dist-info/RECORD +69 -0
nextrec-0.4.3.dist-info/entry_points.txt +2 -0
nextrec-0.4.1.dist-info/RECORD +0 -66
{nextrec-0.4.1.dist-info → nextrec-0.4.3.dist-info}/WHEEL +0 -0
{nextrec-0.4.1.dist-info → nextrec-0.4.3.dist-info}/licenses/LICENSE +0 -0

nextrec/basic/loggers.py CHANGED Viewed

@@ -13,40 +13,42 @@ import json
 import copy
 import logging
 import numbers
 from typing import Mapping, Any
 from nextrec.basic.session import create_session, Session
 ANSI_CODES = {
-    'black': '\033[30m',
-    'red': '\033[31m',
-    'green': '\033[32m',
-    'yellow': '\033[33m',
-    'blue': '\033[34m',
-    'magenta': '\033[35m',
-    'cyan': '\033[36m',
-    'white': '\033[37m',
-    'bright_black': '\033[90m',
-    'bright_red': '\033[91m',
-    'bright_green': '\033[92m',
-    'bright_yellow': '\033[93m',
-    'bright_blue': '\033[94m',
-    'bright_magenta': '\033[95m',
-    'bright_cyan': '\033[96m',
-    'bright_white': '\033[97m',
+    "black": "\033[30m",
+    "red": "\033[31m",
+    "green": "\033[32m",
+    "yellow": "\033[33m",
+    "blue": "\033[34m",
+    "magenta": "\033[35m",
+    "cyan": "\033[36m",
+    "white": "\033[37m",
+    "bright_black": "\033[90m",
+    "bright_red": "\033[91m",
+    "bright_green": "\033[92m",
+    "bright_yellow": "\033[93m",
+    "bright_blue": "\033[94m",
+    "bright_magenta": "\033[95m",
+    "bright_cyan": "\033[96m",
+    "bright_white": "\033[97m",
 }
-ANSI_BOLD = '\033[1m'
-ANSI_RESET = '\033[0m'
-ANSI_ESCAPE_PATTERN = re.compile(r'\033\[[0-9;]*m')
+ANSI_BOLD = "\033[1m"
+ANSI_RESET = "\033[0m"
+ANSI_ESCAPE_PATTERN = re.compile(r"\033\[[0-9;]*m")
 DEFAULT_LEVEL_COLORS = {
-    'DEBUG': 'cyan',
-    'INFO': None,
-    'WARNING': 'yellow',
-    'ERROR': 'red',
-    'CRITICAL': 'bright_red',
+    "DEBUG": "cyan",
+    "INFO": None,
+    "WARNING": "yellow",
+    "ERROR": "red",
+    "CRITICAL": "bright_red",
 }
 class AnsiFormatter(logging.Formatter):
     def __init__(
         self,
@@ -65,16 +67,17 @@ class AnsiFormatter(logging.Formatter):
         record_copy = copy.copy(record)
         formatted = super().format(record_copy)
-        if self.auto_color_level and '\033[' not in formatted:
+        if self.auto_color_level and "\033[" not in formatted:
             color = self.level_colors.get(record.levelname)
             if color:
                 formatted = colorize(formatted, color=color)
         if self.strip_ansi:
-            return ANSI_ESCAPE_PATTERN.sub('', formatted)
+            return ANSI_ESCAPE_PATTERN.sub("", formatted)
         return formatted
 def colorize(text: str, color: str | None = None, bold: bool = False) -> str:
     """Apply ANSI color and bold formatting to the given text."""
     if not color and not bold:
@@ -87,43 +90,53 @@ def colorize(text: str, color: str | None = None, bold: bool = False) -> str:
     result += text + ANSI_RESET
     return result
 def setup_logger(session_id: str | os.PathLike | None = None):
     """Set up a logger that logs to both console and a file with ANSI formatting.
-       Only console output has colors; file output is stripped of ANSI codes.
-       Logs are stored under ``log/<experiment_id>/logs`` by default. A stable
-       log file is used per experiment so multiple components (e.g. data
-       processor and model training) append to the same file instead of creating
-       separate timestamped files.
+    Only console output has colors; file output is stripped of ANSI codes.
+    Logs are stored under ``log/<experiment_id>/logs`` by default. A stable
+    log file is used per experiment so multiple components (e.g. data
+    processor and model training) append to the same file instead of creating
+    separate timestamped files.
     """
     session = create_session(str(session_id) if session_id is not None else None)
     log_dir = session.logs_dir
     log_dir.mkdir(parents=True, exist_ok=True)
-    log_file = log_dir / f"{session.log_basename}.log"
+    log_file = log_dir / "runs.log"
+    console_format = "%(message)s"
+    file_format = "%(asctime)s - %(levelname)s - %(message)s"
+    date_format = "%Y-%m-%d %H:%M:%S"
-    console_format = '%(message)s'
-    file_format = '%(asctime)s - %(levelname)s - %(message)s'
-    date_format = '%Y-%m-%d %H:%M:%S'
     logger = logging.getLogger()
     logger.setLevel(logging.INFO)
     if logger.hasHandlers():
         logger.handlers.clear()
-    file_handler = logging.FileHandler(log_file, encoding='utf-8')
+    file_handler = logging.FileHandler(log_file, encoding="utf-8")
     file_handler.setLevel(logging.INFO)
-    file_handler.setFormatter(AnsiFormatter(file_format, datefmt=date_format, strip_ansi=True))
+    file_handler.setFormatter(
+        AnsiFormatter(file_format, datefmt=date_format, strip_ansi=True)
+    )
     console_handler = logging.StreamHandler(sys.stdout)
     console_handler.setLevel(logging.INFO)
-    console_handler.setFormatter(AnsiFormatter(console_format, datefmt=date_format, auto_color_level=True,))
+    console_handler.setFormatter(
+        AnsiFormatter(
+            console_format,
+            datefmt=date_format,
+            auto_color_level=True,
+        )
+    )
     logger.addHandler(file_handler)
     logger.addHandler(console_handler)
     return logger
 class TrainingLogger:
     def __init__(
         self,
@@ -146,7 +159,9 @@ class TrainingLogger:
         try:
             from torch.utils.tensorboard import SummaryWriter  # type: ignore
         except ImportError:
-            logging.warning("[TrainingLogger] tensorboard not installed, disable tensorboard logging.")
+            logging.warning(
+                "[TrainingLogger] tensorboard not installed, disable tensorboard logging."
+            )
             self.enable_tensorboard = False
             return
         tb_dir = self.session.logs_dir / "tensorboard"
@@ -158,7 +173,9 @@ class TrainingLogger:
     def tensorboard_logdir(self):
         return self.tb_dir
-    def format_metrics(self, metrics: Mapping[str, Any], split: str) -> dict[str, float]:
+    def format_metrics(
+        self, metrics: Mapping[str, Any], split: str
+    ) -> dict[str, float]:
         formatted: dict[str, float] = {}
         for key, value in metrics.items():
             if isinstance(value, numbers.Number):
@@ -170,7 +187,9 @@ class TrainingLogger:
                     continue
         return formatted
-    def log_metrics(self, metrics: Mapping[str, Any], step: int, split: str = "train") -> None:
+    def log_metrics(
+        self, metrics: Mapping[str, Any], step: int, split: str = "train"
+    ) -> None:
         payload = self.format_metrics(metrics, split)
         payload["step"] = int(step)
         with self.log_path.open("a", encoding="utf-8") as f:
@@ -188,4 +207,4 @@ class TrainingLogger:
         if self.tb_writer:
             self.tb_writer.flush()
             self.tb_writer.close()
-            self.tb_writer = None
+            self.tb_writer = None

nextrec 0.4.1__py3-none-any.whl → 0.4.3__py3-none-any.whl

nextrec 0.4.1py3-none-any.whl → 0.4.3py3-none-any.whl