PyPI - Qubx - Versions diffs - 0.1.89__cp311-cp311-manylinux_2_35_x86_64.whl → 0.2.2__cp311-cp311-manylinux_2_35_x86_64.whl - Mend

Qubx 0.1.89__cp311-cp311-manylinux_2_35_x86_64.whl → 0.2.2__cp311-cp311-manylinux_2_35_x86_64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of Qubx might be problematic. Click here for more details.

Files changed (44) hide show

qubx/__init__.py +6 -12
qubx/backtester/__init__.py +2 -0
qubx/backtester/ome.py +237 -0
qubx/backtester/optimization.py +141 -0
qubx/backtester/queue.py +243 -0
qubx/backtester/simulator.py +896 -0
qubx/core/account.py +111 -48
qubx/core/basics.py +287 -95
qubx/core/context.py +760 -0
qubx/core/exceptions.py +22 -0
qubx/core/helpers.py +110 -78
qubx/core/loggers.py +146 -75
qubx/core/lookups.py +110 -82
qubx/core/metrics.py +901 -0
qubx/core/series.cpython-311-x86_64-linux-gnu.so +0 -0
qubx/core/series.pxd +5 -0
qubx/core/series.pyi +29 -0
qubx/core/series.pyx +67 -13
qubx/core/strategy.py +210 -610
qubx/core/utils.cpython-311-x86_64-linux-gnu.so +0 -0
qubx/core/utils.pyi +4 -0
qubx/data/readers.py +177 -110
qubx/gathering/simplest.py +41 -0
qubx/impl/ccxt_connector.py +170 -74
qubx/impl/ccxt_customizations.py +97 -23
qubx/impl/ccxt_trading.py +107 -72
qubx/impl/ccxt_utils.py +47 -41
qubx/pandaz/utils.py +145 -111
qubx/ta/indicators.cpython-311-x86_64-linux-gnu.so +0 -0
qubx/ta/indicators.pyi +16 -0
qubx/trackers/__init__.py +3 -1
qubx/trackers/rebalancers.py +89 -64
qubx/trackers/riskctrl.py +152 -0
qubx/trackers/sizers.py +104 -0
qubx/utils/__init__.py +2 -1
qubx/utils/charting/lookinglass.py +1088 -0
qubx/utils/misc.py +28 -9
qubx/utils/ntp.py +58 -0
qubx/utils/runner.py +79 -61
qubx/utils/time.py +49 -31
{qubx-0.1.89.dist-info → qubx-0.2.2.dist-info}/METADATA +2 -1
qubx-0.2.2.dist-info/RECORD +55 -0
qubx-0.1.89.dist-info/RECORD +0 -39
{qubx-0.1.89.dist-info → qubx-0.2.2.dist-info}/WHEEL +0 -0

qubx/__init__.py CHANGED Viewed

@@ -1,3 +1,4 @@
+from typing import Callable
 from qubx.utils import set_mpl_theme, runtime_env
 from qubx.utils.misc import install_pyx_recompiler_for_dev
@@ -10,20 +11,13 @@ def formatter(record):
     end = record["extra"].get("end", "\n")
     fmt = "<lvl>{message}</lvl>%s" % end
     if record["level"].name in {"WARNING", "SNAKY"}:
-        fmt = (
-            "<cyan>{name}</cyan>:<cyan>{function}</cyan>:<cyan>{line}</cyan> - %s" % fmt
-        )
+        fmt = "<cyan>{name}</cyan>:<cyan>{function}</cyan>:<cyan>{line}</cyan> - %s" % fmt
-    prefix = (
-        "<green>{time:YYYY-MM-DD HH:mm:ss.SSS}</green> [ <level>%s</level> ] "
-        % record["level"].icon
-    )
+    prefix = "<green>{time:YYYY-MM-DD HH:mm:ss.SSS}</green> [ <level>%s</level> ] " % record["level"].icon
     if record["exception"] is not None:
         # stackprinter.set_excepthook(style='darkbg2')
-        record["extra"]["stack"] = stackprinter.format(
-            record["exception"], style="darkbg"
-        )
+        record["extra"]["stack"] = stackprinter.format(record["exception"], style="darkbg3")
         fmt += "\n{extra[stack]}\n"
     if record["level"].name in {"TEXT"}:
@@ -44,7 +38,7 @@ class QubxLogConfig:
         QubxLogConfig.setup_logger(level)
     @staticmethod
-    def setup_logger(level: str | None = None):
+    def setup_logger(level: str | None = None, custom_formatter: Callable | None = None):
         global logger
         config = {
             "handlers": [
@@ -55,7 +49,7 @@ class QubxLogConfig:
         logger.configure(**config)
         logger.remove(None)
         level = level or QubxLogConfig.get_log_level()
-        logger.add(sys.stdout, format=formatter, colorize=True, level=level)
+        logger.add(sys.stdout, format=custom_formatter or formatter, colorize=True, level=level, enqueue=True)
         logger = logger.opt(colors=True)

qubx/backtester/__init__.py ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ from .simulator import simulate
2	+ from .optimization import variate

qubx/backtester/ome.py ADDED Viewed

@@ -0,0 +1,237 @@
+from typing import List, Dict
+from dataclasses import dataclass
+from operator import neg
+import numpy as np
+from sortedcontainers import SortedDict
+from qubx import logger
+from qubx.core.basics import Deal, Instrument, Order, Position, Signal, TransactionCostsCalculator, dt_64, ITimeProvider
+from qubx.core.series import Quote, Trade
+from qubx.core.exceptions import (
+    ExchangeError,
+    InvalidOrder,
+)
+@dataclass
+class OmeReport:
+    timestamp: dt_64
+    order: Order
+    exec: Deal | None
+class OrdersManagementEngine:
+    instrument: Instrument
+    time_service: ITimeProvider
+    active_orders: Dict[str, Order]
+    asks: SortedDict[float, List[str]]
+    bids: SortedDict[float, List[str]]
+    bbo: Quote | None  # current best bid/ask order book (simplest impl)
+    __order_id: int
+    __trade_id: int
+    def __init__(
+        self, instrument: Instrument, time_provider: ITimeProvider, tcc: TransactionCostsCalculator, debug: bool = True
+    ) -> None:
+        self.instrument = instrument
+        self.time_service = time_provider
+        self.tcc = tcc
+        self.asks = SortedDict()
+        self.bids = SortedDict(neg)
+        self.active_orders = dict()
+        self.bbo = None
+        self.__order_id = 100000
+        self.__trade_id = 100000
+        if not debug:
+            self._dbg = lambda message, **kwargs: None
+    def _generate_order_id(self) -> str:
+        self.__order_id += 1
+        return "SIM-ORDER-" + self.instrument.symbol + "-" + str(self.__order_id)
+    def _generate_trade_id(self) -> str:
+        self.__trade_id += 1
+        return "SIM-EXEC-" + self.instrument.symbol + "-" + str(self.__trade_id)
+    def get_quote(self) -> Quote:
+        return self.bbo
+    def get_open_orders(self) -> List[Order]:
+        return list(self.active_orders.values())
+    def update_bbo(self, quote: Quote) -> List[OmeReport]:
+        timestamp = self.time_service.time()
+        rep = []
+        if self.bbo is not None:
+            if quote.bid >= self.bbo.ask:
+                for level in self.asks.irange(0, quote.bid):
+                    for order_id in self.asks[level]:
+                        order = self.active_orders.pop(order_id)
+                        rep.append(self._execute_order(timestamp, order.price, order, False))
+                    self.asks.pop(level)
+            if quote.ask <= self.bbo.bid:
+                for level in self.bids.irange(np.inf, quote.ask):
+                    for order_id in self.bids[level]:
+                        order = self.active_orders.pop(order_id)
+                        rep.append(self._execute_order(timestamp, order.price, order, False))
+                    self.bids.pop(level)
+        self.bbo = quote
+        return rep
+    def place_order(
+        self,
+        order_side: str,
+        order_type: str,
+        amount: float,
+        price: float | None = None,
+        client_id: str | None = None,
+        time_in_force: str = "gtc",
+    ) -> OmeReport:
+        if self.bbo is None:
+            raise ExchangeError(
+                f"Simulator is not ready for order management - no any quote for {self.instrument.symbol}"
+            )
+        # - validate order parameters
+        self._validate_order(order_side, order_type, amount, price, time_in_force)
+        timestamp = self.time_service.time()
+        order = Order(
+            self._generate_order_id(),
+            order_type,
+            self.instrument.symbol,
+            timestamp,
+            amount,
+            price if price is not None else 0,
+            order_side,
+            "NEW",
+            time_in_force,
+            client_id,
+        )
+        return self._process_order(timestamp, order)
+    def _dbg(self, message, **kwargs) -> None:
+        logger.debug(f"[OMS] {self.instrument.symbol} - {message}", **kwargs)
+    def _process_order(self, timestamp: dt_64, order: Order) -> OmeReport:
+        if order.status in ["CLOSED", "CANCELED"]:
+            raise InvalidOrder(f"Order {order.id} is already closed or canceled.")
+        buy_side = order.side == "BUY"
+        c_ask = self.bbo.ask
+        c_bid = self.bbo.bid
+        # - check if order can be "executed" immediately
+        exec_price = None
+        if order.type == "MARKET":
+            exec_price = c_ask if buy_side else c_bid
+        elif order.type == "LIMIT":
+            if (buy_side and order.price >= c_ask) or (not buy_side and order.price <= c_bid):
+                exec_price = c_ask if buy_side else c_bid
+        # - if order must be "executed" immediately
+        if exec_price is not None:
+            return self._execute_order(timestamp, exec_price, order, True)
+        # - processing limit orders
+        if buy_side:
+            self.bids.setdefault(order.price, list()).append(order.id)
+        else:
+            self.asks.setdefault(order.price, list()).append(order.id)
+        order.status = "OPEN"
+        self._dbg(f"registered {order.id} {order.type} {order.side} {order.quantity} {order.price}")
+        self.active_orders[order.id] = order
+        return OmeReport(timestamp, order, None)
+    def _execute_order(self, timestamp: dt_64, exec_price: float, order: Order, taker: bool) -> OmeReport:
+        order.status = "CLOSED"
+        self._dbg(f"{order.id} {order.type} {order.side} {order.quantity} executed at {exec_price}")
+        return OmeReport(
+            timestamp,
+            order,
+            Deal(
+                id=self._generate_trade_id(),
+                order_id=order.id,
+                time=timestamp,
+                amount=order.quantity if order.side == "BUY" else -order.quantity,
+                price=exec_price,
+                aggressive=taker,
+                fee_amount=self.tcc.get_execution_fees(
+                    instrument=self.instrument, exec_price=exec_price, amount=order.quantity, crossed_market=taker
+                ),
+                fee_currency=self.instrument.quote,
+            ),
+        )
+    def _validate_order(
+        self, order_side: str, order_type: str, amount: float, price: float | None, time_in_force: str
+    ) -> None:
+        if order_side.upper() not in ["BUY", "SELL"]:
+            raise InvalidOrder("Invalid order side. Only BUY or SELL is allowed.")
+        if order_type.upper() not in ["LIMIT", "MARKET"]:
+            raise InvalidOrder("Invalid order type. Only LIMIT or MARKET is supported.")
+        if amount <= 0:
+            raise InvalidOrder("Invalid order amount. Amount must be positive.")
+        if order_type.upper() == "LIMIT" and (price is None or price <= 0):
+            raise InvalidOrder("Invalid order price. Price must be positively defined for LIMIT orders.")
+        if time_in_force.upper() not in ["GTC", "IOC"]:
+            raise InvalidOrder("Invalid time in force. Only GTC or IOC is supported for now.")
+    def cancel_order(self, order_id: str) -> OmeReport:
+        if order_id not in self.active_orders:
+            raise InvalidOrder(f"Order {order_id} not found for {self.instrument.symbol}")
+        timestamp = self.time_service.time()
+        order = self.active_orders.pop(order_id)
+        if order.side == "BUY":
+            oids = self.bids[order.price]
+            oids.remove(order_id)
+            if not oids:
+                self.bids.pop(order.price)
+        else:
+            oids = self.asks[order.price]
+            oids.remove(order_id)
+            if not oids:
+                self.asks.pop(order.price)
+        order.status = "CANCELED"
+        self._dbg(f"{order.id} {order.type} {order.side} {order.quantity} canceled")
+        return OmeReport(timestamp, order, None)
+    def __str__(self) -> str:
+        _a, _b = True, True
+        timestamp = self.time_service.time()
+        _s = f"= = ({np.datetime64(timestamp, 'ns')}) = =\n"
+        for k, v in reversed(self.asks.items()):
+            _sizes = ",".join([f"{self.active_orders[o].quantity}" for o in v])
+            _s += f"  {k} : [{ _sizes }]\n"
+            if k == self.bbo.ask:
+                _a = False
+        if _a:
+            _s += f"  {self.bbo.ask} : \n"
+        _s += "- - - - - - - - - - - - - - - - - - - -\n"
+        _s1 = ""
+        for k, v in self.bids.items():
+            _sizes = ",".join([f"{self.active_orders[o].quantity}" for o in v])
+            _s1 += f"  {k} : [{ _sizes }]\n"
+            if k == self.bbo.bid:
+                _b = False
+        _s1 += "= = = = = = = = = = = = = = = = = = = =\n"
+        _s1 = f"  {self.bbo.bid} : \n" + _s1 if _b else _s1
+        return _s + _s1

qubx/backtester/optimization.py ADDED Viewed

@@ -0,0 +1,141 @@
+from typing import Any, Dict, List, Sequence, Tuple
+import numpy as np
+import re
+from types import FunctionType
+from itertools import product
+def _wrap_single_list(param_grid: List | Dict) -> Dict[str, Any] | List:
+    """
+    Wraps all non list values as single
+    :param param_grid:
+    :return:
+    """
+    as_list = lambda x: x if isinstance(x, (tuple, list, dict, np.ndarray)) else [x]
+    if isinstance(param_grid, list):
+        return [_wrap_single_list(ps) for ps in param_grid]
+    return {k: as_list(v) for k, v in param_grid.items()}
+def permutate_params(
+    parameters: Dict[str, List | Tuple | Any],
+    conditions: FunctionType | List | Tuple | None = None,
+    wrap_as_list=False,
+) -> List[Dict]:
+    """
+    Generate list of all permutations for given parameters and theirs possible values
+    Example:
+    >>> def foo(par1, par2):
+    >>>     print(par1)
+    >>>     print(par2)
+    >>>
+    >>> # permutate all values and call function for every permutation
+    >>> [foo(**z) for z in permutate_params({
+    >>>                                       'par1' : [1,2,3],
+    >>>                                       'par2' : [True, False]
+    >>>                                     }, conditions=lambda par1, par2: par1<=2 and par2==True)]
+    1
+    True
+    2
+    True
+    :param conditions: list of filtering functions
+    :param parameters: dictionary
+    :param wrap_as_list: if True (default) it wraps all non list values as single lists (required for sklearn)
+    :return: list of permutations
+    """
+    if conditions is None:
+        conditions = []
+    elif isinstance(conditions, FunctionType):
+        conditions = [conditions]
+    elif isinstance(conditions, (tuple, list)):
+        if not all([isinstance(e, FunctionType) for e in conditions]):
+            raise ValueError("every condition must be a function")
+    else:
+        raise ValueError("conditions must be of type of function, list or tuple")
+    args = []
+    vals = []
+    for k, v in parameters.items():
+        args.append(k)
+        # vals.append([v] if not isinstance(v, (list, tuple)) else list(v) if isinstance(v, range) else v)
+        match v:
+            case list() | tuple():
+                vals.append(v)
+            case range():
+                vals.append(list(v))
+            case str():
+                vals.append([v])
+            case _:
+                vals.append(list(v))
+        # vals.append(v if isinstance(v, (List, Tuple)) else list(v) if isinstance(v, range) else [v])
+    d = [dict(zip(args, p)) for p in product(*vals)]
+    result = []
+    for params_set in d:
+        conditions_met = True
+        for cond_func in conditions:
+            func_param_args = cond_func.__code__.co_varnames
+            func_param_values = [params_set[arg] for arg in func_param_args]
+            if not cond_func(*func_param_values):
+                conditions_met = False
+                break
+        if conditions_met:
+            result.append(params_set)
+    # if we need to follow sklearn rules we should wrap every noniterable as list
+    return _wrap_single_list(result) if wrap_as_list else result
+def variate(clz, *args, conditions=None, **kwargs) -> Dict[str, Any]:
+    """
+    Make variations of parameters for simulations (micro optimizer)
+    Example:
+    >>>    class MomentumStrategy_Ex1_test:
+    >>>       def __init__(self, p1, lookback_period=10, filter_type='sma', skip_entries_flag=False):
+    >>>            self.p1, self.lookback_period, self.filter_type, self.skip_entries_flag = p1, lookback_period, filter_type, skip_entries_flag
+    >>>
+    >>>        def __repr__(self):
+    >>>            return self.__class__.__name__ + f"({self.p1},{self.lookback_period},{self.filter_type},{self.skip_entries_flag})"
+    >>>
+    >>>    variate(MomentumStrategy_Ex1_test, 10, lookback_period=[1,2,3], filter_type=['ema', 'sma'], skip_entries_flag=[True, False])
+    Output:
+    >>>    {
+    >>>        'MSE1t_(lp=1,ft=ema,sef=True)':  MomentumStrategy_Ex1_test(10,1,ema,True),
+    >>>        'MSE1t_(lp=1,ft=ema,sef=False)': MomentumStrategy_Ex1_test(10,1,ema,False),
+    >>>        'MSE1t_(lp=1,ft=sma,sef=True)':  MomentumStrategy_Ex1_test(10,1,sma,True),
+    >>>        'MSE1t_(lp=1,ft=sma,sef=False)': MomentumStrategy_Ex1_test(10,1,sma,False),
+    >>>        'MSE1t_(lp=2,ft=ema,sef=True)':  MomentumStrategy_Ex1_test(10,2,ema,True),
+    >>>        'MSE1t_(lp=2,ft=ema,sef=False)': MomentumStrategy_Ex1_test(10,2,ema,False),
+    >>>        'MSE1t_(lp=2,ft=sma,sef=True)':  MomentumStrategy_Ex1_test(10,2,sma,True),
+    >>>        'MSE1t_(lp=2,ft=sma,sef=False)': MomentumStrategy_Ex1_test(10,2,sma,False),
+    >>>        'MSE1t_(lp=3,ft=ema,sef=True)':  MomentumStrategy_Ex1_test(10,3,ema,True),
+    >>>        'MSE1t_(lp=3,ft=ema,sef=False)': MomentumStrategy_Ex1_test(10,3,ema,False),
+    >>>        'MSE1t_(lp=3,ft=sma,sef=True)':  MomentumStrategy_Ex1_test(10,3,sma,True),
+    >>>        'MSE1t_(lp=3,ft=sma,sef=False)': MomentumStrategy_Ex1_test(10,3,sma,False)
+    >>>    }
+    and using in simuation:
+    >>>    r = simulate(
+    >>>             variate(MomentumStrategy_Ex1_test, 10, lookback_period=[1,2,3], filter_type=['ema', 'sma'], skip_entries_flag=[True, False]),
+    >>>             data, capital, ["BINANCE.UM:BTCUSDT"], dict(type="ohlc", timeframe="5Min", nback=0), "5Min -1Sec", "vip0_usdt", "2024-01-01", "2024-01-02"
+    >>>    )
+    """
+    def _cmprss(xs: str):
+        return "".join([x[0] for x in re.split("((?<!-)(?=[A-Z]))|_|(\d)", xs) if x])
+    sfx = _cmprss(clz.__name__)
+    to_excl = [s for s, v in kwargs.items() if not isinstance(v, (list, set, tuple, range))]
+    dic2str = lambda ds: [_cmprss(k) + "=" + str(v) for k, v in ds.items() if k not in to_excl]
+    return {
+        f"{sfx}_({ ','.join(dic2str(z)) })": clz(*args, **z) for z in permutate_params(kwargs, conditions=conditions)
+    }

qubx/backtester/queue.py ADDED Viewed

@@ -0,0 +1,243 @@
+import pandas as pd
+import heapq
+from dataclasses import dataclass
+from collections import defaultdict
+from typing import Any, Iterator, Iterable
+from qubx import logger
+from qubx.core.basics import Instrument, dt_64, BatchEvent
+from qubx.data.readers import DataReader, DataTransformer
+from qubx.utils.misc import Stopwatch
+_SW = Stopwatch()
+class DataLoader:
+    _TYPE_MAPPERS = {"agg_trade": "trade", "ohlc": "bar", "ohlcv": "bar"}
+    def __init__(
+        self,
+        transformer: DataTransformer,
+        reader: DataReader,
+        instrument: Instrument,
+        timeframe: str | None,
+        preload_bars: int = 0,
+        data_type: str = "ohlc",
+        output_type: str | None = None,  # transfomer can somtimes map to a different output type
+        chunksize: int = 5_000,
+    ) -> None:
+        self._instrument = instrument
+        self._spec = f"{instrument.exchange}:{instrument.symbol}"
+        self._reader = reader
+        self._transformer = transformer
+        self._init_bars_required = preload_bars
+        self._timeframe = timeframe
+        self._data_type = data_type
+        self._output_type = output_type
+        self._first_load = True
+        self._chunksize = chunksize
+    def load(self, start: str | pd.Timestamp, end: str | pd.Timestamp) -> Iterator:
+        if self._first_load:
+            if self._init_bars_required > 0 and self._timeframe:
+                start = pd.Timestamp(start) - self._init_bars_required * pd.Timedelta(self._timeframe)
+            self._first_load = False
+        args = dict(
+            data_id=self._spec,
+            start=start,
+            stop=end,
+            transform=self._transformer,
+            data_type=self._data_type,
+            chunksize=self._chunksize,
+        )
+        if self._timeframe:
+            args["timeframe"] = self._timeframe
+        return self._reader.read(**args)  # type: ignore
+    @property
+    def instrument(self) -> Instrument:
+        return self._instrument
+    @property
+    def symbol(self) -> str:
+        return self._instrument.symbol
+    @property
+    def data_type(self) -> str:
+        if self._output_type:
+            return self._output_type
+        return self._TYPE_MAPPERS.get(self._data_type, self._data_type)
+    def __hash__(self) -> int:
+        return hash((self._instrument.symbol, self._data_type))
+    def __eq__(self, other: Any) -> bool:
+        if not isinstance(other, DataLoader):
+            return False
+        return self._instrument.symbol == other._instrument.symbol and self._data_type == other._data_type
+class SimulatedDataQueue:
+    _loaders: dict[str, list[DataLoader]]
+    def __init__(self):
+        self._loaders = defaultdict(list)
+        self._start = None
+        self._stop = None
+        self._current_time = None
+        self._index_to_loader: dict[int, DataLoader] = {}
+        self._loader_to_index = {}
+        self._latest_loader_index = -1
+        self._removed_loader_indices = set()
+    @property
+    def is_running(self) -> bool:
+        return self._current_time is not None
+    def __add__(self, loader: DataLoader) -> "SimulatedDataQueue":
+        self._latest_loader_index += 1
+        new_loader_index = self._latest_loader_index
+        self._loaders[loader.symbol].append(loader)
+        self._index_to_loader[new_loader_index] = loader
+        self._loader_to_index[loader] = new_loader_index
+        if self.is_running:
+            self._add_chunk_to_heap(new_loader_index)
+        return self
+    def __sub__(self, loader: DataLoader) -> "SimulatedDataQueue":
+        loader_index = self._loader_to_index[loader]
+        self._loaders[loader.symbol].remove(loader)
+        del self._index_to_loader[loader_index]
+        del self._loader_to_index[loader]
+        del self._index_to_chunk_size[loader_index]
+        del self._index_to_iterator[loader_index]
+        self._removed_loader_indices.add(loader_index)
+        return self
+    def get_loader(self, symbol: str, data_type: str) -> DataLoader:
+        loaders = self._loaders[symbol]
+        for loader in loaders:
+            if loader.data_type == data_type:
+                return loader
+        raise ValueError(f"Loader for {symbol} and {data_type} not found")
+    def create_iterable(self, start: str | pd.Timestamp, stop: str | pd.Timestamp) -> Iterator:
+        self._start = start
+        self._stop = stop
+        self._current_time = None
+        return self
+    def __iter__(self) -> Iterator:
+        logger.info("Initializing chunks for each loader")
+        self._current_time = self._start
+        self._index_to_chunk_size = {}
+        self._index_to_iterator = {}
+        self._event_heap = []
+        for loader_index in self._index_to_loader.keys():
+            self._add_chunk_to_heap(loader_index)
+        return self
+    @_SW.watch("DataQueue")
+    def __next__(self) -> tuple[str, str, Any]:
+        if not self._event_heap:
+            raise StopIteration
+        loader_index = None
+        # get the next event from the heap
+        # if the loader_index is in the removed_loader_indices, skip it (optimization to avoid unnecessary heap operations)
+        while self._event_heap and (loader_index is None or loader_index in self._removed_loader_indices):
+            dt, loader_index, chunk_index, event = heapq.heappop(self._event_heap)
+        if loader_index is None or loader_index in self._removed_loader_indices:
+            raise StopIteration
+        self._current_time = dt
+        chunk_size = self._index_to_chunk_size[loader_index]
+        if chunk_index + 1 == chunk_size:
+            self._add_chunk_to_heap(loader_index)
+        loader = self._index_to_loader[loader_index]
+        return loader.symbol, loader.data_type, event
+    @_SW.watch("DataQueue")
+    def _add_chunk_to_heap(self, loader_index: int):
+        chunk = self._next_chunk(loader_index)
+        self._index_to_chunk_size[loader_index] = len(chunk)
+        for chunk_index, event in enumerate(chunk):
+            dt = event.time  # type: ignore
+            heapq.heappush(self._event_heap, (dt, loader_index, chunk_index, event))
+    @_SW.watch("DataQueue")
+    def _next_chunk(self, index: int) -> list[Any]:
+        if index not in self._index_to_iterator:
+            self._index_to_iterator[index] = self._index_to_loader[index].load(self._current_time, self._stop)  # type: ignore
+        iterator = self._index_to_iterator[index]
+        try:
+            return next(iterator)
+        except StopIteration:
+            return []
+class EventBatcher:
+    _BATCH_SETTINGS = {
+        "trade": "1Sec",
+        "orderbook": "1Sec",
+    }
+    def __init__(self, source_iterator: Iterator | Iterable, passthrough: bool = False, **kwargs):
+        self.source_iterator = source_iterator
+        self._passthrough = passthrough
+        self._batch_settings = {**self._BATCH_SETTINGS, **kwargs}
+        self._batch_settings = {k: pd.Timedelta(v) for k, v in self._batch_settings.items()}
+    def __iter__(self) -> Iterator[tuple[str, str, Any]]:
+        if self._passthrough:
+            _iter = iter(self.source_iterator) if isinstance(self.source_iterator, Iterable) else self.source_iterator
+            yield from _iter
+            return
+        last_symbol, last_data_type = None, None
+        buffer = []
+        for symbol, data_type, event in self.source_iterator:
+            time: dt_64 = event.time  # type: ignore
+            if data_type not in self._batch_settings:
+                if buffer:
+                    yield last_symbol, last_data_type, self._batch_event(buffer)
+                    buffer = []
+                yield symbol, data_type, event
+                last_symbol, last_data_type = symbol, data_type
+                continue
+            if symbol != last_symbol:
+                if buffer:
+                    yield last_symbol, last_data_type, self._batch_event(buffer)
+                last_symbol, last_data_type = symbol, data_type
+                buffer = [event]
+                continue
+            if buffer and data_type != last_data_type:
+                yield symbol, last_data_type, buffer
+                buffer = [event]
+                last_symbol, last_data_type = symbol, data_type
+                continue
+            last_symbol, last_data_type = symbol, data_type
+            buffer.append(event)
+            if pd.Timedelta(time - buffer[0].time) >= self._batch_settings[data_type]:
+                yield symbol, data_type, self._batch_event(buffer)
+                buffer = []
+                last_symbol, last_data_type = None, None
+        if buffer:
+            yield last_symbol, last_data_type, self._batch_event(buffer)
+    @staticmethod
+    def _batch_event(buffer: list[Any]) -> Any:
+        return BatchEvent(buffer[-1].time, buffer) if len(buffer) > 1 else buffer[0]