PyPI - coinsignal - Versions diffs - 1.4.0__cp312-cp312-win_amd64.whl - Mend

coinsignal 1.4.0__cp312-cp312-win_amd64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of coinsignal might be problematic. Click here for more details.

Files changed (13) hide show

coinsignal/__init__.py +12 -0
coinsignal/_ext.pyd +0 -0
coinsignal/data.py +32 -0
coinsignal/feature.py +35 -0
coinsignal/label.py +36 -0
coinsignal/model.py +74 -0
coinsignal/parallel.py +21 -0
coinsignal/sampler.py +30 -0
coinsignal/tools.py +114 -0
coinsignal-1.4.0.dist-info/METADATA +23 -0
coinsignal-1.4.0.dist-info/RECORD +14 -0
coinsignal-1.4.0.dist-info/WHEEL +5 -0
coinsignal-1.4.0.dist-info/top_level.txt +1 -0

coinsignal/__init__.py ADDED Viewed

@@ -0,0 +1,12 @@
+from . import _ext
+from . import data
+from . import feature
+from . import label
+from . import model
+from . import parallel
+from . import sampler
+from . import tools
+__version__ = '1.4.0'
+__all__ = ['data', 'feature', 'label', 'model', 'parallel', 'sampler', 'tools']

coinsignal/_ext.pyd ADDED Viewed

Binary file

coinsignal/data.py ADDED Viewed

@@ -0,0 +1,32 @@
+# --------------------------------------------------------------------------------
+# Copyright (c) 2025 Zehao Yang
+#
+# Author: Zehao Yang
+#
+# This module implements data reading and transformation functions:
+# • Reading raw market data from CSV files
+# • Handling static and dynamic symbol selection
+# • Transforming symbol-based data maps into feature maps
+# --------------------------------------------------------------------------------
+import _ext.data as _data
+DEFAULT_DATA_PARAMS_DICT = {
+    'static_symbols': [],
+    'dynamic_symbols': {
+        'rule': '',
+        'count': 0
+    },
+    'sources': []
+}
+def read_data_to_features_map(data_dir, date, look_back_days, look_ahead_days, data_params_dict):
+    features_map, read_data_errors = _data.read_data_to_features_map(data_dir, date, look_back_days, look_ahead_days, data_params_dict)
+    return features_map, read_data_errors
+def transform_features_map_to_full_features_df(features_map):
+    full_features_df = _data.transform_features_map_to_full_features_df(features_map)
+    return full_features_df

coinsignal/feature.py ADDED Viewed

@@ -0,0 +1,35 @@
+# --------------------------------------------------------------------------------
+# Copyright (c) 2025 Zehao Yang
+#
+# Author: Zehao Yang
+#
+# This module implements feature engineering functions:
+# • Adding various features based on trade and reference exchange-market pairs
+# --------------------------------------------------------------------------------
+import _ext.feature as _feature
+DEFAULT_FEATURE_PARAMS_DICT = {
+    'time': [],
+    'macd': [],
+    'rsi': [],
+    'price_move_range': [],
+    'price_trend': [],
+    'price_volume_corr': [],
+    'ohlcv': [],
+    'volatility': [],
+    'high_low_time': [],
+    'volume': [],
+    'basis': [],
+    'fixedstart': [],
+    'funding_rate': [],
+    'funding_time': [],
+    'index': [],
+}
+def add_features(features_map, feature_params_dict):
+    features_map = _feature.add_features(features_map, feature_params_dict)
+    return features_map

coinsignal/label.py ADDED Viewed

@@ -0,0 +1,36 @@
+# --------------------------------------------------------------------------------
+# Copyright (c) 2025 Zehao Yang
+#
+# Author: Zehao Yang
+#
+# This module implements return (label) calculation functions:
+# • Calculating return values for multiple horizons and decay multipliers
+# • Handling time, duration, and range return types
+# • Supporting funding rate adjustment and discrete return calculation
+# --------------------------------------------------------------------------------
+import _ext.label as _label
+DEFAULT_RETURN_PARAMS_DICT = {
+    'pred_horizons': [600],
+    'decay_multipliers': [0.5, 0.8, 1, 1.5, 2, 3, 5, 10],
+    'return_type': 'time',
+    'range_merge_step': 1,
+    'n_multi': 1,
+    'multi_limits': [1, 1],
+    'half_life': 0,
+    'duration_vlimits': None,
+    'duration_qlimits': [0, 1],
+    'duration_handling': '',
+    'is_horizon_adjusted': False,
+    'is_funding_adjusted': False,
+    'is_discrete': False,
+    'y_multiplier': 10000
+}
+def calculate_return(features_map, return_params_dict):
+    features_map = _label.calculate_return(features_map, return_params_dict)
+    return features_map

coinsignal/model.py ADDED Viewed

@@ -0,0 +1,74 @@
+# --------------------------------------------------------------------------------
+# Copyright (c) 2025 Zehao Yang
+#
+# Author: Zehao Yang
+#
+# This module implements the main model training and evaluation pipeline:
+# • Handling data splitting, scaling, auxiliary model processing, cross-validation,
+# • Training and evaluating models with various metrics
+# --------------------------------------------------------------------------------
+import _ext.model as _model
+DEFAULT_MODEL_PARAMS_DICT = {
+    'group_count': 5,
+    'train_ratio': 0.8,
+    'valid_sub_ratio': 0.25,
+    'test_isolate_time': 0,
+    'is_random_start': False,
+    'is_cv': True,
+    'cv_split_count': 4,
+    'cv_eval_train_metric': True,
+    'cv_selection_metric': 'mse',
+    'num_boost_round': 1000,
+    'log_evaluation_period': 50,
+    'evaluate_rounds': [400, 700, 1000],
+    'X_scaler_sub_params': {
+        'name': '',
+        'vlimits': None,
+        'qlimits': [0, 1],
+        'inner_scale': 1,
+        'outer_scale': 1
+    },
+    'y_scaler_sub_params': {
+        'name': '',
+        'vlimits': None,
+        'qlimits': [0, 1],
+        'inner_scale': 1,
+        'outer_scale': 1
+    },
+    'auxiliary_model_sub_params': {
+        'name': '',
+        'model_dir': '',
+        'vlimits': None,
+        'qlimits': [0, 1],
+        'is_in_training': False
+    },
+    'loss_sub_params': {
+        'name': '',
+        'dof': 10,
+        'scale': 1,
+        'fee': 0.0001
+    },
+    'training_sub_params': {
+        'boosting_type': 'gbdt',
+        'num_leaves': 25,
+        'max_depth': 5,
+        'learning_rate': 0.005,
+        'reg_alpha': 1,
+        'reg_lambda': 1,
+        'min_gain_to_split': 0.1,
+        'extra_trees': True,
+        'objective': 'regression',
+        'metric': '',
+        'num_class': 1,
+        'verbose': -1
+    }
+}
+def run_model(full_features_df, model_params_dict):
+    model_evaluations = _model.run_model(full_features_df, model_params_dict)
+    return model_evaluations

coinsignal/parallel.py ADDED Viewed

@@ -0,0 +1,21 @@
+# --------------------------------------------------------------------------------
+# Copyright (c) 2025 Zehao Yang
+#
+# Author: Zehao Yang
+#
+# This module implements parallel processing for feature preparation:
+# • Parallelizing data reading, feature and label calculations, sampling
+# • Progress tracking for parallel processing across multiple dates
+# --------------------------------------------------------------------------------
+import _ext.parallel as _parallel
+def prepare_sub_full_features_df(data_dir, date, look_back_days, look_ahead_days, constants_dict, data_params_dict, feature_params_dict, return_params_dict, sampler_params_dict, N, n_completed, progress_update_event):
+    df, errors = _parallel.prepare_sub_full_features_df(data_dir, date, look_back_days, look_ahead_days, constants_dict, data_params_dict, feature_params_dict, return_params_dict, sampler_params_dict, N, n_completed, progress_update_event)
+    return df, errors
+def prepare_full_features_df(data_dir, start_date, end_date, look_back_days, look_ahead_days, constants_dict, data_params_dict, feature_params_dict, return_params_dict, sampler_params_dict):
+    full_features_df, read_data_errors = _parallel.prepare_full_features_df(prepare_sub_full_features_df, data_dir, start_date, end_date, look_back_days, look_ahead_days, constants_dict, data_params_dict, feature_params_dict, return_params_dict, sampler_params_dict)
+    return full_features_df, read_data_errors

coinsignal/sampler.py ADDED Viewed

@@ -0,0 +1,30 @@
+# --------------------------------------------------------------------------------
+# Copyright (c) 2025 Zehao Yang
+#
+# Author: Zehao Yang
+#
+# This module implements data sampling functions:
+# • Sampling data on time using time intervals
+# • Sampling data on move using smoothed price change
+# • Sampling data on return using weighted random sampling
+# --------------------------------------------------------------------------------
+import _ext.sampler as _sampler
+DEFAULT_SAMPLER_PARAMS_DICT = {
+    'sampling_time': 0,
+    'is_time_random': False,
+    'sampling_bp': 0,
+    'rolling_step': 0,
+    'is_sampling_on_ret': False,
+    'fraction': 1,
+    'weight_limit': 1,
+    'is_sign_balanced': False,
+}
+def sample_data(features_map, sampler_params_dict):
+    features_map = _sampler.sample_data(features_map, sampler_params_dict)
+    return features_map

coinsignal/tools.py ADDED Viewed

@@ -0,0 +1,114 @@
+# --------------------------------------------------------------------------------
+# Copyright (c) 2025 Zehao Yang
+#
+# Author: Zehao Yang
+#
+# This module provides utility functions and helper classes:
+# • I/O utilities for logging and progress tracking
+# • Configuration loading and parameter updating
+# • Rolling statistics calculations and various data processing helpers
+# • Plotting functions for model performance visualization
+# --------------------------------------------------------------------------------
+import os
+import sys
+import yaml
+import hashlib
+import numpy as np
+from datetime import datetime
+import _ext.tools as _tools
+class RegressionIO:
+    def __init__(self, log_file):
+        self.sys_stdout = sys.stdout
+        self.ios = [sys.stdout, open(log_file, 'a', encoding='utf-8')]
+    def write(self, text):
+        current_time = get_current_time()
+        if text not in ['\n', '\r']:
+            text = f'[{current_time}] {text}'
+        for io in self.ios:
+            io.write(text)
+    def flush(self):
+        for io in self.ios:
+            io.flush()
+    def close(self):
+        for io in self.ios[1:]:
+            io.close()
+    def __enter__(self):
+        sys.stdout = self
+        return self
+    def __exit__(self, exc_type, exc_val, exc_tb):
+        sys.stdout = self.sys_stdout
+        self.close()
+        return False
+def get_current_dir(current_file):
+    current_dir = os.path.dirname(os.path.abspath(current_file))
+    return current_dir
+def get_current_time():
+    current_time = datetime.now().strftime('%Y-%m-%d %H:%M:%S')
+    return current_time
+def write_log(log_file, log):
+    with open(log_file, 'w', encoding='utf-8') as f:
+        f.write(log)
+def load_config(current_dir):
+    with open(f'{current_dir}/config.yaml', 'r', encoding='utf-8') as f:
+        config = yaml.safe_load(f)
+    config['start_date'] = str(config['start_date'])
+    config['end_date'] = str(config['end_date'])
+    return config
+def initialize_random_seed(random_seed):
+    if random_seed is None:
+        random_seed = int(hashlib.md5(f'{datetime.now().timestamp()}_{os.urandom(8).hex()}'.encode()).hexdigest()[:8], 16)
+    np.random.seed(random_seed)
+    return random_seed
+def update_params_dict(params_dict, default_params_dict):
+    new_params_dict = {}
+    for key in default_params_dict:
+        if isinstance(default_params_dict[key], dict):
+            new_params_dict[key] = update_params_dict(params_dict.get(key, {}), default_params_dict[key])
+        else:
+            new_params_dict[key] = params_dict.get(key, default_params_dict[key])
+    return new_params_dict
+def make_results_dirs(output_dir, model_name, horizons):
+    model_dir = f'{output_dir}/{model_name}'
+    os.makedirs(model_dir, exist_ok=True)
+    os.makedirs(f'{model_dir}/results', exist_ok=True)
+    for horizon in horizons:
+        ret_col = f'ret-{horizon}'
+        os.makedirs(f'{model_dir}/results/{ret_col}', exist_ok=True)
+        os.makedirs(f'{model_dir}/results/{ret_col}/models', exist_ok=True)
+        os.makedirs(f'{model_dir}/results/{ret_col}/plots', exist_ok=True)
+def copy_scripts(current_dir, output_dir, model_name, random_seed, scripts_folder='scripts'):
+    model_dir = f'{output_dir}/{model_name}'
+    os.makedirs(f'{model_dir}/{scripts_folder}', exist_ok=True)
+    file_and_folders = [f for f in os.listdir(current_dir) if not f.startswith('.')]
+    for f in file_and_folders:
+        if os.path.isfile(f'{current_dir}/{f}'):
+            with open(f'{current_dir}/{f}', 'r', encoding='utf-8') as file:
+                text = file.read()
+                if f == 'config.yaml':
+                    row = [row for row in text.split('\n') if row.startswith('random_seed:')][0]
+                    text = text.replace(row, f'random_seed: {random_seed}')
+            with open(f'{model_dir}/{scripts_folder}/{f}', 'w', encoding='utf-8') as file:
+                file.write(text)
+        else:
+            copy_scripts(f'{current_dir}/{f}', output_dir, model_name, random_seed, f'{scripts_folder}/{f}')
+def summarize_and_save_results(output_dir, model_name, model_evaluations):
+    _tools.summarize_and_save_results(output_dir, model_name, model_evaluations)

coinsignal-1.4.0.dist-info/METADATA ADDED Viewed

@@ -0,0 +1,23 @@
+Metadata-Version: 2.4
+Name: coinsignal
+Version: 1.4.0
+Summary: coin data analysis and return predicting framework
+Author: Zehao Yang
+Requires-Python: >=3.8
+Description-Content-Type: text/plain
+Requires-Dist: numpy>=1.20.0
+Requires-Dist: pandas>=1.3.0
+Requires-Dist: lightgbm>=3.3.0
+Requires-Dist: scikit-learn>=1.0.0
+Requires-Dist: matplotlib>=3.3.0
+Requires-Dist: pyyaml>=5.4.0
+Requires-Dist: joblib>=1.0.0
+Requires-Dist: cython>=0.29.0
+Dynamic: author
+Dynamic: description
+Dynamic: description-content-type
+Dynamic: requires-dist
+Dynamic: requires-python
+Dynamic: summary
+coin data analysis and return predicting framework

coinsignal-1.4.0.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,14 @@
+coinsignal-1.4.0.dist-info/METADATA,sha256=3Azy1Ge380FQFqxKzqDGKFjl_DFyWhdpiPzOYPfj2As,649
+coinsignal-1.4.0.dist-info/RECORD,sha256=SX3a2IhGKhfnEpa-avEVQ7V4zmwapNooKvRDu3B-43U,1021
+coinsignal-1.4.0.dist-info/WHEEL,sha256=8UP9x9puWI0P1V_d7K2oMTBqfeLNm21CTzZ_Ptr0NXU,101
+coinsignal-1.4.0.dist-info/top_level.txt,sha256=8xBBVxKSVz2DM3nreUe-A7OGl7vCbK-3njdPu-JtUjw,11
+coinsignal/__init__.py,sha256=LV0A5txgjrFPJyQw6gGayDwbvRXN0rfo3gPqjTUUwzE,281
+coinsignal/_ext.pyd,sha256=dJ9djqwYpcjOLGIJQAkteSjnTdYLAwFBRalwGojPaok,908800
+coinsignal/data.py,sha256=7KPRna6ELPnKqu5c9ExI67c9iTV-OZ2TGh8CMNxau5c,1108
+coinsignal/feature.py,sha256=Mczca9hZN9Xf38ePg-aZh5pdY7KKS4GQCkkvjM252rs,931
+coinsignal/label.py,sha256=iHKZTcHxFUwE9-RX6Znr8WTFbzqcLxnYmUBSXvanBsQ,1164
+coinsignal/model.py,sha256=ASsg2CDycKMHhPlOoaLjrPsNSUNaeeNmoW7Wtj5-ceU,2054
+coinsignal/parallel.py,sha256=SQ4bBr4ppW2CvEzyagaMiqMVicYpYso40EFuJMT1nGE,1480
+coinsignal/sampler.py,sha256=D7HPaHZx9ZW4JWcQSu5cnX7eFXmy_bC3-J54AjLctcE,894
+coinsignal/tools.py,sha256=_92SQXz-OyD5p1ryZ463dGYMAD28do1_LR5GmzPhRDs,4322
+coinsignal-1.4.0.dist-info/RECORD,,

coinsignal-1.4.0.dist-info/WHEEL ADDED Viewed

@@ -0,0 +1,5 @@
+Wheel-Version: 1.0
+Generator: setuptools (80.9.0)
+Root-Is-Purelib: false
+Tag: cp312-cp312-win_amd64

coinsignal-1.4.0.dist-info/top_level.txt ADDED Viewed

	@@ -0,0 +1 @@
1	+ coinsignal