PyPI - virgo-modules - Versions diffs - 0.0.82__py3-none-any.whl → 0.0.84__py3-none-any.whl - Mend

virgo-modules 0.0.82py3-none-any.whl → 0.0.84py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of virgo-modules might be problematic. Click here for more details.

Files changed (7) hide show

virgo_modules/src/re_utils.py CHANGED Viewed

@@ -1278,7 +1278,9 @@ class produce_plotly_plots:
         if self.save_path and self.save_aws:
             # upload_file_to_aws(bucket = 'VIRGO_BUCKET', key = f'market_plots/{self.ticket_name}/'+result_json_name ,input_path = self.save_path+result_json_name)
             upload_file_to_aws(bucket = 'VIRGO_BUCKET', key = self.save_aws + result_json_name, input_path = self.save_path + result_json_name, aws_credentials = self.aws_credentials)
+        if self.return_figs:
+            return fig
 def plot_hmm_analysis_logger(data_frame,test_data_size, save_path = False, show_plot = True):
     '''
     display box plots train and test of hmm state returns

virgo_modules/src/ticketer_source.py CHANGED Viewed

@@ -48,6 +48,8 @@ from feature_engine.timeseries.forecasting import LagFeatures
 from feature_engine.imputation import MeanMedianImputer
 from feature_engine.discretisation import EqualWidthDiscretiser
+from sklearn.linear_model import HuberRegressor
 from .aws_utils import upload_file_to_aws
 import logging
@@ -3070,10 +3072,10 @@ class analyse_index(stock_eda_panel):
     Attributes
     ----------
-    data  : pd.DataFrame
-        symbol of the asset
-    index : str
+    data_index : pd.DataFrame
          name of the index
+    indexes: list
+        list of indexes
     asset : str
          name of the asset
     n_obs : int
@@ -3104,14 +3106,13 @@ class analyse_index(stock_eda_panel):
     get_betas(subsample_ts=int)
         get general beta and last sample beta, correlation score is included too
     """
-    def __init__(self, index, asset, n_obs, lag, data_window = '5y', show_plot = True, save_path = False, save_aws = False, aws_credentials = False):
+    def __init__(self, index_data, asset, n_obs, lag, data_window = '5y', show_plot = False, save_path = False, save_aws = False, aws_credentials = False, return_fig = False):
         """
         Initialize object
         Parameters
         ----------
-        index (str): name of the index
+        index_data (pd.DataFrame or str): index data dataframe or index string
         asset (str): name of the asset
         n_obs (int): number of rows to extract
         lag (int): lag to apply
@@ -3126,45 +3127,57 @@ class analyse_index(stock_eda_panel):
         None
         """
-        self.index = index
+        if type(index_data) != str:
+            index_data['Date'] = pd.to_datetime(index_data['Date'])
+            self.index_data = index_data
+            self.indexes = [ x for x in list(index_data.columns) if x != 'Date']
+        else:
+            self.indexes = [index_data]
+        self.index_data = index_data
         self.asset = asset
         self.n_obs = n_obs
         self.data_window = data_window
         self.lag = lag
         self.show_plot = show_plot
+        self.return_fig = return_fig
         self.save_path = save_path
         self.save_aws = save_aws
     def process_data(self):
         """
         using stock_eda_panel, get data and merge data
         Parameters
         ----------
         None
         Returns
         -------
         None
         """
-        index = stock_eda_panel(self.index, self.n_obs, self.data_window)
-        index.get_data()
-        index.df['shift'] = index.df.Close.shift(self.lag)
-        index.df['index_return'] = index.df.Close/index.df['shift'] - 1
-        asset =  stock_eda_panel(self.asset, self.n_obs, self.data_window)
+        asset =  stock_eda_panel(self.asset, self.n_obs, data_window=self.data_window)
         asset.get_data()
-        asset.df['shift'] = asset.df.Close.shift(self.lag)
-        asset.df['asset_return'] = asset.df.Close/asset.df['shift'] - 1
-        df1 = index.df[['Date','index_return']]
-        df2 = asset.df[['Date','asset_return','Close']]
-        merger = df1.merge(df2, on = 'Date', how = 'inner')
-        merger.dropna(inplace = True)
-        self.merger_df = merger
+        df = asset.df[['Date','Close']]
+        if type(self.index_data) != str:
+            df_merge = df.merge(self.index_data, on = ['Date'], how = 'left').sort_values('Date')
+        else:
+            indx =  stock_eda_panel(self.index_data, self.n_obs, data_window=self.data_window)
+            indx.get_data()
+            indx_df = indx.df[['Date','Close']].rename(columns = {'Close':self.index_data})
+            df_merge = df.merge(indx_df, on = ['Date'], how = 'left').sort_values('Date')
+        for colx in ['Close'] + self.indexes:
+            df_merge[f'{colx}_pct'] = df_merge[colx]/df_merge[colx].shift(self.lag) - 1
+        df_merge.dropna(inplace = True)
+        self.merger_df = df_merge.rename(columns = {'Close_pct': 'asset_return'})
-    def plot_betas(self,sample_size, offset, subsample_ts =False):
+    def plot_betas(self,sample_size, offset, subsample_ts =False, index = False):
         """
         display beta analysis plot
@@ -3178,19 +3191,26 @@ class analyse_index(stock_eda_panel):
         -------
         None
         """
-        ### extracting data
-        self.process_data()
-         ### ploting analysis
+        if (type(self.index_data) == str) & (index != False):
+            raise Exception("No need of index argument")
+        else:
+            index = self.indexes[0]
+        index_pct = f'{index}_pct'
+        ### ploting analysis
         figure, ax = plt.subplot_mosaic(
             [["scatter_total", "scatter_sample",'ts','ts']],
             layout="constrained",
             figsize=(18, 5)
         )
-        ax['scatter_total'].scatter(self.merger_df.asset_return, self.merger_df.index_return)
-        b, a = np.polyfit(self.merger_df.asset_return, self.merger_df.index_return, 1)
+        ax['scatter_total'].scatter(self.merger_df.asset_return, self.merger_df[index_pct])
+        huber_regr = HuberRegressor(fit_intercept = True)
+        huber_regr.fit(self.merger_df.asset_return.values.reshape(-1,1), self.merger_df[index_pct].values.reshape(-1,1))
+        b, a = huber_regr.coef_[0], huber_regr.intercept_
+        # b, a = np.polyfit(self.merger_df.asset_return, self.merger_df[index_pct], 1)
         ax['scatter_total'].plot(self.merger_df.asset_return, b*self.merger_df.asset_return+a, color='red')
         ax['ts'].plot(self.merger_df.Date, self.merger_df.Close, color = 'grey', alpha = 0.3)
@@ -3201,10 +3221,13 @@ class analyse_index(stock_eda_panel):
         for i in range(0,len(self.merger_df)-sample_size,offset):
             merger_ = self.merger_df.sort_values('Date', ascending = False).iloc[i:i+sample_size,:]
-            x = merger_.index_return
+            x = merger_[index_pct]
             y = merger_.asset_return
-            b, a = np.polyfit(x,y, 1)
+            # b, a = np.polyfit(x,y, 1)
+            huber_regr = HuberRegressor(fit_intercept = True)
+            huber_regr.fit(x.values.reshape(-1,1), y.values.reshape(-1,1))
+            b, a = huber_regr.coef_[0], huber_regr.intercept_
             normalize = mcolors.Normalize(vmin=-1, vmax=1)
             colormap = cm.jet
@@ -3218,11 +3241,12 @@ class analyse_index(stock_eda_panel):
         scalarmappaple = cm.ScalarMappable(norm=normalize, cmap=colormap)
         scalarmappaple.set_array(x)
-        plt.title(f'{self.asset} using index: {self.index}')
+        plt.title(f'{self.asset} using index: {index}')
         plt.colorbar(scalarmappaple)
         if self.show_plot:
             plt.show()
         if self.save_path:
             result_plot_name = f'market_best_fit.png'
             figure.savefig(self.save_path+result_plot_name)
@@ -3230,119 +3254,53 @@ class analyse_index(stock_eda_panel):
         if self.save_path and self.save_aws:
             # upload_file_to_aws(bucket = 'VIRGO_BUCKET', key = f'market_plots/{self.asset}/'+result_plot_name,input_path = self.save_path+result_plot_name)
             upload_file_to_aws(bucket = 'VIRGO_BUCKET', key = self.save_aws + result_plot_name, input_path = self.save_path + result_plot_name, aws_credentials = self.aws_credentials)
         if not self.show_plot:
-            plt.close()
+            plt.close()
+        if self.return_fig:
+            return figure
     def get_betas(self,subsample_ts=False):
         """
         get general beta and last sample beta, correlation score is included too
         Parameters
         ----------
         subsample_ts (int): subsample size of data
         Returns
         -------
         None
         """
-        self.process_data()
-        general_beta, a = np.polyfit(self.merger_df.asset_return, self.merger_df.index_return, 1)
-        general_r = stats.mstats.pearsonr(self.merger_df.asset_return, self.merger_df.index_return)[0]
-        self.process_data()
-        if subsample_ts:
-            self.merger_df = self.merger_df.iloc[-subsample_ts:,:].dropna()
-        sample_beta, a = np.polyfit(self.merger_df.asset_return, self.merger_df.index_return, 1)
-        sample_r = stats.mstats.pearsonr(self.merger_df.asset_return, self.merger_df.index_return)[0]
-        result = {
-            'general_beta':general_beta,
-            'general_r':general_r,
-            'sample_beta':sample_beta,
-            'sample_r':sample_r
-        }
-        self.states_result = result
-class evaluate_markets(analyse_index):
-    """
-    object that is going to evaluate multiple indexes
-    Attributes
-    ----------
-    stock_code : str
-        asset to assess
-    indexes : list
-        list of indexes
-    best_result : dict
-        best result beta and correlation
-    Methods
-    -------
-    process_data():
-        using stock_eda_panel, get data and merge data
-    plot_betas(sample_size=int, offset=int, subsample_ts=int):
-        display beta analysis plot
-    get_betas(subsample_ts=int)
-        get general beta and last sample beta, correlation score is included too
-    evaluate_best_market_fit(sample_size=int, offset=int,lag=int, n_obs=int, verbose=boolean, plot_best=boolean):
-        iterate every index in the index list and get results
-    """
-    def __init__(self, stock_code, indexes):
-        """
-        Initialize object
-        Parameters
-        ----------
-        stock_code  (str): asset to assess
-        indexes (list): list of indexes
-        Returns
-        -------
-        None
-        """
-        self.stock_code = stock_code
-        self.indexes = indexes
-    def evaluate_best_market_fit(self,sample_size, offset,lag= 3, n_obs = 3500, verbose = False, plot_best = False):
-        """
-        iterate every index in the index list and get results
-        Parameters
-        ----------
-        sample_size (int): sample size to get betas
-        offset (int): overlap size
-        lag (int): number of lags of the returns
-        n_obs (int): number of observations of the data extraction
-        verbose (boolean): if true, print results
-        plot_best (boolean): if true, display plot of the best result
-        Returns
-        -------
-        None
-        """
-        results_dicts = dict()
+        result = list()
         for index in self.indexes:
-            betex = analyse_index(index = index,asset = self.stock_code,n_obs = n_obs, lag = lag)
-            betex.get_betas(sample_size)
-            results_dicts[index] = betex.states_result
-        pd_result = pd.DataFrame(results_dicts).T
-        pd_result['gen_r2'] = pd_result.general_r ** 2
-        pd_result['sampl_r2'] = pd_result.sample_r ** 2
-        self.stat_results = pd_result
-        best_result = pd_result.sort_values('gen_r2',ascending = False).head(2).sort_values('sampl_r2',ascending = False).head(1)
-        best_fit_index = best_result.index.values[0]
-        self.stat_results = self.stat_results.drop(columns = ['gen_r2','sampl_r2'])
-        if verbose:
-            print(best_result)
-        if plot_best:
-            betex = analyse_index(index = best_fit_index,asset = self.stock_code, n_obs = n_obs, lag = lag)
-            betex.plot_betas(sample_size = sample_size, offset = offset, subsample_ts = False)
+            index_pct = f'{index}_pct'
+            huber_regr = HuberRegressor(fit_intercept = True)
+            huber_regr.fit(self.merger_df.asset_return.values.reshape(-1,1), self.merger_df[index_pct].values.reshape(-1,1))
+            general_beta, a = huber_regr.coef_[0], huber_regr.intercept_
+            general_r = stats.mstats.pearsonr(self.merger_df.asset_return, self.merger_df[index])[0]
+            dict_res = {
+                    'index':index,
+                    'general_beta':general_beta,
+                    'general_r':general_r,
+                }
+            if subsample_ts:
+                tmp_df = self.merger_df.iloc[-subsample_ts:,:].dropna()
+                huber_regr = HuberRegressor(fit_intercept = True)
+                huber_regr.fit(tmp_df.asset_return.values.reshape(-1,1), tmp_df[index_pct].values.reshape(-1,1))
+                sample_beta, a = huber_regr.coef_[0], huber_regr.intercept_
+                sample_r = stats.mstats.pearsonr(tmp_df.asset_return, tmp_df[index])[0]
+                dict_res['sample_beta'] = sample_beta
+                dict_res['sample_r'] = sample_r
+            result.append(dict_res)
+        self.states_result = result
-        self.best_result = best_result
 def get_relevant_beta(data_market, ticket_name,  show_plot = True, save_path = False, save_aws = False, aws_credentials = False):
     '''

{virgo_modules-0.0.82.dist-info → virgo_modules-0.0.84.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: virgo-modules
-Version: 0.0.82
+Version: 0.0.84
 Summary: data processing and statistical modeling using stock market data
 Home-page: https://github.com/miguelmayhem92/virgo_module
 Author: Miguel Mayhuire

{virgo_modules-0.0.82.dist-info → virgo_modules-0.0.84.dist-info}/RECORD RENAMED Viewed

@@ -3,10 +3,10 @@ virgo_modules/src/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU
 virgo_modules/src/aws_utils.py,sha256=q0l7D7ofo09Lu1QQjv-esheQ06uiSy1Pdq3xMul8zvk,2571
 virgo_modules/src/edge_utils.py,sha256=ll5pRs9EE20IsE5A1vA589TKzobkeA-b0d68jNTsu1U,13268
 virgo_modules/src/pull_artifacts.py,sha256=5OPrgR7pcMSdpbevDRhf0ebk7g7ZRjff4NpTIIWAKjE,1989
-virgo_modules/src/re_utils.py,sha256=a7u7ouZ6dKvJZXzgjPLTRARbCapMC_sWf-azhExpMAk,71590
-virgo_modules/src/ticketer_source.py,sha256=nDxBs0YIFwInCvk73PoU8D8oiAxElf3ERbRQXRw8k_M,144162
-virgo_modules-0.0.82.dist-info/LICENSE,sha256=pNgFyCYgmimaw0o6V20JupZLROycAnOA_HDDh1tX2V4,1097
-virgo_modules-0.0.82.dist-info/METADATA,sha256=n-F7T6tpDni4jLj24J_g5K0VfTXKcA_RC_rJVYpufDE,1429
-virgo_modules-0.0.82.dist-info/WHEEL,sha256=yQN5g4mg4AybRjkgi-9yy4iQEFibGQmlz78Pik5Or-A,92
-virgo_modules-0.0.82.dist-info/top_level.txt,sha256=ZjI-qEkDtT-8mFwGAWnXfqPOKEGlIhWRW1es1VyXc60,14
-virgo_modules-0.0.82.dist-info/RECORD,,
+virgo_modules/src/re_utils.py,sha256=jB5raZFppVl-ZgCzmAF6vB8GCwyVAV6rQjHAKFaCnVw,71652
+virgo_modules/src/ticketer_source.py,sha256=cEGgago1bl3tynRND30jqfiPWxF-KTTgiN9DRTbyB_k,143298
+virgo_modules-0.0.84.dist-info/LICENSE,sha256=pNgFyCYgmimaw0o6V20JupZLROycAnOA_HDDh1tX2V4,1097
+virgo_modules-0.0.84.dist-info/METADATA,sha256=6shZyCX6M6LsMFsxiT-jKAAYtBMd84kjcBDKiGo0JTc,1429
+virgo_modules-0.0.84.dist-info/WHEEL,sha256=yQN5g4mg4AybRjkgi-9yy4iQEFibGQmlz78Pik5Or-A,92
+virgo_modules-0.0.84.dist-info/top_level.txt,sha256=ZjI-qEkDtT-8mFwGAWnXfqPOKEGlIhWRW1es1VyXc60,14
+virgo_modules-0.0.84.dist-info/RECORD,,

{virgo_modules-0.0.82.dist-info → virgo_modules-0.0.84.dist-info}/LICENSE RENAMED Viewed

File without changes

{virgo_modules-0.0.82.dist-info → virgo_modules-0.0.84.dist-info}/WHEEL RENAMED Viewed

File without changes

{virgo_modules-0.0.82.dist-info → virgo_modules-0.0.84.dist-info}/top_level.txt RENAMED Viewed

File without changes

virgo-modules 0.0.82__py3-none-any.whl → 0.0.84__py3-none-any.whl

Potentially problematic release.

virgo-modules 0.0.82py3-none-any.whl → 0.0.84py3-none-any.whl