PyPI - topquant-ksk - Versions diffs - 0.1.0__tar.gz - Mend

topquant-ksk 0.1.0__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

topquant_ksk-0.1.0/PKG-INFO +16 -0
topquant_ksk-0.1.0/pyproject.toml +37 -0
topquant_ksk-0.1.0/setup.cfg +4 -0
topquant_ksk-0.1.0/src/topquant_ksk/__init__.py +2 -0
topquant_ksk-0.1.0/src/topquant_ksk/load_data.py +161 -0
topquant_ksk-0.1.0/src/topquant_ksk/metrics.py +124 -0
topquant_ksk-0.1.0/src/topquant_ksk.egg-info/PKG-INFO +16 -0
topquant_ksk-0.1.0/src/topquant_ksk.egg-info/SOURCES.txt +9 -0
topquant_ksk-0.1.0/src/topquant_ksk.egg-info/dependency_links.txt +1 -0
topquant_ksk-0.1.0/src/topquant_ksk.egg-info/requires.txt +3 -0
topquant_ksk-0.1.0/src/topquant_ksk.egg-info/top_level.txt +1 -0

topquant_ksk-0.1.0/PKG-INFO ADDED Viewed

@@ -0,0 +1,16 @@
+Metadata-Version: 2.4
+Name: topquant-ksk
+Version: 0.1.0
+Summary: 기관 투자자를 위한 파이썬 퀀트 투자 백테스팅 및 분석 도구
+Author-email: Your Name <your_email@example.com>
+Project-URL: Homepage, https://github.com/your-username/topquantksk
+Project-URL: Bug Tracker, https://github.com/your-username/topquantksk/issues
+Classifier: Programming Language :: Python :: 3
+Classifier: License :: OSI Approved :: MIT License
+Classifier: Operating System :: OS Independent
+Classifier: Topic :: Office/Business :: Financial :: Investment
+Requires-Python: >=3.9
+Description-Content-Type: text/markdown
+Requires-Dist: pandas>=1.5.0
+Requires-Dist: numpy>=1.20.0
+Requires-Dist: tqdm

topquant_ksk-0.1.0/pyproject.toml ADDED Viewed

@@ -0,0 +1,37 @@
+# 1. 빌드 시스템 설정 (대부분의 경우 그대로 사용)
+[build-system]
+requires = ["setuptools>=61.0"]
+build-backend = "setuptools.build_meta"
+# 2. 프로젝트 핵심 정보
+[project]
+# pip install topquant-ksk 처럼 사용될 패키지 이름
+name = "topquant-ksk"
+version = "0.1.0"
+authors = [
+  { name="Your Name", email="your_email@example.com" },
+]
+description = "기관 투자자를 위한 파이썬 퀀트 투자 백테스팅 및 분석 도구"
+readme = "README.md"
+requires-python = ">=3.9"
+license = { file="LICENSE" }
+dependencies = [
+    "pandas>=1.5.0",
+    "numpy>=1.20.0",
+    "tqdm"
+]
+classifiers = [
+    "Programming Language :: Python :: 3",
+    "License :: OSI Approved :: MIT License",
+    "Operating System :: OS Independent",
+    "Topic :: Office/Business :: Financial :: Investment",
+]
+# 3. 관련 링크 정보 (PyPI 페이지에 표시됨)
+[project.urls]
+"Homepage" = "https://github.com/your-username/topquantksk"
+"Bug Tracker" = "https://github.com/your-username/topquantksk/issues"
+# 4. 소스코드 위치 지정
+[tool.setuptools.packages.find]
+where = ["src"]

topquant_ksk-0.1.0/setup.cfg ADDED Viewed

@@ -0,0 +1,4 @@
+[egg_info]
+tag_build =
+tag_date = 0

topquant_ksk-0.1.0/src/topquant_ksk/__init__.py ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ from .metrics import *
2	+ from .load_data import *

topquant_ksk-0.1.0/src/topquant_ksk/load_data.py ADDED Viewed

@@ -0,0 +1,161 @@
+import os
+import pandas as pd
+import warnings
+# ==============================================================================
+# ## 헬퍼(Helper) 함수 (이전과 동일)
+# ==============================================================================
+def find_file_recursive(filename: str) -> str | None:
+    """현재 디렉토리와 하위에서 파일을 재귀적으로 찾아 경로를 반환합니다."""
+    root_dir = os.getcwd()
+    for root, _, files in os.walk(root_dir):
+        if filename in files:
+            return os.path.join(root, filename)
+    return None
+def _load_file(file_path: str, sheet_name: str | None = None) -> pd.DataFrame | None:
+    """파일 경로와 시트 이름(선택)으로 데이터프레임을 로드하는 공통 함수"""
+    try:
+        if file_path.endswith('.xlsx'):
+            return pd.read_excel(file_path, sheet_name=sheet_name, index_col=[0])
+        elif file_path.endswith('.csv'):
+            return pd.read_csv(file_path, encoding='cp949', index_col=[0], low_memory=False)
+        else:
+            print(f"지원하지 않는 파일 형식입니다: {file_path}")
+            return None
+    except Exception as e:
+        print(f"파일 로드 중 오류: {e}")
+        return None
+def _process_dataframe(df: pd.DataFrame) -> pd.DataFrame:
+    """데이터프레임 후처리를 위한 공통 함수"""
+    idx = df.index
+    with warnings.catch_warnings():
+        warnings.simplefilter("ignore", UserWarning)
+        non_date_elements = idx[pd.to_datetime(idx, errors='coerce').isna()]
+    df.drop(non_date_elements, inplace=True)
+    df.index = pd.to_datetime(df.index)
+    df.index.name = None
+    df.replace(',', '', regex=True, inplace=True)
+    df.dropna(how='all',axis=1,inplace=True)
+    print("float 타입으로 변환을 시도합니다...")
+    for col in df.columns:
+        try:
+            df[col] = df[col].astype(float)
+        except ValueError:
+            pass
+    return df
+# ✨ 수정된 마스터 헬퍼 함수
+def _load_and_process_data(filename: str, column_spec: list, data_type_name: str, sheet_name: str | None = None) -> pd.DataFrame | None:
+    """파일 검색, 로드, 후처리 전체 과정을 수행하는 마스터 헬퍼 함수"""
+    file_path = find_file_recursive(filename)
+    if not file_path:
+        print(f"'{filename}' 파일을 찾을 수 없습니다. 🤷‍♂️")
+        return None
+    print(f"파일 발견! '{file_path}' 파일을 로드합니다... 📂")
+    df = _load_file(file_path, sheet_name=sheet_name)
+    if df is None:
+        return None
+    print(f"{data_type_name} 데이터 후처리를 시작합니다... 🛠️")
+    # --- ✨ 컬럼 설정 로직 수정 ✨ ---
+    if len(column_spec) == 1:
+        # column_spec의 길이가 1이면 단일 인덱스로 설정
+        df.columns = df.loc[column_spec[0]]
+    else:
+        # 길이가 1보다 크면 멀티인덱스로 설정
+        df.columns = [df.loc[name] for name in column_spec]
+    # 공통 후처리 로직 호출
+    df = _process_dataframe(df)
+    print("처리 완료! ✨")
+    return df
+# ==============================================================================
+# ## ✨ 메인(Main) 데이터 로드 함수 (수정됨) ✨
+# ==============================================================================
+def load_FactSet_TimeSeriesData(filename: str, sheet_name: str | None = 'TimeSeries') -> pd.DataFrame | None:
+    """TimeSeries 데이터를 로드합니다. (3-level columns)"""
+    return _load_and_process_data(
+        filename=filename,
+        sheet_name=sheet_name,
+        column_spec=['Item Name', 'Symbol Name', 'Symbol'],
+        data_type_name='TimeSeries'
+    )
+def load_DataGuide_TimeSeriesData(filename: str, sheet_name: str | None = 'TimeSeries') -> pd.DataFrame | None:
+    """TimeSeries 데이터를 로드합니다. (3-level columns)"""
+    return _load_and_process_data(
+        filename=filename,
+        sheet_name=sheet_name,
+        column_spec=['Item Name', 'Symbol Name', 'Symbol'],
+        data_type_name='TimeSeries'
+    )
+def load_DataGuide_IndexData(filename: str, sheet_name: str | None = 'TimeSeries') -> pd.DataFrame | None:
+    """Index 데이터를 로드합니다. (2-level columns)"""
+    return _load_and_process_data(
+        filename=filename,
+        sheet_name=sheet_name,
+        column_spec=['Item Name', 'Symbol Name'],
+        data_type_name='Index'
+    )
+def load_DataGuide_EconomicData(filename: str, sheet_name: str | None = 'Economic') -> pd.DataFrame | None:
+    """Economic 데이터를 로드합니다. (1-level column)"""
+    return _load_and_process_data(
+        filename=filename,
+        sheet_name=sheet_name,
+        column_spec=['Item Name'],
+        data_type_name='Economic'
+    )
+def load_DataGuide_CrossSectionalData(filename: str) -> pd.DataFrame | None:
+    """
+    지정된 파일명으로 CrossSectional 데이터를 찾아 로드하고 전처리합니다.
+    """
+    file_path = find_file_recursive(filename)
+    if not file_path:
+        print(f"현재 폴더 및 하위 폴더에서 '{filename}' 파일을 찾을 수 없습니다. 🤷‍♂️")
+        return None
+    print(f"파일 발견! '{file_path}' 파일을 로드합니다... 📂")
+    try:
+        if file_path.endswith('.xlsx'):
+            df = pd.read_excel(file_path, sheet_name='CrossSectional', index_col=[1, 0])
+        elif file_path.endswith('.csv'):
+            df = pd.read_csv(file_path, encoding='cp949', index_col=[1, 0], low_memory=False)
+        else:
+            print(f"지원하지 않는 파일 형식입니다: {filename}")
+            return None
+    except Exception as e:
+        print(f"파일 로드 중 오류: {e}")
+        return None
+    print("CrossSectional 데이터 후처리를 시작합니다... 🛠️")
+    header_tuple = ('Name', 'Symbol')
+    df.columns = df.loc[header_tuple]
+    header_location = df.index.get_loc(header_tuple)
+    df = df.iloc[header_location + 1:]
+    df.columns.names = ['Item Name']
+    df.index.names = ['Name', 'Symbol']
+    df.replace(',', '', regex=True, inplace=True)
+    print("float 타입으로 변환을 시도합니다...")
+    for col in df.columns:
+        try:
+            df[col] = df[col].astype(float)
+        except ValueError:
+            pass
+    print("처리 완료! ✨")
+    return df

topquant_ksk-0.1.0/src/topquant_ksk/metrics.py ADDED Viewed

@@ -0,0 +1,124 @@
+import pandas as pd
+import numpy as np
+from tqdm import tqdm
+def get_RiskReturnProfile(rebalencing_ret: pd.DataFrame, cash_return_daily_BenchmarkFrequency: pd.Series, BM: pd.Series | None = None):
+    """
+    수익률 데이터를 받아 주요 성과 지표를 계산합니다.
+    IndexingError를 수정한 최종 벡터화 코드를 사용합니다.
+    """
+    def calculate_max_underwater_period(value_series: pd.Series) -> float:
+        """단일 가치 시리즈에 대한 최대 손실 기간(연 단위)을 계산하는 내부 함수"""
+        if value_series.empty or value_series.isnull().all():
+            return 0.0
+        value_max = value_series.cummax()
+        underwater_series = value_max > value_series
+        if not underwater_series.any():
+            return 0.0
+        # 연속된 하락 기간(True)의 길이를 계산
+        underwater_groups = (underwater_series != underwater_series.shift()).cumsum()
+        underwater_lengths = underwater_series.groupby(underwater_groups).sum()
+        # ★★★ 오류 수정: 하락(True) 그룹만 필터링한 후 최대 기간을 찾음 ★★★
+        # 1. underwater_series가 True인 그룹 ID를 찾음
+        true_groups = underwater_groups[underwater_series]
+        # 2. 해당 그룹 ID에 해당하는 길이들 중에서 최대값을 찾음
+        max_period_days = underwater_lengths.loc[true_groups.unique()].max()
+        return round(max_period_days / 252, 1)
+    # --- 1. 전략(들)에 대한 공통 성과 지표 계산 ---
+    CAGR = (np.exp(np.log(rebalencing_ret + 1).mean() * 252) - 1).round(3) * 100
+    STD_annualized = (rebalencing_ret.std() * np.sqrt(252)).round(3) * 100
+    excess_ret = rebalencing_ret.subtract(cash_return_daily_BenchmarkFrequency.reindex(rebalencing_ret.index, method='ffill'), axis=0)
+    excess_ret_yearly = (np.exp(np.log(excess_ret + 1).mean() * 252) - 1)
+    Sharpe_Ratio = (excess_ret_yearly / (rebalencing_ret.std() * np.sqrt(252))).round(3)
+    pfl_value = (rebalencing_ret + 1).cumprod()
+    MDD = (pfl_value / pfl_value.cummax() - 1).min().round(3) * 100
+    MDD_date = (pfl_value / pfl_value.cummax() - 1).idxmin().astype(str).str[:7]
+    UnderWaterPeriod = pfl_value.apply(calculate_max_underwater_period)
+    # 기간별 수익률
+    ret_1M = ((rebalencing_ret.iloc[-21:] + 1).prod() - 1).round(3) * 100
+    ret_3M = ((rebalencing_ret.iloc[-21*3:] + 1).prod() - 1).round(3) * 100
+    ret_6M = ((rebalencing_ret.iloc[-21*6:] + 1).prod() - 1).round(3) * 100
+    ret_1Y = ((rebalencing_ret.iloc[-252:] + 1).prod() - 1).round(2) * 100
+    ret_3Y = ((rebalencing_ret.iloc[-252*3:] + 1).prod() - 1).round(2) * 100
+    metrics_list = [
+        CAGR, STD_annualized, Sharpe_Ratio, MDD, MDD_date, UnderWaterPeriod,
+        ret_1M, ret_3M, ret_6M, ret_1Y, ret_3Y
+    ]
+    index_list = [
+        'CAGR(%)', 'STD_annualized(%)', 'Sharpe_Ratio', 'MDD(%)', 'MDD시점', 'UnderWaterPeriod(년)',
+        '1M Ret(%)', '3M Ret(%)', '6M Ret(%)', '1Y Ret(%)', '3Y Ret(%)'
+    ]
+    matric = pd.DataFrame(metrics_list, index=index_list).T
+    if BM is not None:
+        aligned_ret, aligned_bm = rebalencing_ret.align(BM, join='inner', axis=0)
+        # BM 자체의 공통 성과 지표 계산
+        BM_CAGR = round(np.exp(np.log(aligned_bm + 1).mean() * 252) - 1, 3) * 100
+        BM_STD = round(aligned_bm.std() * np.sqrt(252), 3) * 100
+        bm_excess_ret = aligned_bm.subtract(cash_return_daily_BenchmarkFrequency.reindex(aligned_bm.index, method='ffill'))
+        bm_excess_ret_yearly = np.exp(np.log(bm_excess_ret + 1).mean() * 252) - 1
+        BM_Sharpe = round(bm_excess_ret_yearly / (aligned_bm.std() * np.sqrt(252)), 3)
+        bm_value = (aligned_bm + 1).cumprod()
+        BM_MDD = round((bm_value / bm_value.cummax() - 1).min(), 3) * 100
+        BM_MDD_date = (bm_value / bm_value.cummax() - 1).idxmin().strftime('%Y-%m')
+        BM_UnderWaterPeriod = calculate_max_underwater_period(bm_value)
+        BM_ret_1M = round((aligned_bm.iloc[-21:] + 1).prod() - 1, 3) * 100
+        BM_ret_3M = round((aligned_bm.iloc[-21*3:] + 1).prod() - 1, 3) * 100
+        BM_ret_6M = round((aligned_bm.iloc[-21*6:] + 1).prod() - 1, 3) * 100
+        BM_ret_1Y = round((aligned_bm.iloc[-252:] + 1).prod() - 1, 2) * 100
+        BM_ret_3Y = round((aligned_bm.iloc[-252*3:] + 1).prod() - 1, 2) * 100
+        # 전략의 BM 대비 상대 성과 지표 계산
+        excess_return_vs_bm = aligned_ret.subtract(aligned_bm, axis=0)
+        annualized_excess_return = (np.exp(np.log(excess_return_vs_bm + 1).mean() * 252) - 1)
+        tracking_error = excess_return_vs_bm.std() * np.sqrt(252)
+        information_ratio = (annualized_excess_return / tracking_error).round(3)
+        relative_value = (excess_return_vs_bm + 1).cumprod()
+        relative_drawdown = (relative_value / relative_value.cummax() - 1)
+        max_relative_drawdown = relative_drawdown.min().round(3) * 100
+        max_relative_drawdown_date = relative_drawdown.idxmin().astype(str).str[:7]
+        max_relative_underwater_duration = relative_value.apply(calculate_max_underwater_period)
+        # 최종 결과 테이블에 상대 성과 지표 컬럼 추가
+        matric['BM excess_return(%)']=round(annualized_excess_return*100,1)
+        matric['tracking_error(%)']=round(tracking_error*100,1)
+        matric['Information_Ratio'] = information_ratio
+        matric['BM대비최대손실(%)'] = max_relative_drawdown
+        matric['BM대비최대손실시점'] = max_relative_drawdown_date
+        matric['BM Max Underwater(년)'] = max_relative_underwater_duration
+        # BM 성과 행 생성 및 추가
+        bm_metrics_row = pd.Series(name='Benchmark', dtype=object)
+        bm_metrics_row['CAGR(%)'] = BM_CAGR
+        bm_metrics_row['STD_annualized(%)'] = BM_STD
+        bm_metrics_row['Sharpe_Ratio'] = BM_Sharpe
+        bm_metrics_row['MDD(%)'] = BM_MDD
+        bm_metrics_row['MDD시점'] = BM_MDD_date
+        bm_metrics_row['UnderWaterPeriod(년)'] = BM_UnderWaterPeriod
+        bm_metrics_row['1M Ret(%)'] = BM_ret_1M
+        bm_metrics_row['3M Ret(%)'] = BM_ret_3M
+        bm_metrics_row['6M Ret(%)'] = BM_ret_6M
+        bm_metrics_row['1Y Ret(%)'] = BM_ret_1Y
+        bm_metrics_row['3Y Ret(%)'] = BM_ret_3Y
+        bm_metrics_row['BM excess_return(%)'] = '-'
+        bm_metrics_row['tracking_error(%)'] = '-'
+        bm_metrics_row['Information_Ratio'] = '-'
+        bm_metrics_row['BM대비최대손실(%)'] = '-'
+        bm_metrics_row['BM대비최대손실시점'] = '-'
+        bm_metrics_row['BM Max Underwater(년)'] = '-'
+        matric = pd.concat([matric, bm_metrics_row.to_frame().T])
+    return matric

topquant_ksk-0.1.0/src/topquant_ksk.egg-info/PKG-INFO ADDED Viewed

@@ -0,0 +1,16 @@
+Metadata-Version: 2.4
+Name: topquant-ksk
+Version: 0.1.0
+Summary: 기관 투자자를 위한 파이썬 퀀트 투자 백테스팅 및 분석 도구
+Author-email: Your Name <your_email@example.com>
+Project-URL: Homepage, https://github.com/your-username/topquantksk
+Project-URL: Bug Tracker, https://github.com/your-username/topquantksk/issues
+Classifier: Programming Language :: Python :: 3
+Classifier: License :: OSI Approved :: MIT License
+Classifier: Operating System :: OS Independent
+Classifier: Topic :: Office/Business :: Financial :: Investment
+Requires-Python: >=3.9
+Description-Content-Type: text/markdown
+Requires-Dist: pandas>=1.5.0
+Requires-Dist: numpy>=1.20.0
+Requires-Dist: tqdm

topquant_ksk-0.1.0/src/topquant_ksk.egg-info/SOURCES.txt ADDED Viewed

@@ -0,0 +1,9 @@
+pyproject.toml
+src/topquant_ksk/__init__.py
+src/topquant_ksk/load_data.py
+src/topquant_ksk/metrics.py
+src/topquant_ksk.egg-info/PKG-INFO
+src/topquant_ksk.egg-info/SOURCES.txt
+src/topquant_ksk.egg-info/dependency_links.txt
+src/topquant_ksk.egg-info/requires.txt
+src/topquant_ksk.egg-info/top_level.txt

topquant_ksk-0.1.0/src/topquant_ksk.egg-info/dependency_links.txt ADDED Viewed

	@@ -0,0 +1 @@
1	+

topquant_ksk-0.1.0/src/topquant_ksk.egg-info/requires.txt ADDED Viewed

@@ -0,0 +1,3 @@
+pandas>=1.5.0
+numpy>=1.20.0
+tqdm

topquant_ksk-0.1.0/src/topquant_ksk.egg-info/top_level.txt ADDED Viewed

	@@ -0,0 +1 @@
1	+ topquant_ksk