PyPI - expr-codegen - Versions diffs - 0.13.4__tar.gz → 0.14.0__tar.gz - Mend

expr-codegen 0.13.4tar.gz → 0.14.0tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (29) hide show

{expr_codegen-0.13.4 → expr_codegen-0.14.0}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: expr_codegen
-Version: 0.13.4
+Version: 0.14.0
 Summary: symbol expression to polars expression tool
 Author-email: wukan <wu-kan@163.com>
 License: BSD 3-Clause License

expr_codegen-0.14.0/expr_codegen/_version.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ __version__ = "0.14.0"

{expr_codegen-0.13.4 → expr_codegen-0.14.0}/expr_codegen/pandas/code.py RENAMED Viewed

@@ -95,15 +95,15 @@ def codegen(exprs_ldl: ListDictList, exprs_src, syms_dst,
     syms1 = symbols_to_code(syms_dst)
     syms2 = symbols_to_code(syms_out)
-    if filter_last:
-        _groupbys = {'sort': groupbys['sort']}
-        if ts_func_name is None:
-            _groupbys['_filter_last'] = "df = filter_last(df.sort_values(by=[_DATE_]))"
-        for k, v in groupbys.items():
-            _groupbys[k] = v
-            if k == ts_func_name:
-                _groupbys[k + '_filter_last'] = "df = filter_last(df)"
-        groupbys = _groupbys
+    # filter_last处理
+    _groupbys = {'sort': groupbys['sort']}
+    if ts_func_name is None:
+        _groupbys['_filter_last'] = "df = _filter_last(df.sort_values(by=[_DATE_]), filter_last)"
+    for k, v in groupbys.items():
+        _groupbys[k] = v
+        if k == ts_func_name:
+            _groupbys[k + '_filter_last'] = "df = _filter_last(df, filter_last)"
+    groupbys = _groupbys
     try:
         env = jinja2.Environment(loader=FileSystemLoader(os.path.dirname(__file__)))

{expr_codegen-0.13.4 → expr_codegen-0.14.0}/expr_codegen/pandas/template.py.j2 RENAMED Viewed

@@ -51,12 +51,15 @@ def {{ key }}(df: pd.DataFrame) -> pd.DataFrame:
 """
-def filter_last(df: pd.DataFrame) -> pd.DataFrame:
+def _filter_last(df: pd.DataFrame, filter_last: bool) -> pd.DataFrame:
     """过滤数据，只取最后一天。实盘时可用于减少计算量"""
-    return df[df[_DATE_] >= df[_DATE_].iloc[-1]]
+    if filter_last:
+        return df[df[_DATE_] >= df[_DATE_].iloc[-1]]
+    else:
+        return df
-def main(df: pd.DataFrame) -> pd.DataFrame:
+def main(df: pd.DataFrame, filter_last: bool) -> pd.DataFrame:
     {% for key, value in groupbys.items() %}
     {{ value-}}
     {% endfor %}

{expr_codegen-0.13.4 → expr_codegen-0.14.0}/expr_codegen/polars/code.py RENAMED Viewed

@@ -120,15 +120,15 @@ def codegen(exprs_ldl: ListDictList, exprs_src, syms_dst,
     syms1 = symbols_to_code(syms_dst)
     syms2 = symbols_to_code(syms_out)
-    if filter_last:
-        _groupbys = {'sort': groupbys['sort']}
-        if ts_func_name is None:
-            _groupbys['_filter_last'] = "df = filter_last(df.sort(_DATE_))"
-        for k, v in groupbys.items():
-            _groupbys[k] = v
-            if k == ts_func_name:
-                _groupbys[k + '_filter_last'] = "df = filter_last(df)"
-        groupbys = _groupbys
+    # filter_last处理
+    _groupbys = {'sort': groupbys['sort']}
+    if ts_func_name is None:
+        _groupbys['_filter_last'] = "df = _filter_last(df.sort(_DATE_), filter_last)"
+    for k, v in groupbys.items():
+        _groupbys[k] = v
+        if k == ts_func_name:
+            _groupbys[k + '_filter_last'] = "df = _filter_last(df, filter_last)"
+    groupbys = _groupbys
     try:
         env = jinja2.Environment(loader=FileSystemLoader(os.path.dirname(__file__)))

{expr_codegen-0.13.4 → expr_codegen-0.14.0}/expr_codegen/polars/template.py.j2 RENAMED Viewed

@@ -62,17 +62,20 @@ def {{ key }}(df: DataFrame) -> DataFrame:
 """
-def filter_last(df: DataFrame) -> DataFrame:
+def _filter_last(df: DataFrame, filter_last: bool) -> DataFrame:
     """过滤数据，只取最后一天。实盘时可用于减少计算量
     前一个调用的ts,这里可以直接调用，可以认为已经排序好
         `df = filter_last(df)`
     反之
         `df = filter_last(df.sort(_DATE_))`
     """
-    return df.filter(pl.col(_DATE_) >= df.select(pl.last(_DATE_))[0, 0])
+    if filter_last:
+        return df.filter(pl.col(_DATE_) >= df.select(pl.last(_DATE_))[0, 0])
+    else:
+        return df
-def main(df: DataFrame) -> DataFrame:
+def main(df: DataFrame, filter_last: bool) -> DataFrame:
     {% for key, value in groupbys.items() %}
     {{ value-}}
     {% endfor %}

{expr_codegen-0.13.4 → expr_codegen-0.14.0}/expr_codegen/tool.py RENAMED Viewed

@@ -10,6 +10,7 @@ from loguru import logger
 from sympy import simplify, cse, symbols, numbered_symbols
 from sympy.core.expr import Expr
 from sympy.logic import boolalg
+from sympy.simplify import cse_opts
 from expr_codegen.codes import sources_to_exprs
 from expr_codegen.expr import get_current_by_prefix, get_children, replace_exprs
@@ -48,7 +49,10 @@ Expr.diff = _diff
 # ===============================
-def simplify2(expr):
+def simplify2(expr, skip_simplify: bool):
+    # OPEN/OPEN会被简化成1，遗传算法中常出现，可以跳过简化
+    if skip_simplify:
+        return expr
     try:
         expr = simplify(expr)
     except (AttributeError, TypeError) as e:
@@ -92,7 +96,7 @@ class ExprTool:
         # print(exprs)
         return exprs, syms
-    def merge(self, date, asset, args):
+    def merge(self, date, asset, args, skip_simplify):
         """合并多个表达式
         1. 先抽取分割子公式
@@ -108,7 +112,7 @@ class ExprTool:
         表达式列表
         """
         # 抽取前先化简
-        args = [(k, simplify2(v), c) for k, v, c in args]
+        args = [(k, simplify2(v, skip_simplify), c) for k, v, c in args]
         # 保留了注释信息
         exprs_syms = [(self.extract(v, date, asset), c) for k, v, c in args]
@@ -171,7 +175,7 @@ class ExprTool:
         _exprs = [k for k, v in exprs]
         # 注意：对于表达式右边相同，左边不同的情况，会当成一个处理
-        repl, redu = cse(_exprs, symbols_repl, optimizations="basic")
+        repl, redu = cse(_exprs, symbols_repl, optimizations=[(cse_opts.sub_pre, cse_opts.sub_post), ])
         outputs_len = len(exprs_src)
         new_redu = []
@@ -204,6 +208,7 @@ class ExprTool:
             over_null: Literal['order_by', 'partition_by', None] = 'partition_by',
             table_name: str = 'self',
             filter_last: bool = False,
+            skip_simplify: bool = False,
             **kwargs):
         """功能集成版，将几个功能写到一起方便使用
@@ -229,6 +234,7 @@ class ExprTool:
             需要复制到模板中的额外代码
         table_name
         filter_last
+        skip_simplify
         Returns
         -------
@@ -241,7 +247,7 @@ class ExprTool:
             exprs_src = replace_exprs(exprs_src)
         # 子表达式在前，原表式在最后
-        exprs_dst, syms_dst = self.merge(date, asset, exprs_src)
+        exprs_dst, syms_dst = self.merge(date, asset, exprs_src, skip_simplify)
         syms_dst = list(set(syms_dst) - _RESERVED_WORD_)
         # 提取公共表达式
@@ -292,6 +298,7 @@ class ExprTool:
                   over_null: Literal['order_by', 'partition_by', None] = 'partition_by',
                   table_name: str = 'self',
                   filter_last: bool = False,
+                  skip_simplify: bool = False,
                   **kwargs) -> str:
         """通过字符串生成代码， 加了缓存，多次调用不重复生成"""
         raw, exprs_list = sources_to_exprs(self.globals_, source, *more_sources, convert_xor=convert_xor)
@@ -308,6 +315,7 @@ class ExprTool:
                              over_null=over_null,
                              table_name=table_name,
                              filter_last=filter_last,
+                             skip_simplify=skip_simplify,
                              **kwargs)
         # 移回到cache，防止多次调用多次保存
@@ -371,6 +379,7 @@ def codegen_exec(df: Union[DataFrame, None],
                  date: str = 'date', asset: str = 'asset',
                  table_name: str = 'self',
                  filter_last: bool = False,
+                 skip_simplify: bool = False,
                  **kwargs) -> Union[DataFrame, str]:
     """快速转换源代码并执行
@@ -412,6 +421,8 @@ def codegen_exec(df: Union[DataFrame, None],
         表名。只在style参数为sql时有效
     filter_last:bool
         在实盘时，只需要最后一天日期的数据，可以在最后一个`ts`之后过滤数据。目前只在style参数为'polars', 'pandas'时有效
+    skip_simplify:bool
+        遗传算法时很有可能出现OPEN/OPEN，可以跳过化简步骤
     Returns
@@ -440,12 +451,12 @@ def codegen_exec(df: Union[DataFrame, None],
         if input_file is not None:
             if input_file.endswith('.py'):
-                return _get_func_from_file_py(input_file)(df)
+                return _get_func_from_file_py(input_file)(df, filter_last)
             elif input_file.endswith('.sql'):
                 with pl.SQLContext(frames={table_name: df}) as ctx:
                     return ctx.execute(_get_code_from_file(input_file), eager=isinstance(df, _pl_DataFrame))
             else:
-                return _get_func_from_module(input_file)(df)  # 可断点调试
+                return _get_func_from_module(input_file)(df, filter_last)  # 可断点调试
     else:
         pass
@@ -466,6 +477,7 @@ def codegen_exec(df: Union[DataFrame, None],
         over_null=over_null,
         table_name=table_name,
         filter_last=filter_last,
+        skip_simplify=skip_simplify,
         **kwargs
     )
@@ -477,4 +489,4 @@ def codegen_exec(df: Union[DataFrame, None],
             return ctx.execute(code, eager=isinstance(df, _pl_DataFrame))
     else:
         # 代码一样时就从缓存中取出函数
-        return _get_func_from_code_py(code)(df)
+        return _get_func_from_code_py(code)(df, filter_last)