PyPI - maxframe - Versions diffs - 2.0.0b2__cp37-cp37m-win32.whl → 2.3.0rc1__cp37-cp37m-win32.whl - Mend

maxframe 2.0.0b2cp37-cp37m-win32.whl → 2.3.0rc1cp37-cp37m-win32.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of maxframe might be problematic. Click here for more details.

Files changed (443) hide show

maxframe/__init__.py +1 -0
maxframe/_utils.cp37-win32.pyd +0 -0
maxframe/_utils.pyx +14 -1
maxframe/codegen/core.py +9 -8
maxframe/codegen/spe/core.py +1 -1
maxframe/codegen/spe/dataframe/__init__.py +1 -0
maxframe/codegen/spe/dataframe/accessors/base.py +18 -0
maxframe/codegen/spe/dataframe/accessors/dict_.py +25 -130
maxframe/codegen/spe/dataframe/accessors/list_.py +12 -48
maxframe/codegen/spe/dataframe/accessors/struct_.py +28 -0
maxframe/codegen/spe/dataframe/arithmetic.py +7 -2
maxframe/codegen/spe/dataframe/groupby.py +88 -0
maxframe/codegen/spe/dataframe/indexing.py +99 -4
maxframe/codegen/spe/dataframe/merge.py +38 -1
maxframe/codegen/spe/dataframe/misc.py +11 -33
maxframe/codegen/spe/dataframe/reduction.py +32 -9
maxframe/codegen/spe/dataframe/reshape.py +46 -0
maxframe/codegen/spe/dataframe/sort.py +39 -18
maxframe/codegen/spe/dataframe/tests/accessors/test_dict.py +9 -15
maxframe/codegen/spe/dataframe/tests/accessors/test_list.py +4 -7
maxframe/codegen/spe/dataframe/tests/accessors/test_struct.py +75 -0
maxframe/codegen/spe/dataframe/tests/indexing/test_iloc.py +20 -1
maxframe/codegen/spe/dataframe/tests/indexing/test_loc.py +35 -0
maxframe/codegen/spe/dataframe/tests/misc/test_misc.py +0 -32
maxframe/codegen/spe/dataframe/tests/test_groupby.py +81 -18
maxframe/codegen/spe/dataframe/tests/test_merge.py +27 -1
maxframe/codegen/spe/dataframe/tests/test_reduction.py +13 -0
maxframe/codegen/spe/dataframe/tests/test_reshape.py +79 -0
maxframe/codegen/spe/dataframe/tests/test_sort.py +20 -0
maxframe/codegen/spe/dataframe/tseries.py +9 -0
maxframe/codegen/spe/learn/contrib/lightgbm.py +4 -3
maxframe/codegen/spe/learn/contrib/tests/test_xgboost.py +2 -1
maxframe/codegen/spe/learn/metrics/__init__.py +1 -1
maxframe/codegen/spe/learn/metrics/_ranking.py +76 -0
maxframe/codegen/spe/learn/metrics/pairwise.py +51 -0
maxframe/codegen/spe/learn/metrics/tests/test_pairwise.py +36 -0
maxframe/codegen/spe/learn/metrics/tests/test_ranking.py +59 -0
maxframe/codegen/spe/tensor/__init__.py +3 -0
maxframe/codegen/spe/tensor/datasource.py +1 -0
maxframe/codegen/spe/tensor/fft.py +74 -0
maxframe/codegen/spe/tensor/linalg.py +29 -2
maxframe/codegen/spe/tensor/misc.py +79 -25
maxframe/codegen/spe/tensor/spatial.py +45 -0
maxframe/codegen/spe/tensor/statistics.py +44 -0
maxframe/codegen/spe/tensor/tests/test_fft.py +64 -0
maxframe/codegen/spe/tensor/tests/test_linalg.py +15 -1
maxframe/codegen/spe/tensor/tests/test_misc.py +52 -2
maxframe/codegen/spe/tensor/tests/test_spatial.py +33 -0
maxframe/codegen/spe/tensor/tests/test_statistics.py +15 -1
maxframe/codegen/spe/tests/test_spe_codegen.py +6 -12
maxframe/codegen/spe/utils.py +2 -0
maxframe/config/config.py +73 -9
maxframe/config/tests/test_validators.py +13 -1
maxframe/config/validators.py +49 -0
maxframe/conftest.py +54 -17
maxframe/core/accessor.py +2 -2
maxframe/core/base.py +2 -1
maxframe/core/entity/core.py +5 -0
maxframe/core/entity/tileables.py +3 -1
maxframe/core/graph/core.cp37-win32.pyd +0 -0
maxframe/core/graph/entity.py +8 -3
maxframe/core/mode.py +6 -1
maxframe/core/operator/base.py +9 -2
maxframe/core/operator/core.py +10 -2
maxframe/core/operator/utils.py +13 -0
maxframe/dataframe/__init__.py +12 -5
maxframe/dataframe/accessors/__init__.py +1 -1
maxframe/dataframe/accessors/compat.py +45 -0
maxframe/dataframe/accessors/datetime_/__init__.py +4 -1
maxframe/dataframe/accessors/dict_/contains.py +7 -16
maxframe/dataframe/accessors/dict_/core.py +48 -0
maxframe/dataframe/accessors/dict_/getitem.py +17 -21
maxframe/dataframe/accessors/dict_/length.py +7 -16
maxframe/dataframe/accessors/dict_/remove.py +6 -18
maxframe/dataframe/accessors/dict_/setitem.py +8 -18
maxframe/dataframe/accessors/dict_/tests/test_dict_accessor.py +62 -22
maxframe/dataframe/accessors/list_/__init__.py +2 -2
maxframe/dataframe/accessors/list_/core.py +48 -0
maxframe/dataframe/accessors/list_/getitem.py +12 -19
maxframe/dataframe/accessors/list_/length.py +7 -16
maxframe/dataframe/accessors/list_/tests/test_list_accessor.py +11 -9
maxframe/dataframe/accessors/string_/__init__.py +4 -1
maxframe/dataframe/accessors/struct_/__init__.py +37 -0
maxframe/dataframe/accessors/struct_/accessor.py +39 -0
maxframe/dataframe/accessors/struct_/core.py +43 -0
maxframe/dataframe/accessors/struct_/dtypes.py +53 -0
maxframe/dataframe/accessors/struct_/field.py +123 -0
maxframe/dataframe/accessors/struct_/tests/__init__.py +13 -0
maxframe/dataframe/accessors/struct_/tests/test_struct_accessor.py +91 -0
maxframe/dataframe/arithmetic/__init__.py +18 -4
maxframe/dataframe/arithmetic/between.py +106 -0
maxframe/dataframe/arithmetic/dot.py +237 -0
maxframe/dataframe/arithmetic/maximum.py +33 -0
maxframe/dataframe/arithmetic/minimum.py +33 -0
maxframe/dataframe/arithmetic/{around.py → round.py} +11 -7
maxframe/dataframe/core.py +161 -224
maxframe/dataframe/datasource/__init__.py +18 -0
maxframe/dataframe/datasource/core.py +6 -0
maxframe/dataframe/datasource/direct.py +57 -0
maxframe/dataframe/datasource/from_dict.py +124 -0
maxframe/dataframe/datasource/from_index.py +1 -1
maxframe/dataframe/datasource/from_records.py +77 -0
maxframe/dataframe/datasource/from_tensor.py +109 -41
maxframe/dataframe/datasource/read_csv.py +21 -14
maxframe/dataframe/datasource/read_odps_query.py +29 -6
maxframe/dataframe/datasource/read_odps_table.py +32 -10
maxframe/dataframe/datasource/read_parquet.py +38 -39
maxframe/dataframe/datasource/tests/test_datasource.py +37 -0
maxframe/dataframe/datastore/__init__.py +11 -1
maxframe/dataframe/datastore/direct.py +268 -0
maxframe/dataframe/datastore/to_csv.py +29 -41
maxframe/dataframe/datastore/to_odps.py +36 -4
maxframe/dataframe/extensions/__init__.py +20 -4
maxframe/dataframe/extensions/apply_chunk.py +32 -6
maxframe/dataframe/extensions/cartesian_chunk.py +153 -0
maxframe/dataframe/extensions/collect_kv.py +126 -0
maxframe/dataframe/extensions/extract_kv.py +177 -0
maxframe/dataframe/extensions/flatjson.py +2 -1
maxframe/dataframe/extensions/map_reduce.py +263 -0
maxframe/dataframe/extensions/rebalance.py +62 -0
maxframe/dataframe/extensions/tests/test_apply_chunk.py +9 -2
maxframe/dataframe/extensions/tests/test_extensions.py +54 -0
maxframe/dataframe/extensions/tests/test_map_reduce.py +135 -0
maxframe/dataframe/groupby/__init__.py +17 -2
maxframe/dataframe/groupby/aggregation.py +86 -49
maxframe/dataframe/groupby/apply.py +1 -1
maxframe/dataframe/groupby/apply_chunk.py +19 -5
maxframe/dataframe/groupby/core.py +116 -16
maxframe/dataframe/groupby/cum.py +4 -25
maxframe/dataframe/groupby/expanding.py +264 -0
maxframe/dataframe/groupby/fill.py +1 -1
maxframe/dataframe/groupby/getitem.py +12 -5
maxframe/dataframe/groupby/head.py +11 -1
maxframe/dataframe/groupby/rank.py +136 -0
maxframe/dataframe/groupby/rolling.py +206 -0
maxframe/dataframe/groupby/shift.py +114 -0
maxframe/dataframe/groupby/tests/test_groupby.py +0 -5
maxframe/dataframe/indexing/__init__.py +22 -2
maxframe/dataframe/indexing/droplevel.py +195 -0
maxframe/dataframe/indexing/filter.py +169 -0
maxframe/dataframe/indexing/get_level_values.py +76 -0
maxframe/dataframe/indexing/iat.py +45 -0
maxframe/dataframe/indexing/iloc.py +152 -12
maxframe/dataframe/indexing/insert.py +46 -18
maxframe/dataframe/indexing/loc.py +287 -7
maxframe/dataframe/indexing/reindex.py +14 -5
maxframe/dataframe/indexing/rename.py +6 -0
maxframe/dataframe/indexing/rename_axis.py +2 -2
maxframe/dataframe/indexing/reorder_levels.py +143 -0
maxframe/dataframe/indexing/reset_index.py +33 -6
maxframe/dataframe/indexing/sample.py +8 -0
maxframe/dataframe/indexing/setitem.py +3 -3
maxframe/dataframe/indexing/swaplevel.py +185 -0
maxframe/dataframe/indexing/take.py +99 -0
maxframe/dataframe/indexing/truncate.py +140 -0
maxframe/dataframe/indexing/where.py +0 -11
maxframe/dataframe/indexing/xs.py +148 -0
maxframe/dataframe/merge/__init__.py +15 -1
maxframe/dataframe/merge/append.py +97 -98
maxframe/dataframe/merge/combine.py +244 -0
maxframe/dataframe/merge/combine_first.py +120 -0
maxframe/dataframe/merge/compare.py +387 -0
maxframe/dataframe/merge/concat.py +183 -0
maxframe/dataframe/merge/update.py +271 -0
maxframe/dataframe/misc/__init__.py +28 -11
maxframe/dataframe/misc/_duplicate.py +10 -4
maxframe/dataframe/misc/apply.py +1 -1
maxframe/dataframe/misc/check_unique.py +82 -0
maxframe/dataframe/misc/clip.py +145 -0
maxframe/dataframe/misc/describe.py +175 -9
maxframe/dataframe/misc/drop.py +31 -0
maxframe/dataframe/misc/drop_duplicates.py +2 -2
maxframe/dataframe/misc/duplicated.py +2 -2
maxframe/dataframe/misc/get_dummies.py +5 -1
maxframe/dataframe/misc/infer_dtypes.py +251 -0
maxframe/dataframe/misc/isin.py +2 -2
maxframe/dataframe/misc/map.py +125 -18
maxframe/dataframe/misc/repeat.py +159 -0
maxframe/dataframe/misc/tests/test_misc.py +48 -3
maxframe/dataframe/misc/to_numeric.py +3 -0
maxframe/dataframe/misc/transform.py +12 -5
maxframe/dataframe/misc/transpose.py +13 -1
maxframe/dataframe/misc/valid_index.py +115 -0
maxframe/dataframe/misc/value_counts.py +38 -4
maxframe/dataframe/missing/checkna.py +14 -6
maxframe/dataframe/missing/dropna.py +5 -0
maxframe/dataframe/missing/fillna.py +1 -1
maxframe/dataframe/missing/replace.py +7 -4
maxframe/dataframe/reduction/__init__.py +35 -16
maxframe/dataframe/reduction/aggregation.py +43 -14
maxframe/dataframe/reduction/all.py +2 -2
maxframe/dataframe/reduction/any.py +2 -2
maxframe/dataframe/reduction/argmax.py +103 -0
maxframe/dataframe/reduction/argmin.py +103 -0
maxframe/dataframe/reduction/core.py +80 -24
maxframe/dataframe/reduction/count.py +13 -9
maxframe/dataframe/reduction/cov.py +166 -0
maxframe/dataframe/reduction/cummax.py +2 -2
maxframe/dataframe/reduction/cummin.py +2 -2
maxframe/dataframe/reduction/cumprod.py +2 -2
maxframe/dataframe/reduction/cumsum.py +2 -2
maxframe/dataframe/reduction/custom_reduction.py +2 -2
maxframe/dataframe/reduction/idxmax.py +185 -0
maxframe/dataframe/reduction/idxmin.py +185 -0
maxframe/dataframe/reduction/kurtosis.py +37 -30
maxframe/dataframe/reduction/max.py +2 -2
maxframe/dataframe/reduction/mean.py +9 -7
maxframe/dataframe/reduction/median.py +2 -2
maxframe/dataframe/reduction/min.py +2 -2
maxframe/dataframe/reduction/mode.py +144 -0
maxframe/dataframe/reduction/nunique.py +19 -11
maxframe/dataframe/reduction/prod.py +18 -13
maxframe/dataframe/reduction/reduction_size.py +2 -2
maxframe/dataframe/reduction/sem.py +13 -9
maxframe/dataframe/reduction/skew.py +31 -27
maxframe/dataframe/reduction/str_concat.py +10 -7
maxframe/dataframe/reduction/sum.py +18 -14
maxframe/dataframe/reduction/tests/test_reduction.py +12 -0
maxframe/dataframe/reduction/unique.py +20 -3
maxframe/dataframe/reduction/var.py +16 -12
maxframe/dataframe/reshape/__init__.py +38 -0
maxframe/dataframe/{misc → reshape}/pivot.py +1 -0
maxframe/dataframe/{misc → reshape}/pivot_table.py +1 -0
maxframe/dataframe/reshape/unstack.py +114 -0
maxframe/dataframe/sort/__init__.py +16 -1
maxframe/dataframe/sort/argsort.py +68 -0
maxframe/dataframe/sort/core.py +2 -1
maxframe/dataframe/sort/nlargest.py +238 -0
maxframe/dataframe/sort/nsmallest.py +228 -0
maxframe/dataframe/sort/rank.py +147 -0
maxframe/dataframe/statistics/__init__.py +3 -3
maxframe/dataframe/statistics/corr.py +1 -0
maxframe/dataframe/statistics/quantile.py +2 -2
maxframe/dataframe/tests/test_typing.py +104 -0
maxframe/dataframe/tests/test_utils.py +66 -2
maxframe/dataframe/tseries/__init__.py +19 -0
maxframe/dataframe/tseries/at_time.py +61 -0
maxframe/dataframe/tseries/between_time.py +122 -0
maxframe/dataframe/typing_.py +185 -0
maxframe/dataframe/utils.py +125 -52
maxframe/dataframe/window/aggregation.py +8 -4
maxframe/dataframe/window/core.py +14 -1
maxframe/dataframe/window/ewm.py +1 -3
maxframe/dataframe/window/expanding.py +37 -35
maxframe/dataframe/window/rolling.py +49 -39
maxframe/dataframe/window/tests/test_expanding.py +1 -7
maxframe/dataframe/window/tests/test_rolling.py +1 -1
maxframe/env.py +7 -4
maxframe/errors.py +2 -2
maxframe/io/odpsio/schema.py +9 -3
maxframe/io/odpsio/tableio.py +7 -2
maxframe/io/odpsio/tests/test_schema.py +198 -83
maxframe/learn/__init__.py +10 -2
maxframe/learn/cluster/__init__.py +15 -0
maxframe/learn/cluster/_kmeans.py +782 -0
maxframe/learn/contrib/llm/core.py +18 -7
maxframe/learn/contrib/llm/deploy/__init__.py +13 -0
maxframe/learn/contrib/llm/deploy/config.py +221 -0
maxframe/learn/contrib/llm/deploy/core.py +247 -0
maxframe/learn/contrib/llm/deploy/framework.py +35 -0
maxframe/learn/contrib/llm/deploy/loader.py +360 -0
maxframe/learn/contrib/llm/deploy/tests/__init__.py +13 -0
maxframe/learn/contrib/llm/deploy/tests/test_register_models.py +359 -0
maxframe/learn/contrib/llm/models/__init__.py +1 -0
maxframe/learn/contrib/llm/models/dashscope.py +12 -6
maxframe/learn/contrib/llm/models/managed.py +76 -11
maxframe/learn/contrib/llm/models/openai.py +72 -0
maxframe/learn/contrib/llm/tests/__init__.py +13 -0
maxframe/learn/contrib/llm/tests/test_core.py +34 -0
maxframe/learn/contrib/llm/tests/test_openai.py +187 -0
maxframe/learn/contrib/llm/tests/test_text_gen.py +155 -0
maxframe/learn/contrib/llm/text.py +348 -42
maxframe/learn/contrib/models.py +4 -1
maxframe/learn/contrib/xgboost/classifier.py +2 -0
maxframe/learn/contrib/xgboost/core.py +113 -4
maxframe/learn/contrib/xgboost/predict.py +4 -2
maxframe/learn/contrib/xgboost/regressor.py +5 -0
maxframe/learn/contrib/xgboost/train.py +7 -2
maxframe/learn/core.py +66 -0
maxframe/learn/linear_model/_base.py +58 -1
maxframe/learn/linear_model/_lin_reg.py +1 -1
maxframe/learn/metrics/__init__.py +6 -0
maxframe/learn/metrics/_classification.py +145 -0
maxframe/learn/metrics/_ranking.py +477 -0
maxframe/learn/metrics/_scorer.py +60 -0
maxframe/learn/metrics/pairwise/__init__.py +21 -0
maxframe/learn/metrics/pairwise/core.py +77 -0
maxframe/learn/metrics/pairwise/cosine.py +115 -0
maxframe/learn/metrics/pairwise/euclidean.py +176 -0
maxframe/learn/metrics/pairwise/haversine.py +96 -0
maxframe/learn/metrics/pairwise/manhattan.py +80 -0
maxframe/learn/metrics/pairwise/pairwise.py +127 -0
maxframe/learn/metrics/pairwise/pairwise_distances_topk.py +121 -0
maxframe/learn/metrics/pairwise/rbf_kernel.py +51 -0
maxframe/learn/metrics/tests/__init__.py +13 -0
maxframe/learn/metrics/tests/test_scorer.py +26 -0
maxframe/learn/preprocessing/_data/min_max_scaler.py +34 -23
maxframe/learn/preprocessing/_data/standard_scaler.py +34 -25
maxframe/learn/utils/__init__.py +2 -1
maxframe/learn/utils/checks.py +1 -2
maxframe/learn/utils/core.py +59 -0
maxframe/learn/utils/extmath.py +79 -9
maxframe/learn/utils/odpsio.py +262 -0
maxframe/learn/utils/validation.py +2 -2
maxframe/lib/compat.py +40 -0
maxframe/lib/dtypes_extension/__init__.py +16 -1
maxframe/lib/dtypes_extension/_fake_arrow_dtype.py +604 -0
maxframe/lib/dtypes_extension/blob.py +304 -0
maxframe/lib/dtypes_extension/dtypes.py +40 -0
maxframe/lib/dtypes_extension/tests/test_blob.py +88 -0
maxframe/lib/dtypes_extension/tests/test_dtypes.py +16 -1
maxframe/lib/dtypes_extension/tests/test_fake_arrow_dtype.py +75 -0
maxframe/lib/filesystem/_oss_lib/common.py +124 -50
maxframe/lib/filesystem/_oss_lib/glob.py +1 -1
maxframe/lib/filesystem/_oss_lib/handle.py +21 -25
maxframe/lib/filesystem/base.py +1 -1
maxframe/lib/filesystem/core.py +1 -1
maxframe/lib/filesystem/oss.py +115 -46
maxframe/lib/filesystem/tests/test_oss.py +74 -36
maxframe/lib/mmh3.cp37-win32.pyd +0 -0
maxframe/lib/wrapped_pickle.py +10 -0
maxframe/opcodes.py +41 -15
maxframe/protocol.py +12 -0
maxframe/remote/core.py +4 -0
maxframe/serialization/__init__.py +11 -2
maxframe/serialization/arrow.py +38 -13
maxframe/serialization/blob.py +32 -0
maxframe/serialization/core.cp37-win32.pyd +0 -0
maxframe/serialization/core.pyx +39 -1
maxframe/serialization/exception.py +2 -4
maxframe/serialization/numpy.py +11 -0
maxframe/serialization/pandas.py +46 -9
maxframe/serialization/serializables/core.py +2 -2
maxframe/serialization/tests/test_serial.py +31 -4
maxframe/tensor/__init__.py +38 -8
maxframe/tensor/arithmetic/__init__.py +19 -10
maxframe/tensor/arithmetic/core.py +2 -2
maxframe/tensor/arithmetic/iscomplexobj.py +53 -0
maxframe/tensor/arithmetic/tests/test_arithmetic.py +6 -9
maxframe/tensor/core.py +6 -2
maxframe/tensor/datasource/tests/test_datasource.py +2 -1
maxframe/tensor/extensions/__init__.py +2 -0
maxframe/tensor/extensions/apply_chunk.py +3 -3
maxframe/tensor/extensions/rebalance.py +65 -0
maxframe/tensor/fft/__init__.py +32 -0
maxframe/tensor/fft/core.py +168 -0
maxframe/tensor/fft/fft.py +112 -0
maxframe/tensor/fft/fft2.py +118 -0
maxframe/tensor/fft/fftfreq.py +80 -0
maxframe/tensor/fft/fftn.py +123 -0
maxframe/tensor/fft/fftshift.py +79 -0
maxframe/tensor/fft/hfft.py +112 -0
maxframe/tensor/fft/ifft.py +114 -0
maxframe/tensor/fft/ifft2.py +115 -0
maxframe/tensor/fft/ifftn.py +123 -0
maxframe/tensor/fft/ifftshift.py +73 -0
maxframe/tensor/fft/ihfft.py +93 -0
maxframe/tensor/fft/irfft.py +118 -0
maxframe/tensor/fft/irfft2.py +62 -0
maxframe/tensor/fft/irfftn.py +114 -0
maxframe/tensor/fft/rfft.py +116 -0
maxframe/tensor/fft/rfft2.py +63 -0
maxframe/tensor/fft/rfftfreq.py +87 -0
maxframe/tensor/fft/rfftn.py +113 -0
maxframe/tensor/indexing/fill_diagonal.py +1 -7
maxframe/tensor/linalg/__init__.py +7 -0
maxframe/tensor/linalg/_einsumfunc.py +1025 -0
maxframe/tensor/linalg/cholesky.py +117 -0
maxframe/tensor/linalg/einsum.py +339 -0
maxframe/tensor/linalg/lstsq.py +100 -0
maxframe/tensor/linalg/matrix_norm.py +75 -0
maxframe/tensor/linalg/norm.py +249 -0
maxframe/tensor/linalg/solve.py +72 -0
maxframe/tensor/linalg/solve_triangular.py +2 -2
maxframe/tensor/linalg/vector_norm.py +113 -0
maxframe/tensor/misc/__init__.py +24 -1
maxframe/tensor/misc/argwhere.py +72 -0
maxframe/tensor/misc/array_split.py +46 -0
maxframe/tensor/misc/broadcast_arrays.py +57 -0
maxframe/tensor/misc/copyto.py +130 -0
maxframe/tensor/misc/delete.py +104 -0
maxframe/tensor/misc/dsplit.py +68 -0
maxframe/tensor/misc/ediff1d.py +74 -0
maxframe/tensor/misc/expand_dims.py +85 -0
maxframe/tensor/misc/flip.py +90 -0
maxframe/tensor/misc/fliplr.py +64 -0
maxframe/tensor/misc/flipud.py +68 -0
maxframe/tensor/misc/hsplit.py +85 -0
maxframe/tensor/misc/insert.py +139 -0
maxframe/tensor/misc/moveaxis.py +83 -0
maxframe/tensor/misc/result_type.py +88 -0
maxframe/tensor/misc/roll.py +124 -0
maxframe/tensor/misc/rollaxis.py +77 -0
maxframe/tensor/misc/shape.py +89 -0
maxframe/tensor/misc/split.py +190 -0
maxframe/tensor/misc/tile.py +109 -0
maxframe/tensor/misc/vsplit.py +74 -0
maxframe/tensor/reduction/array_equal.py +2 -1
maxframe/tensor/sort/__init__.py +2 -0
maxframe/tensor/sort/argpartition.py +98 -0
maxframe/tensor/sort/partition.py +228 -0
maxframe/tensor/spatial/__init__.py +15 -0
maxframe/tensor/spatial/distance/__init__.py +17 -0
maxframe/tensor/spatial/distance/cdist.py +421 -0
maxframe/tensor/spatial/distance/pdist.py +398 -0
maxframe/tensor/spatial/distance/squareform.py +153 -0
maxframe/tensor/special/__init__.py +159 -21
maxframe/tensor/special/airy.py +55 -0
maxframe/tensor/special/bessel.py +199 -0
maxframe/tensor/special/core.py +65 -4
maxframe/tensor/special/ellip_func_integrals.py +155 -0
maxframe/tensor/special/ellip_harm.py +55 -0
maxframe/tensor/special/err_fresnel.py +223 -0
maxframe/tensor/special/gamma_funcs.py +303 -0
maxframe/tensor/special/hypergeometric_funcs.py +69 -0
maxframe/tensor/special/info_theory.py +189 -0
maxframe/tensor/special/misc.py +21 -0
maxframe/tensor/statistics/__init__.py +6 -0
maxframe/tensor/statistics/corrcoef.py +77 -0
maxframe/tensor/statistics/cov.py +222 -0
maxframe/tensor/statistics/digitize.py +126 -0
maxframe/tensor/statistics/histogram.py +520 -0
maxframe/tensor/statistics/median.py +85 -0
maxframe/tensor/statistics/ptp.py +89 -0
maxframe/tensor/utils.py +3 -3
maxframe/tests/test_udf.py +61 -0
maxframe/tests/test_utils.py +51 -6
maxframe/tests/utils.py +0 -2
maxframe/typing_.py +2 -0
maxframe/udf.py +130 -9
maxframe/utils.py +254 -27
{maxframe-2.0.0b2.dist-info → maxframe-2.3.0rc1.dist-info}/METADATA +3 -3
{maxframe-2.0.0b2.dist-info → maxframe-2.3.0rc1.dist-info}/RECORD +442 -264
maxframe_client/fetcher.py +35 -4
maxframe_client/session/odps.py +7 -2
maxframe_client/session/task.py +8 -1
maxframe_client/tests/test_fetcher.py +76 -3
maxframe_client/tests/test_session.py +28 -1
maxframe/dataframe/arrays.py +0 -864
/maxframe/dataframe/{misc → reshape}/melt.py +0 -0
/maxframe/dataframe/{misc → reshape}/stack.py +0 -0
{maxframe-2.0.0b2.dist-info → maxframe-2.3.0rc1.dist-info}/WHEEL +0 -0
{maxframe-2.0.0b2.dist-info → maxframe-2.3.0rc1.dist-info}/top_level.txt +0 -0

maxframe/dataframe/extensions/tests/test_map_reduce.py ADDED Viewed

@@ -0,0 +1,135 @@
+# Copyright 1999-2025 Alibaba Group Holding Ltd.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#      http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import functools
+from collections import defaultdict
+import pandas as pd
+import pytest
+from .... import dataframe as md
+from ...groupby.apply_chunk import GroupByApplyChunk
+from .. import DataFrameApplyChunk
+@pytest.fixture
+def df1():
+    return md.DataFrame(
+        {
+            "name": ["name key", "name", "key", "name", "key name"],
+            "id": [4, 2, 4, 3, 3],
+            "fid": [5.3, 3.5, 4.2, 2.2, 4.1],
+        }
+    )
+def test_map_reduce_with_map_only(df1):
+    func = functools.partial(lambda x: x)
+    with pytest.raises(ValueError):
+        df1.mf.map_reduce(func, reducer_dtypes={"col": "string"})
+    mapped = df1.mf.map_reduce(func)
+    assert isinstance(mapped.op, DataFrameApplyChunk)
+    assert mapped.op.func is func
+    map_combined = df1.mf.map_reduce(
+        func, combiner=func, mapper_dtypes=df1.dtypes, mapper_index=df1.index
+    )
+    assert isinstance(map_combined.op, DataFrameApplyChunk)
+    assert map_combined.op.func.__name__ == "CombinedMapper"
+def test_mapper_with_combiner(df1):
+    class BaseFunc:
+        def __init__(self):
+            self._word_to_count = defaultdict(lambda: 0)
+        def _collect_df(self):
+            word_to_count = self._word_to_count.copy()
+            self._word_to_count.clear()
+            return pd.DataFrame(
+                [list(tp) for tp in word_to_count.items()],
+                columns=["word", "count"],
+            )
+        def close(self):
+            print(f"Close {type(self)}")
+    class MapperCls(BaseFunc):
+        def __call__(self, batch, end=False):
+            for words in batch["name"]:
+                for w in words.split():
+                    self._word_to_count[w] += 1
+            if end:
+                return self._collect_df()
+    class CombinerCls(BaseFunc):
+        def __call__(self, batch, end=False):
+            for _, row in batch.iterrows():
+                self._word_to_count[row["word"]] = row["count"]
+            if end:
+                return self._collect_df()
+    map_combined = df1.mf.map_reduce(
+        MapperCls,
+        combiner=CombinerCls,
+        group_cols="word",
+        mapper_dtypes={"word": "str", "count": "int"},
+        mapper_index=df1.index,
+    )
+    raw = df1.op.data
+    combiner = map_combined.op.func()
+    ret1 = combiner(raw.iloc[:3], end=True)
+    ret2 = combiner(raw.iloc[3:], end=True)
+    close_ret = combiner.close()
+    expected1 = pd.DataFrame([["key", 2], ["name", 2]], columns=["word", "count"])
+    expected2 = pd.DataFrame([["key", 1], ["name", 2]], columns=["word", "count"])
+    assert close_ret is None
+    pd.testing.assert_frame_equal(ret1.reset_index(drop=True), expected1)
+    pd.testing.assert_frame_equal(ret2.reset_index(drop=True), expected2)
+def test_map_reduce_with_reduce_only(df1):
+    func = functools.partial(lambda x: x)
+    with pytest.raises(ValueError):
+        df1.mf.map_reduce(reducer=func, mapper_dtypes={"col": "string"})
+    reduced = df1.mf.map_reduce(reducer=func, group_cols="name")
+    assert isinstance(reduced.op, GroupByApplyChunk)
+    assert reduced.op.func is func
+    assert reduced.op.groupby_params["by"] == ["name"]
+def test_map_reduce_with_both_funcs(df1):
+    map_func = functools.partial(lambda x: x)
+    class ReducerCls:
+        def __call__(self, batch):
+            return batch
+    reduced = df1.mf.map_reduce(
+        mapper=map_func,
+        reducer=ReducerCls,
+        group_cols="name",
+        reducer_dtypes=df1.dtypes,
+        reducer_index=df1.index,
+    )
+    assert isinstance(reduced.op, GroupByApplyChunk)
+    assert reduced.op.func is ReducerCls
+    assert reduced.op.groupby_params["by"] == ["name"]
+    assert isinstance(reduced.inputs[0].op, DataFrameApplyChunk)
+    assert reduced.inputs[0].op.func is map_func

maxframe/dataframe/groupby/__init__.py CHANGED Viewed

@@ -14,7 +14,9 @@
 # noinspection PyUnresolvedReferences
 from ..core import DataFrameGroupBy, GroupBy, SeriesGroupBy
-from .core import NamedAgg
+from .core import _make_named_agg_compat
+from .expanding import ExpandingGroupby
+from .rolling import RollingGroupby
 def _install():
@@ -24,12 +26,15 @@ def _install():
     from .apply import groupby_apply
     from .apply_chunk import df_groupby_apply_chunk
     from .core import groupby
-    from .cum import cumcount, cummax, cummin, cumprod, cumsum
+    from .expanding import cumcount, cummax, cummin, cumprod, cumsum, expanding
     from .extensions import DataFrameGroupByMaxFrameAccessor
     from .fill import bfill, ffill, fillna
     from .getitem import df_groupby_getitem
     from .head import head
+    from .rank import rank
+    from .rolling import rolling
     from .sample import groupby_sample
+    from .shift import shift
     from .transform import groupby_transform
     for cls in DATAFRAME_TYPE:
@@ -69,6 +74,12 @@ def _install():
         setattr(cls, "cumprod", cumprod)
         setattr(cls, "cumsum", cumsum)
+        setattr(cls, "expanding", expanding)
+        setattr(cls, "rolling", rolling)
+        setattr(cls, "shift", shift)
+        setattr(cls, "rank", rank)
         setattr(cls, "head", head)
         setattr(cls, "sample", groupby_sample)
@@ -88,3 +99,7 @@ def _install():
 _install()
 del _install
+__getattr__ = _make_named_agg_compat
+del _make_named_agg_compat

maxframe/dataframe/groupby/aggregation.py CHANGED Viewed

@@ -20,16 +20,21 @@ import numpy as np
 import pandas as pd
 from ... import opcodes
-from ...core import ENTITY_TYPE, EntityData, OutputType
+from ...config import options
+from ...core import ENTITY_TYPE, EntityData, OutputType, enter_mode
+from ...serialization import PickleContainer
 from ...serialization.serializables import (
     AnyField,
+    BoolField,
     DictField,
+    Int8Field,
     Int32Field,
     Int64Field,
     ListField,
     StringField,
 )
-from ...utils import lazy_import, pd_release_version
+from ...udf import BuiltinFunction
+from ...utils import find_objects, get_pd_option, lazy_import, pd_release_version
 from ..core import GROUPBY_TYPE
 from ..operators import DataFrameOperator, DataFrameOperatorMixin
 from ..reduction.aggregation import (
@@ -46,19 +51,7 @@ logger = logging.getLogger(__name__)
 CV_THRESHOLD = 0.2
 MEAN_RATIO_THRESHOLD = 2 / 3
 _support_get_group_without_as_index = pd_release_version[:2] > (1, 0)
-class SizeRecorder:
-    def __init__(self):
-        self._raw_records = []
-        self._agg_records = []
-    def record(self, raw_record: int, agg_record: int):
-        self._raw_records.append(raw_record)
-        self._agg_records.append(agg_record)
-    def get(self):
-        return self._raw_records, self._agg_records
+_support_multi_index_as_index = pd_release_version[:2] > (2, 0)
 _agg_functions = {
@@ -86,24 +79,28 @@ _series_col_name = "col_name"
 def _patch_groupby_kurt():
     try:
-        from pandas.core.groupby import DataFrameGroupBy, SeriesGroupBy
-        if not hasattr(DataFrameGroupBy, "kurt"):  # pragma: no branch
-            def _kurt_by_frame(a, *args, **kwargs):
-                data = a.to_frame().kurt(*args, **kwargs).iloc[0]
-                if is_cudf(data):  # pragma: no cover
-                    data = data.copy()
-                return data
-            def _group_kurt(x, *args, **kwargs):
-                if kwargs.get("numeric_only") is not None:
-                    return x.agg(functools.partial(_kurt_by_frame, *args, **kwargs))
-                else:
-                    return x.agg(functools.partial(pd.Series.kurt, *args, **kwargs))
-            DataFrameGroupBy.kurt = DataFrameGroupBy.kurtosis = _group_kurt
-            SeriesGroupBy.kurt = SeriesGroupBy.kurtosis = _group_kurt
+        try:
+            from pandas.api.typing import DataFrameGroupBy, SeriesGroupBy
+        except ImportError:
+            from pandas.core.groupby import DataFrameGroupBy, SeriesGroupBy
+        if hasattr(DataFrameGroupBy, "kurt"):  # pragma: no branch
+            return
+        def _kurt_by_frame(a, *args, **kwargs):
+            data = a.to_frame().kurt(*args, **kwargs).iloc[0]
+            if is_cudf(data):  # pragma: no cover
+                data = data.copy()
+            return data
+        def _group_kurt(x, *args, **kwargs):
+            if kwargs.get("numeric_only") is not None:
+                return x.agg(functools.partial(_kurt_by_frame, *args, **kwargs))
+            else:
+                return x.agg(functools.partial(pd.Series.kurt, *args, **kwargs))
+        DataFrameGroupBy.kurt = DataFrameGroupBy.kurtosis = _group_kurt
+        SeriesGroupBy.kurt = SeriesGroupBy.kurtosis = _group_kurt
     except (AttributeError, ImportError):  # pragma: no cover
         pass
@@ -119,7 +116,10 @@ def build_mock_agg_result(
     **raw_func_kw,
 ):
     try:
-        agg_result = groupby.op.build_mock_groupby().aggregate(raw_func, **raw_func_kw)
+        with enter_mode(mock=True):
+            agg_result = groupby.op.build_mock_groupby().aggregate(
+                raw_func, **raw_func_kw
+            )
     except ValueError:
         if (
             groupby_params.get("as_index") or _support_get_group_without_as_index
@@ -137,23 +137,43 @@ def build_mock_agg_result(
 class DataFrameGroupByAgg(DataFrameOperator, DataFrameOperatorMixin):
     _op_type_ = opcodes.GROUPBY_AGG
-    raw_func = AnyField("raw_func")
-    raw_func_kw = DictField("raw_func_kw")
-    func = AnyField("func")
+    raw_func = AnyField("raw_func", default=None)
+    raw_func_kw = DictField("raw_func_kw", default=None)
+    func = AnyField("func", default=None)
     func_rename = ListField("func_rename", default=None)
-    raw_groupby_params = DictField("raw_groupby_params")
-    groupby_params = DictField("groupby_params")
+    raw_groupby_params = DictField("raw_groupby_params", default=None)
+    groupby_params = DictField("groupby_params", default=None)
-    method = StringField("method")
+    method = StringField("method", default=None)
     # for chunk
-    chunk_store_limit = Int64Field("chunk_store_limit")
-    pre_funcs = ListField("pre_funcs")
-    agg_funcs = ListField("agg_funcs")
-    post_funcs = ListField("post_funcs")
-    index_levels = Int32Field("index_levels")
-    size_recorder_name = StringField("size_recorder_name")
+    chunk_store_limit = Int64Field("chunk_store_limit", default=None)
+    pre_funcs = ListField("pre_funcs", default=None)
+    agg_funcs = ListField("agg_funcs", default=None)
+    post_funcs = ListField("post_funcs", default=None)
+    index_levels = Int32Field("index_levels", default=None)
+    size_recorder_name = StringField("size_recorder_name", default=None)
+    combine_size = Int32Field("combine_size", default=None)
+    use_inf_as_na = BoolField("use_inf_as_na", default=None)
+    input_ndim = Int8Field("input_ndim", default=1)
+    append_level = BoolField("append_level", default=False)
+    def has_custom_code(self) -> bool:
+        callable_bys = find_objects(
+            self.groupby_params.get("by"), types=PickleContainer, checker=callable
+        )
+        if callable_bys and any(
+            not isinstance(fun, BuiltinFunction) for fun in callable_bys
+        ):
+            return True
+        return any(
+            fun.custom_reduction
+            and not isinstance(fun.custom_reduction, BuiltinFunction)
+            for fun in self.agg_funcs or ()
+        )
     @classmethod
     def _set_inputs(cls, op: "DataFrameGroupByAgg", inputs: List[EntityData]):
@@ -193,7 +213,9 @@ class DataFrameGroupByAgg(DataFrameOperator, DataFrameOperatorMixin):
     def _fix_as_index(self, result_index: pd.Index):
         # make sure if as_index=False takes effect
-        if isinstance(result_index, pd.MultiIndex):
+        if not _support_multi_index_as_index and isinstance(
+            result_index, pd.MultiIndex
+        ):
             # if MultiIndex, as_index=False definitely takes no effect
             self.groupby_params["as_index"] = True
         elif result_index.name is not None:
@@ -217,12 +239,17 @@ class DataFrameGroupByAgg(DataFrameOperator, DataFrameOperatorMixin):
                 agg_df.index, groupby.key, groupby.index_value.key
             )
+        self.input_ndim = 2
         # make sure if as_index=False takes effect
         self._fix_as_index(agg_df.index)
         # determine num of indices to group in intermediate steps
         self.index_levels = self._get_index_levels(groupby, agg_df.index)
+        # if True, name of agg funcs will be appended as the last level
+        self.append_level = agg_df.dtypes.index.nlevels > input_df.dtypes.index.nlevels
         inputs = self._get_inputs([input_df])
         return self.new_dataframe(
             inputs,
@@ -247,6 +274,8 @@ class DataFrameGroupByAgg(DataFrameOperator, DataFrameOperatorMixin):
         inputs = self._get_inputs([in_series])
+        self.input_ndim = 1
         # determine num of indices to group in intermediate steps
         self.index_levels = self._get_index_levels(groupby, agg_result.index)
@@ -351,9 +380,10 @@ def agg(groupby, func=None, method="auto", *args, **kwargs):
     1   1   2  0.590715
     2   3   4  0.704907
-    To control the output names with different aggregations per column, pandas supports “named aggregation”
+    To control the output names with different aggregations per column,
+    MaxFrame supports “named aggregation”
-    >>> from maxframe.dataframe.groupby import NamedAgg
+    >>> from maxframe.dataframe import NamedAgg
     >>> df.groupby("A").agg(
     ...  b_min=NamedAgg(column="B", aggfunc="min"),
     ...  c_sum=NamedAgg(column="C", aggfunc="sum")).execute()
@@ -376,6 +406,10 @@ def agg(groupby, func=None, method="auto", *args, **kwargs):
             f"Method {method} is not available, please specify 'tree' or 'shuffle"
         )
+    combine_size = (
+        kwargs.pop("combine_size", None) or options.dpe.reduction.combine_size
+    )
     if not is_funcs_aggregate(func, ndim=groupby.ndim):
         # pass index to transform, otherwise it will lose name info for index
         agg_result = build_mock_agg_result(
@@ -400,5 +434,8 @@ def agg(groupby, func=None, method="auto", *args, **kwargs):
         method=method,
         raw_groupby_params=groupby.op.groupby_params,
         groupby_params=groupby.op.groupby_params,
+        combine_size=combine_size,
+        chunk_store_limit=options.chunk_store_limit,
+        use_inf_as_na=get_pd_option("mode.use_inf_as_na", False),
     )
     return agg_op(groupby)

maxframe/dataframe/groupby/apply.py CHANGED Viewed

@@ -60,7 +60,7 @@ class GroupByApply(
     maybe_agg = BoolField("maybe_agg", default=None)
     logic_key = StringField("logic_key", default=None)
-    func_key = AnyField("func_key", default=None)
+    func_ref = AnyField("func_ref", default=None)
     need_clean_up_func = BoolField("need_clean_up_func", default=False)
     def __init__(self, output_types=None, **kw):

maxframe/dataframe/groupby/apply_chunk.py CHANGED Viewed

@@ -22,15 +22,18 @@ from ...core import OutputType
 from ...lib.version import parse as parse_version
 from ...serialization.serializables import (
     DictField,
+    FieldTypes,
     FunctionField,
     Int32Field,
+    ListField,
     TupleField,
 )
 from ...udf import BuiltinFunction, MarkedFunction
-from ...utils import copy_if_possible
+from ...utils import copy_if_possible, make_dtype, make_dtypes
 from ..core import (
     DATAFRAME_GROUPBY_TYPE,
     GROUPBY_TYPE,
+    INDEX_TYPE,
     DataFrameGroupBy,
     IndexValue,
     SeriesGroupBy,
@@ -42,8 +45,6 @@ from ..utils import (
     copy_func_scheduling_hints,
     infer_dataframe_return_value,
     make_column_list,
-    make_dtype,
-    make_dtypes,
     parse_index,
     validate_output_types,
 )
@@ -61,6 +62,8 @@ class GroupByApplyChunk(DataFrameOperatorMixin, DataFrameOperator):
     kwargs = DictField("kwargs", default=None)
     groupby_params = DictField("groupby_params", default=None)
+    order_cols = ListField("order_cols", default=None)
+    ascending = ListField("ascending", FieldTypes.bool, default_factory=lambda: [True])
     def __init__(self, output_type=None, **kw):
         if output_type:
@@ -240,14 +243,14 @@ class GroupByApplyChunk(DataFrameOperatorMixin, DataFrameOperator):
         if self.output_types:
             inferred_meta.output_type = self.output_types[0]
         inferred_meta.dtypes = dtypes if dtypes is not None else inferred_meta.dtypes
+        if isinstance(index, INDEX_TYPE):
+            index = index.index_value
         if index is not None:
             inferred_meta.index_value = (
                 parse_index(index)
                 if index is not input_groupby.index_value
                 else input_groupby.index_value
             )
-        else:
-            inferred_meta.index_value = inferred_meta.index_value
         inferred_meta.elementwise = elementwise or inferred_meta.elementwise
         return inferred_meta
@@ -272,6 +275,8 @@ def df_groupby_apply_chunk(
     output_type=None,
     index=None,
     skip_infer=False,
+    order_cols=None,
+    ascending=True,
     args=(),
     **kwargs,
 ):
@@ -373,6 +378,13 @@ def df_groupby_apply_chunk(
     if skip_infer and output_type is None:
         output_type = OutputType.df_or_series
+    if order_cols and not isinstance(order_cols, list):
+        order_cols = [order_cols]
+    if not isinstance(ascending, list):
+        ascending = [ascending]
+    elif len(order_cols) != len(ascending):
+        raise ValueError("order_cols and ascending must have same length")
     # bind args and kwargs
     op = GroupByApplyChunk(
         func=func,
@@ -380,6 +392,8 @@ def df_groupby_apply_chunk(
         output_type=output_type,
         args=args,
         kwargs=kwargs,
+        order_cols=order_cols,
+        ascending=ascending,
         groupby_params=dataframe_groupby.op.groupby_params,
     )

maxframe/dataframe/groupby/core.py CHANGED Viewed

@@ -12,30 +12,37 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
-from collections import namedtuple
-from typing import List
+import os
+import warnings
+from typing import Any, Dict, List
 import pandas as pd
 from ... import opcodes
 from ...core import ENTITY_TYPE, Entity, EntityData, OutputType
 from ...core.operator import MapReduceOperator
-from ...serialization.serializables import AnyField, BoolField, Int32Field
-from ...utils import lazy_import, no_default
-from ..core import SERIES_TYPE
+from ...env import MAXFRAME_INSIDE_TASK
+from ...serialization import PickleContainer
+from ...serialization.serializables import AnyField, BoolField, DictField, Int32Field
+from ...udf import BuiltinFunction
+from ...utils import find_objects, lazy_import, no_default
+from ..core import GROUPBY_TYPE, SERIES_TYPE
 from ..initializer import Series as asseries
-from ..operators import DataFrameOperatorMixin
-from ..utils import build_df, build_series, parse_index
+from ..operators import DataFrameOperator, DataFrameOperatorMixin
+from ..utils import (
+    build_df,
+    build_series,
+    call_groupby_with_params,
+    make_column_list,
+    parse_index,
+)
 cudf = lazy_import("cudf")
-NamedAgg = namedtuple("NamedAgg", ["column", "aggfunc"])
 class DataFrameGroupByOp(MapReduceOperator, DataFrameOperatorMixin):
     _op_type_ = opcodes.GROUPBY
-    _legacy_name = "DataFrameGroupByOperator"
+    _legacy_name = "DataFrameGroupByOperator"  # since v2.0.0
     by = AnyField(
         "by",
@@ -61,6 +68,12 @@ class DataFrameGroupByOp(MapReduceOperator, DataFrameOperatorMixin):
                 output_types = [OutputType.series_groupby]
             self.output_types = output_types
+    def has_custom_code(self) -> bool:
+        callable_bys = find_objects(self.by, types=PickleContainer, checker=callable)
+        if not callable_bys:
+            return False
+        return any(not isinstance(fun, BuiltinFunction) for fun in callable_bys)
     @property
     def is_dataframe_obj(self):
         return self.output_types[0] in (
@@ -93,8 +106,8 @@ class DataFrameGroupByOp(MapReduceOperator, DataFrameOperatorMixin):
                 ensure_string=True,
             )
-        new_kw = self.groupby_params
-        new_kw.update(kwargs)
+        new_kw = self.groupby_params.copy()
+        new_kw.update({k: v for k, v in kwargs.items()})
         if isinstance(new_kw["by"], list):
             new_by = []
             for v in new_kw["by"]:
@@ -110,7 +123,7 @@ class DataFrameGroupByOp(MapReduceOperator, DataFrameOperatorMixin):
                 else:
                     new_by.append(v)
             new_kw["by"] = new_by
-        return mock_obj.groupby(**new_kw)
+        return call_groupby_with_params(mock_obj, new_kw)
     @classmethod
     def _set_inputs(cls, op: "DataFrameGroupByOp", inputs: List[EntityData]):
@@ -118,8 +131,8 @@ class DataFrameGroupByOp(MapReduceOperator, DataFrameOperatorMixin):
         inputs_iter = iter(op._inputs[1:])
         if len(inputs) > 1:
             by = []
-            for k in op.by:
-                if isinstance(k, SERIES_TYPE):
+            for k in op.by or ():
+                if isinstance(k, ENTITY_TYPE):
                     by.append(next(inputs_iter))
                 else:
                     by.append(k)
@@ -240,3 +253,90 @@ def groupby(df, by=None, level=None, as_index=True, sort=True, group_keys=True):
         output_types=output_types,
     )
     return op(df)
+class BaseGroupByWindowOp(DataFrameOperatorMixin, DataFrameOperator):
+    _op_module_ = "dataframe.groupby"
+    groupby_params = DictField("groupby_params", default=None)
+    window_params = DictField("window_params", default=None)
+    def __init__(self, output_types=None, **kw):
+        super().__init__(_output_types=output_types, **kw)
+    def _calc_mock_result_df(self, mock_groupby):
+        raise NotImplementedError
+    def get_sort_cols_to_asc(self) -> Dict[Any, bool]:
+        order_cols = self.window_params.get("order_cols") or []
+        asc_list = self.window_params.get("ascending") or [True]
+        if len(asc_list) < len(order_cols):
+            asc_list = [asc_list[0]] * len(order_cols)
+        return dict(zip(order_cols, asc_list))
+    def _calc_out_dtypes(self, in_groupby):
+        in_obj = in_groupby
+        groupby_params = in_groupby.op.groupby_params
+        while isinstance(in_obj, GROUPBY_TYPE):
+            in_obj = in_obj.inputs[0]
+        if in_groupby.ndim == 1:
+            selection = None
+        else:
+            by_cols = (
+                make_column_list(groupby_params.get("by"), in_groupby.dtypes) or []
+            )
+            selection = groupby_params.get("selection")
+            if not selection:
+                selection = [c for c in in_obj.dtypes.index if c not in by_cols]
+        mock_groupby = in_groupby.op.build_mock_groupby(
+            group_keys=False, selection=selection
+        )
+        result_df = self._calc_mock_result_df(mock_groupby)
+        if isinstance(result_df, pd.DataFrame):
+            self.output_types = [OutputType.dataframe]
+            return result_df.dtypes
+        else:
+            self.output_types = [OutputType.series]
+            return result_df.name, result_df.dtype
+    def __call__(self, groupby):
+        in_df = groupby
+        while in_df.op.output_types[0] not in (OutputType.dataframe, OutputType.series):
+            in_df = in_df.inputs[0]
+        out_dtypes = self._calc_out_dtypes(groupby)
+        kw = in_df.params.copy()
+        if self.output_types[0] == OutputType.dataframe:
+            kw.update(
+                dict(
+                    columns_value=parse_index(out_dtypes.index, store_data=True),
+                    dtypes=out_dtypes,
+                    shape=(groupby.shape[0], len(out_dtypes)),
+                )
+            )
+        else:
+            name, dtype = out_dtypes
+            kw.update(dtype=dtype, name=name, shape=(groupby.shape[0],))
+        return self.new_tileable([in_df], **kw)
+def _make_named_agg_compat(name):  # pragma: no cover
+    # to make imports compatible
+    from ..reduction import NamedAgg
+    if name == "NamedAgg":
+        if MAXFRAME_INSIDE_TASK not in os.environ:
+            warnings.warn(
+                "Please import NamedAgg from maxframe.dataframe",
+                DeprecationWarning,
+            )
+        return NamedAgg
+    raise AttributeError(f"module {__name__} has no attribute {name}")
+__getattr__ = _make_named_agg_compat

maxframe 2.0.0b2__cp37-cp37m-win32.whl → 2.3.0rc1__cp37-cp37m-win32.whl

Potentially problematic release.

maxframe 2.0.0b2cp37-cp37m-win32.whl → 2.3.0rc1cp37-cp37m-win32.whl