PyPI - maxframe - Versions diffs - 2.0.0b2__cp37-cp37m-win32.whl → 2.3.0rc1__cp37-cp37m-win32.whl - Mend

maxframe 2.0.0b2cp37-cp37m-win32.whl → 2.3.0rc1cp37-cp37m-win32.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of maxframe might be problematic. Click here for more details.

Files changed (443) hide show

maxframe/__init__.py +1 -0
maxframe/_utils.cp37-win32.pyd +0 -0
maxframe/_utils.pyx +14 -1
maxframe/codegen/core.py +9 -8
maxframe/codegen/spe/core.py +1 -1
maxframe/codegen/spe/dataframe/__init__.py +1 -0
maxframe/codegen/spe/dataframe/accessors/base.py +18 -0
maxframe/codegen/spe/dataframe/accessors/dict_.py +25 -130
maxframe/codegen/spe/dataframe/accessors/list_.py +12 -48
maxframe/codegen/spe/dataframe/accessors/struct_.py +28 -0
maxframe/codegen/spe/dataframe/arithmetic.py +7 -2
maxframe/codegen/spe/dataframe/groupby.py +88 -0
maxframe/codegen/spe/dataframe/indexing.py +99 -4
maxframe/codegen/spe/dataframe/merge.py +38 -1
maxframe/codegen/spe/dataframe/misc.py +11 -33
maxframe/codegen/spe/dataframe/reduction.py +32 -9
maxframe/codegen/spe/dataframe/reshape.py +46 -0
maxframe/codegen/spe/dataframe/sort.py +39 -18
maxframe/codegen/spe/dataframe/tests/accessors/test_dict.py +9 -15
maxframe/codegen/spe/dataframe/tests/accessors/test_list.py +4 -7
maxframe/codegen/spe/dataframe/tests/accessors/test_struct.py +75 -0
maxframe/codegen/spe/dataframe/tests/indexing/test_iloc.py +20 -1
maxframe/codegen/spe/dataframe/tests/indexing/test_loc.py +35 -0
maxframe/codegen/spe/dataframe/tests/misc/test_misc.py +0 -32
maxframe/codegen/spe/dataframe/tests/test_groupby.py +81 -18
maxframe/codegen/spe/dataframe/tests/test_merge.py +27 -1
maxframe/codegen/spe/dataframe/tests/test_reduction.py +13 -0
maxframe/codegen/spe/dataframe/tests/test_reshape.py +79 -0
maxframe/codegen/spe/dataframe/tests/test_sort.py +20 -0
maxframe/codegen/spe/dataframe/tseries.py +9 -0
maxframe/codegen/spe/learn/contrib/lightgbm.py +4 -3
maxframe/codegen/spe/learn/contrib/tests/test_xgboost.py +2 -1
maxframe/codegen/spe/learn/metrics/__init__.py +1 -1
maxframe/codegen/spe/learn/metrics/_ranking.py +76 -0
maxframe/codegen/spe/learn/metrics/pairwise.py +51 -0
maxframe/codegen/spe/learn/metrics/tests/test_pairwise.py +36 -0
maxframe/codegen/spe/learn/metrics/tests/test_ranking.py +59 -0
maxframe/codegen/spe/tensor/__init__.py +3 -0
maxframe/codegen/spe/tensor/datasource.py +1 -0
maxframe/codegen/spe/tensor/fft.py +74 -0
maxframe/codegen/spe/tensor/linalg.py +29 -2
maxframe/codegen/spe/tensor/misc.py +79 -25
maxframe/codegen/spe/tensor/spatial.py +45 -0
maxframe/codegen/spe/tensor/statistics.py +44 -0
maxframe/codegen/spe/tensor/tests/test_fft.py +64 -0
maxframe/codegen/spe/tensor/tests/test_linalg.py +15 -1
maxframe/codegen/spe/tensor/tests/test_misc.py +52 -2
maxframe/codegen/spe/tensor/tests/test_spatial.py +33 -0
maxframe/codegen/spe/tensor/tests/test_statistics.py +15 -1
maxframe/codegen/spe/tests/test_spe_codegen.py +6 -12
maxframe/codegen/spe/utils.py +2 -0
maxframe/config/config.py +73 -9
maxframe/config/tests/test_validators.py +13 -1
maxframe/config/validators.py +49 -0
maxframe/conftest.py +54 -17
maxframe/core/accessor.py +2 -2
maxframe/core/base.py +2 -1
maxframe/core/entity/core.py +5 -0
maxframe/core/entity/tileables.py +3 -1
maxframe/core/graph/core.cp37-win32.pyd +0 -0
maxframe/core/graph/entity.py +8 -3
maxframe/core/mode.py +6 -1
maxframe/core/operator/base.py +9 -2
maxframe/core/operator/core.py +10 -2
maxframe/core/operator/utils.py +13 -0
maxframe/dataframe/__init__.py +12 -5
maxframe/dataframe/accessors/__init__.py +1 -1
maxframe/dataframe/accessors/compat.py +45 -0
maxframe/dataframe/accessors/datetime_/__init__.py +4 -1
maxframe/dataframe/accessors/dict_/contains.py +7 -16
maxframe/dataframe/accessors/dict_/core.py +48 -0
maxframe/dataframe/accessors/dict_/getitem.py +17 -21
maxframe/dataframe/accessors/dict_/length.py +7 -16
maxframe/dataframe/accessors/dict_/remove.py +6 -18
maxframe/dataframe/accessors/dict_/setitem.py +8 -18
maxframe/dataframe/accessors/dict_/tests/test_dict_accessor.py +62 -22
maxframe/dataframe/accessors/list_/__init__.py +2 -2
maxframe/dataframe/accessors/list_/core.py +48 -0
maxframe/dataframe/accessors/list_/getitem.py +12 -19
maxframe/dataframe/accessors/list_/length.py +7 -16
maxframe/dataframe/accessors/list_/tests/test_list_accessor.py +11 -9
maxframe/dataframe/accessors/string_/__init__.py +4 -1
maxframe/dataframe/accessors/struct_/__init__.py +37 -0
maxframe/dataframe/accessors/struct_/accessor.py +39 -0
maxframe/dataframe/accessors/struct_/core.py +43 -0
maxframe/dataframe/accessors/struct_/dtypes.py +53 -0
maxframe/dataframe/accessors/struct_/field.py +123 -0
maxframe/dataframe/accessors/struct_/tests/__init__.py +13 -0
maxframe/dataframe/accessors/struct_/tests/test_struct_accessor.py +91 -0
maxframe/dataframe/arithmetic/__init__.py +18 -4
maxframe/dataframe/arithmetic/between.py +106 -0
maxframe/dataframe/arithmetic/dot.py +237 -0
maxframe/dataframe/arithmetic/maximum.py +33 -0
maxframe/dataframe/arithmetic/minimum.py +33 -0
maxframe/dataframe/arithmetic/{around.py → round.py} +11 -7
maxframe/dataframe/core.py +161 -224
maxframe/dataframe/datasource/__init__.py +18 -0
maxframe/dataframe/datasource/core.py +6 -0
maxframe/dataframe/datasource/direct.py +57 -0
maxframe/dataframe/datasource/from_dict.py +124 -0
maxframe/dataframe/datasource/from_index.py +1 -1
maxframe/dataframe/datasource/from_records.py +77 -0
maxframe/dataframe/datasource/from_tensor.py +109 -41
maxframe/dataframe/datasource/read_csv.py +21 -14
maxframe/dataframe/datasource/read_odps_query.py +29 -6
maxframe/dataframe/datasource/read_odps_table.py +32 -10
maxframe/dataframe/datasource/read_parquet.py +38 -39
maxframe/dataframe/datasource/tests/test_datasource.py +37 -0
maxframe/dataframe/datastore/__init__.py +11 -1
maxframe/dataframe/datastore/direct.py +268 -0
maxframe/dataframe/datastore/to_csv.py +29 -41
maxframe/dataframe/datastore/to_odps.py +36 -4
maxframe/dataframe/extensions/__init__.py +20 -4
maxframe/dataframe/extensions/apply_chunk.py +32 -6
maxframe/dataframe/extensions/cartesian_chunk.py +153 -0
maxframe/dataframe/extensions/collect_kv.py +126 -0
maxframe/dataframe/extensions/extract_kv.py +177 -0
maxframe/dataframe/extensions/flatjson.py +2 -1
maxframe/dataframe/extensions/map_reduce.py +263 -0
maxframe/dataframe/extensions/rebalance.py +62 -0
maxframe/dataframe/extensions/tests/test_apply_chunk.py +9 -2
maxframe/dataframe/extensions/tests/test_extensions.py +54 -0
maxframe/dataframe/extensions/tests/test_map_reduce.py +135 -0
maxframe/dataframe/groupby/__init__.py +17 -2
maxframe/dataframe/groupby/aggregation.py +86 -49
maxframe/dataframe/groupby/apply.py +1 -1
maxframe/dataframe/groupby/apply_chunk.py +19 -5
maxframe/dataframe/groupby/core.py +116 -16
maxframe/dataframe/groupby/cum.py +4 -25
maxframe/dataframe/groupby/expanding.py +264 -0
maxframe/dataframe/groupby/fill.py +1 -1
maxframe/dataframe/groupby/getitem.py +12 -5
maxframe/dataframe/groupby/head.py +11 -1
maxframe/dataframe/groupby/rank.py +136 -0
maxframe/dataframe/groupby/rolling.py +206 -0
maxframe/dataframe/groupby/shift.py +114 -0
maxframe/dataframe/groupby/tests/test_groupby.py +0 -5
maxframe/dataframe/indexing/__init__.py +22 -2
maxframe/dataframe/indexing/droplevel.py +195 -0
maxframe/dataframe/indexing/filter.py +169 -0
maxframe/dataframe/indexing/get_level_values.py +76 -0
maxframe/dataframe/indexing/iat.py +45 -0
maxframe/dataframe/indexing/iloc.py +152 -12
maxframe/dataframe/indexing/insert.py +46 -18
maxframe/dataframe/indexing/loc.py +287 -7
maxframe/dataframe/indexing/reindex.py +14 -5
maxframe/dataframe/indexing/rename.py +6 -0
maxframe/dataframe/indexing/rename_axis.py +2 -2
maxframe/dataframe/indexing/reorder_levels.py +143 -0
maxframe/dataframe/indexing/reset_index.py +33 -6
maxframe/dataframe/indexing/sample.py +8 -0
maxframe/dataframe/indexing/setitem.py +3 -3
maxframe/dataframe/indexing/swaplevel.py +185 -0
maxframe/dataframe/indexing/take.py +99 -0
maxframe/dataframe/indexing/truncate.py +140 -0
maxframe/dataframe/indexing/where.py +0 -11
maxframe/dataframe/indexing/xs.py +148 -0
maxframe/dataframe/merge/__init__.py +15 -1
maxframe/dataframe/merge/append.py +97 -98
maxframe/dataframe/merge/combine.py +244 -0
maxframe/dataframe/merge/combine_first.py +120 -0
maxframe/dataframe/merge/compare.py +387 -0
maxframe/dataframe/merge/concat.py +183 -0
maxframe/dataframe/merge/update.py +271 -0
maxframe/dataframe/misc/__init__.py +28 -11
maxframe/dataframe/misc/_duplicate.py +10 -4
maxframe/dataframe/misc/apply.py +1 -1
maxframe/dataframe/misc/check_unique.py +82 -0
maxframe/dataframe/misc/clip.py +145 -0
maxframe/dataframe/misc/describe.py +175 -9
maxframe/dataframe/misc/drop.py +31 -0
maxframe/dataframe/misc/drop_duplicates.py +2 -2
maxframe/dataframe/misc/duplicated.py +2 -2
maxframe/dataframe/misc/get_dummies.py +5 -1
maxframe/dataframe/misc/infer_dtypes.py +251 -0
maxframe/dataframe/misc/isin.py +2 -2
maxframe/dataframe/misc/map.py +125 -18
maxframe/dataframe/misc/repeat.py +159 -0
maxframe/dataframe/misc/tests/test_misc.py +48 -3
maxframe/dataframe/misc/to_numeric.py +3 -0
maxframe/dataframe/misc/transform.py +12 -5
maxframe/dataframe/misc/transpose.py +13 -1
maxframe/dataframe/misc/valid_index.py +115 -0
maxframe/dataframe/misc/value_counts.py +38 -4
maxframe/dataframe/missing/checkna.py +14 -6
maxframe/dataframe/missing/dropna.py +5 -0
maxframe/dataframe/missing/fillna.py +1 -1
maxframe/dataframe/missing/replace.py +7 -4
maxframe/dataframe/reduction/__init__.py +35 -16
maxframe/dataframe/reduction/aggregation.py +43 -14
maxframe/dataframe/reduction/all.py +2 -2
maxframe/dataframe/reduction/any.py +2 -2
maxframe/dataframe/reduction/argmax.py +103 -0
maxframe/dataframe/reduction/argmin.py +103 -0
maxframe/dataframe/reduction/core.py +80 -24
maxframe/dataframe/reduction/count.py +13 -9
maxframe/dataframe/reduction/cov.py +166 -0
maxframe/dataframe/reduction/cummax.py +2 -2
maxframe/dataframe/reduction/cummin.py +2 -2
maxframe/dataframe/reduction/cumprod.py +2 -2
maxframe/dataframe/reduction/cumsum.py +2 -2
maxframe/dataframe/reduction/custom_reduction.py +2 -2
maxframe/dataframe/reduction/idxmax.py +185 -0
maxframe/dataframe/reduction/idxmin.py +185 -0
maxframe/dataframe/reduction/kurtosis.py +37 -30
maxframe/dataframe/reduction/max.py +2 -2
maxframe/dataframe/reduction/mean.py +9 -7
maxframe/dataframe/reduction/median.py +2 -2
maxframe/dataframe/reduction/min.py +2 -2
maxframe/dataframe/reduction/mode.py +144 -0
maxframe/dataframe/reduction/nunique.py +19 -11
maxframe/dataframe/reduction/prod.py +18 -13
maxframe/dataframe/reduction/reduction_size.py +2 -2
maxframe/dataframe/reduction/sem.py +13 -9
maxframe/dataframe/reduction/skew.py +31 -27
maxframe/dataframe/reduction/str_concat.py +10 -7
maxframe/dataframe/reduction/sum.py +18 -14
maxframe/dataframe/reduction/tests/test_reduction.py +12 -0
maxframe/dataframe/reduction/unique.py +20 -3
maxframe/dataframe/reduction/var.py +16 -12
maxframe/dataframe/reshape/__init__.py +38 -0
maxframe/dataframe/{misc → reshape}/pivot.py +1 -0
maxframe/dataframe/{misc → reshape}/pivot_table.py +1 -0
maxframe/dataframe/reshape/unstack.py +114 -0
maxframe/dataframe/sort/__init__.py +16 -1
maxframe/dataframe/sort/argsort.py +68 -0
maxframe/dataframe/sort/core.py +2 -1
maxframe/dataframe/sort/nlargest.py +238 -0
maxframe/dataframe/sort/nsmallest.py +228 -0
maxframe/dataframe/sort/rank.py +147 -0
maxframe/dataframe/statistics/__init__.py +3 -3
maxframe/dataframe/statistics/corr.py +1 -0
maxframe/dataframe/statistics/quantile.py +2 -2
maxframe/dataframe/tests/test_typing.py +104 -0
maxframe/dataframe/tests/test_utils.py +66 -2
maxframe/dataframe/tseries/__init__.py +19 -0
maxframe/dataframe/tseries/at_time.py +61 -0
maxframe/dataframe/tseries/between_time.py +122 -0
maxframe/dataframe/typing_.py +185 -0
maxframe/dataframe/utils.py +125 -52
maxframe/dataframe/window/aggregation.py +8 -4
maxframe/dataframe/window/core.py +14 -1
maxframe/dataframe/window/ewm.py +1 -3
maxframe/dataframe/window/expanding.py +37 -35
maxframe/dataframe/window/rolling.py +49 -39
maxframe/dataframe/window/tests/test_expanding.py +1 -7
maxframe/dataframe/window/tests/test_rolling.py +1 -1
maxframe/env.py +7 -4
maxframe/errors.py +2 -2
maxframe/io/odpsio/schema.py +9 -3
maxframe/io/odpsio/tableio.py +7 -2
maxframe/io/odpsio/tests/test_schema.py +198 -83
maxframe/learn/__init__.py +10 -2
maxframe/learn/cluster/__init__.py +15 -0
maxframe/learn/cluster/_kmeans.py +782 -0
maxframe/learn/contrib/llm/core.py +18 -7
maxframe/learn/contrib/llm/deploy/__init__.py +13 -0
maxframe/learn/contrib/llm/deploy/config.py +221 -0
maxframe/learn/contrib/llm/deploy/core.py +247 -0
maxframe/learn/contrib/llm/deploy/framework.py +35 -0
maxframe/learn/contrib/llm/deploy/loader.py +360 -0
maxframe/learn/contrib/llm/deploy/tests/__init__.py +13 -0
maxframe/learn/contrib/llm/deploy/tests/test_register_models.py +359 -0
maxframe/learn/contrib/llm/models/__init__.py +1 -0
maxframe/learn/contrib/llm/models/dashscope.py +12 -6
maxframe/learn/contrib/llm/models/managed.py +76 -11
maxframe/learn/contrib/llm/models/openai.py +72 -0
maxframe/learn/contrib/llm/tests/__init__.py +13 -0
maxframe/learn/contrib/llm/tests/test_core.py +34 -0
maxframe/learn/contrib/llm/tests/test_openai.py +187 -0
maxframe/learn/contrib/llm/tests/test_text_gen.py +155 -0
maxframe/learn/contrib/llm/text.py +348 -42
maxframe/learn/contrib/models.py +4 -1
maxframe/learn/contrib/xgboost/classifier.py +2 -0
maxframe/learn/contrib/xgboost/core.py +113 -4
maxframe/learn/contrib/xgboost/predict.py +4 -2
maxframe/learn/contrib/xgboost/regressor.py +5 -0
maxframe/learn/contrib/xgboost/train.py +7 -2
maxframe/learn/core.py +66 -0
maxframe/learn/linear_model/_base.py +58 -1
maxframe/learn/linear_model/_lin_reg.py +1 -1
maxframe/learn/metrics/__init__.py +6 -0
maxframe/learn/metrics/_classification.py +145 -0
maxframe/learn/metrics/_ranking.py +477 -0
maxframe/learn/metrics/_scorer.py +60 -0
maxframe/learn/metrics/pairwise/__init__.py +21 -0
maxframe/learn/metrics/pairwise/core.py +77 -0
maxframe/learn/metrics/pairwise/cosine.py +115 -0
maxframe/learn/metrics/pairwise/euclidean.py +176 -0
maxframe/learn/metrics/pairwise/haversine.py +96 -0
maxframe/learn/metrics/pairwise/manhattan.py +80 -0
maxframe/learn/metrics/pairwise/pairwise.py +127 -0
maxframe/learn/metrics/pairwise/pairwise_distances_topk.py +121 -0
maxframe/learn/metrics/pairwise/rbf_kernel.py +51 -0
maxframe/learn/metrics/tests/__init__.py +13 -0
maxframe/learn/metrics/tests/test_scorer.py +26 -0
maxframe/learn/preprocessing/_data/min_max_scaler.py +34 -23
maxframe/learn/preprocessing/_data/standard_scaler.py +34 -25
maxframe/learn/utils/__init__.py +2 -1
maxframe/learn/utils/checks.py +1 -2
maxframe/learn/utils/core.py +59 -0
maxframe/learn/utils/extmath.py +79 -9
maxframe/learn/utils/odpsio.py +262 -0
maxframe/learn/utils/validation.py +2 -2
maxframe/lib/compat.py +40 -0
maxframe/lib/dtypes_extension/__init__.py +16 -1
maxframe/lib/dtypes_extension/_fake_arrow_dtype.py +604 -0
maxframe/lib/dtypes_extension/blob.py +304 -0
maxframe/lib/dtypes_extension/dtypes.py +40 -0
maxframe/lib/dtypes_extension/tests/test_blob.py +88 -0
maxframe/lib/dtypes_extension/tests/test_dtypes.py +16 -1
maxframe/lib/dtypes_extension/tests/test_fake_arrow_dtype.py +75 -0
maxframe/lib/filesystem/_oss_lib/common.py +124 -50
maxframe/lib/filesystem/_oss_lib/glob.py +1 -1
maxframe/lib/filesystem/_oss_lib/handle.py +21 -25
maxframe/lib/filesystem/base.py +1 -1
maxframe/lib/filesystem/core.py +1 -1
maxframe/lib/filesystem/oss.py +115 -46
maxframe/lib/filesystem/tests/test_oss.py +74 -36
maxframe/lib/mmh3.cp37-win32.pyd +0 -0
maxframe/lib/wrapped_pickle.py +10 -0
maxframe/opcodes.py +41 -15
maxframe/protocol.py +12 -0
maxframe/remote/core.py +4 -0
maxframe/serialization/__init__.py +11 -2
maxframe/serialization/arrow.py +38 -13
maxframe/serialization/blob.py +32 -0
maxframe/serialization/core.cp37-win32.pyd +0 -0
maxframe/serialization/core.pyx +39 -1
maxframe/serialization/exception.py +2 -4
maxframe/serialization/numpy.py +11 -0
maxframe/serialization/pandas.py +46 -9
maxframe/serialization/serializables/core.py +2 -2
maxframe/serialization/tests/test_serial.py +31 -4
maxframe/tensor/__init__.py +38 -8
maxframe/tensor/arithmetic/__init__.py +19 -10
maxframe/tensor/arithmetic/core.py +2 -2
maxframe/tensor/arithmetic/iscomplexobj.py +53 -0
maxframe/tensor/arithmetic/tests/test_arithmetic.py +6 -9
maxframe/tensor/core.py +6 -2
maxframe/tensor/datasource/tests/test_datasource.py +2 -1
maxframe/tensor/extensions/__init__.py +2 -0
maxframe/tensor/extensions/apply_chunk.py +3 -3
maxframe/tensor/extensions/rebalance.py +65 -0
maxframe/tensor/fft/__init__.py +32 -0
maxframe/tensor/fft/core.py +168 -0
maxframe/tensor/fft/fft.py +112 -0
maxframe/tensor/fft/fft2.py +118 -0
maxframe/tensor/fft/fftfreq.py +80 -0
maxframe/tensor/fft/fftn.py +123 -0
maxframe/tensor/fft/fftshift.py +79 -0
maxframe/tensor/fft/hfft.py +112 -0
maxframe/tensor/fft/ifft.py +114 -0
maxframe/tensor/fft/ifft2.py +115 -0
maxframe/tensor/fft/ifftn.py +123 -0
maxframe/tensor/fft/ifftshift.py +73 -0
maxframe/tensor/fft/ihfft.py +93 -0
maxframe/tensor/fft/irfft.py +118 -0
maxframe/tensor/fft/irfft2.py +62 -0
maxframe/tensor/fft/irfftn.py +114 -0
maxframe/tensor/fft/rfft.py +116 -0
maxframe/tensor/fft/rfft2.py +63 -0
maxframe/tensor/fft/rfftfreq.py +87 -0
maxframe/tensor/fft/rfftn.py +113 -0
maxframe/tensor/indexing/fill_diagonal.py +1 -7
maxframe/tensor/linalg/__init__.py +7 -0
maxframe/tensor/linalg/_einsumfunc.py +1025 -0
maxframe/tensor/linalg/cholesky.py +117 -0
maxframe/tensor/linalg/einsum.py +339 -0
maxframe/tensor/linalg/lstsq.py +100 -0
maxframe/tensor/linalg/matrix_norm.py +75 -0
maxframe/tensor/linalg/norm.py +249 -0
maxframe/tensor/linalg/solve.py +72 -0
maxframe/tensor/linalg/solve_triangular.py +2 -2
maxframe/tensor/linalg/vector_norm.py +113 -0
maxframe/tensor/misc/__init__.py +24 -1
maxframe/tensor/misc/argwhere.py +72 -0
maxframe/tensor/misc/array_split.py +46 -0
maxframe/tensor/misc/broadcast_arrays.py +57 -0
maxframe/tensor/misc/copyto.py +130 -0
maxframe/tensor/misc/delete.py +104 -0
maxframe/tensor/misc/dsplit.py +68 -0
maxframe/tensor/misc/ediff1d.py +74 -0
maxframe/tensor/misc/expand_dims.py +85 -0
maxframe/tensor/misc/flip.py +90 -0
maxframe/tensor/misc/fliplr.py +64 -0
maxframe/tensor/misc/flipud.py +68 -0
maxframe/tensor/misc/hsplit.py +85 -0
maxframe/tensor/misc/insert.py +139 -0
maxframe/tensor/misc/moveaxis.py +83 -0
maxframe/tensor/misc/result_type.py +88 -0
maxframe/tensor/misc/roll.py +124 -0
maxframe/tensor/misc/rollaxis.py +77 -0
maxframe/tensor/misc/shape.py +89 -0
maxframe/tensor/misc/split.py +190 -0
maxframe/tensor/misc/tile.py +109 -0
maxframe/tensor/misc/vsplit.py +74 -0
maxframe/tensor/reduction/array_equal.py +2 -1
maxframe/tensor/sort/__init__.py +2 -0
maxframe/tensor/sort/argpartition.py +98 -0
maxframe/tensor/sort/partition.py +228 -0
maxframe/tensor/spatial/__init__.py +15 -0
maxframe/tensor/spatial/distance/__init__.py +17 -0
maxframe/tensor/spatial/distance/cdist.py +421 -0
maxframe/tensor/spatial/distance/pdist.py +398 -0
maxframe/tensor/spatial/distance/squareform.py +153 -0
maxframe/tensor/special/__init__.py +159 -21
maxframe/tensor/special/airy.py +55 -0
maxframe/tensor/special/bessel.py +199 -0
maxframe/tensor/special/core.py +65 -4
maxframe/tensor/special/ellip_func_integrals.py +155 -0
maxframe/tensor/special/ellip_harm.py +55 -0
maxframe/tensor/special/err_fresnel.py +223 -0
maxframe/tensor/special/gamma_funcs.py +303 -0
maxframe/tensor/special/hypergeometric_funcs.py +69 -0
maxframe/tensor/special/info_theory.py +189 -0
maxframe/tensor/special/misc.py +21 -0
maxframe/tensor/statistics/__init__.py +6 -0
maxframe/tensor/statistics/corrcoef.py +77 -0
maxframe/tensor/statistics/cov.py +222 -0
maxframe/tensor/statistics/digitize.py +126 -0
maxframe/tensor/statistics/histogram.py +520 -0
maxframe/tensor/statistics/median.py +85 -0
maxframe/tensor/statistics/ptp.py +89 -0
maxframe/tensor/utils.py +3 -3
maxframe/tests/test_udf.py +61 -0
maxframe/tests/test_utils.py +51 -6
maxframe/tests/utils.py +0 -2
maxframe/typing_.py +2 -0
maxframe/udf.py +130 -9
maxframe/utils.py +254 -27
{maxframe-2.0.0b2.dist-info → maxframe-2.3.0rc1.dist-info}/METADATA +3 -3
{maxframe-2.0.0b2.dist-info → maxframe-2.3.0rc1.dist-info}/RECORD +442 -264
maxframe_client/fetcher.py +35 -4
maxframe_client/session/odps.py +7 -2
maxframe_client/session/task.py +8 -1
maxframe_client/tests/test_fetcher.py +76 -3
maxframe_client/tests/test_session.py +28 -1
maxframe/dataframe/arrays.py +0 -864
/maxframe/dataframe/{misc → reshape}/melt.py +0 -0
/maxframe/dataframe/{misc → reshape}/stack.py +0 -0
{maxframe-2.0.0b2.dist-info → maxframe-2.3.0rc1.dist-info}/WHEEL +0 -0
{maxframe-2.0.0b2.dist-info → maxframe-2.3.0rc1.dist-info}/top_level.txt +0 -0

maxframe/dataframe/indexing/loc.py CHANGED Viewed

@@ -28,20 +28,25 @@ from ...tensor.utils import calc_sliced_size, filter_inputs
 from ...utils import is_full_slice, lazy_import, pd_release_version
 from ..core import DATAFRAME_TYPE, IndexValue
 from ..operators import DataFrameOperator, DataFrameOperatorMixin
-from ..utils import parse_index
+from ..utils import parse_index, validate_axis
 from .iloc import DataFrameIlocSetItem
 cudf = lazy_import("cudf")
 with_slice_locs_kind = pd_release_version < (1, 4, 0)
-def process_loc_indexes(inp, indexes, fetch_index: bool = True):
+def process_loc_indexes(inp, indexes, fetch_index: bool = True, axis=None):
     ndim = inp.ndim
     if not isinstance(indexes, tuple):
         indexes = (indexes,)
+    if axis is not None and inp.axes[axis].nlevels > 1:
+        indexes = (indexes,)
     if len(indexes) < ndim:
-        indexes += (slice(None),) * (ndim - len(indexes))
+        if axis == 0 or axis is None:
+            indexes += (slice(None),) * (ndim - len(indexes))
+        else:
+            indexes = (slice(None),) * (ndim - len(indexes)) + indexes
     if len(indexes) > ndim:
         raise IndexingError("Too many indexers")
@@ -67,8 +72,9 @@ def process_loc_indexes(inp, indexes, fetch_index: bool = True):
 class DataFrameLoc:
-    def __init__(self, obj):
+    def __init__(self, obj, axis=None):
         self._obj = obj
+        self._axis = axis
     def _use_iloc(self, indexes):
         # for RangeIndex from 0, use iloc instead of loc
@@ -105,7 +111,7 @@ class DataFrameLoc:
         return True, None
     def __getitem__(self, indexes):
-        indexes = process_loc_indexes(self._obj, indexes)
+        indexes = process_loc_indexes(self._obj, indexes, axis=self._axis)
         use_iloc, new_indexes = self._use_iloc(indexes)
         if use_iloc:
@@ -120,7 +126,9 @@ class DataFrameLoc:
             raise NotImplementedError("Only scalar value is supported to set by loc")
         if not isinstance(self._obj, DATAFRAME_TYPE):
             raise NotImplementedError("Only DataFrame is supported to set by loc")
-        indexes = process_loc_indexes(self._obj, indexes, fetch_index=False)
+        indexes = process_loc_indexes(
+            self._obj, indexes, fetch_index=False, axis=self._axis
+        )
         use_iloc, new_indexes = self._use_iloc(indexes)
         if use_iloc:
             op = DataFrameIlocSetItem(indexes=new_indexes, value=value)
@@ -137,9 +145,13 @@ class DataFrameLoc:
             ret = op([self._obj] + indices_tileable)
             self._obj.data = ret.data
+    def __call__(self, axis):
+        axis = validate_axis(axis, self._obj)
+        return DataFrameLoc(self._obj, axis)
 class DataFrameLocSetItem(DataFrameOperator, DataFrameOperatorMixin):
-    _op_type_ = opcodes.DATAFRAME_ILOC_SETITEM
+    _op_type_ = opcodes.DATAFRAME_LOC_SETITEM
     indexes = ListField("indexes", default=None)
     value = AnyField("value", default=None)
@@ -336,6 +348,17 @@ class DataFrameLocGetItem(DataFrameOperator, DataFrameOperatorMixin):
                 else:
                     # append None to indicate returning Series
                     param["shape"] = None
+            elif isinstance(index, tuple):
+                has_ranges = any(
+                    isinstance(i, (slice, np.ndarray))
+                    or (hasattr(i, "dtype") and index.ndim == 1)
+                    for i in index
+                )
+                if has_ranges:
+                    param["shape"] = np.nan
+                    param["index_value"] = parse_index(pd_index, inp, index)
+                else:
+                    param["shape"] = None
             else:
                 param["shape"] = None
             return param
@@ -411,4 +434,261 @@ class DataFrameLocGetItem(DataFrameOperator, DataFrameOperatorMixin):
 def loc(a):
+    """
+    Access a group of rows and columns by label(s) or a boolean array.
+    ``.loc[]`` is primarily label based, but may also be used with a
+    boolean array.
+    Allowed inputs are:
+    - A single label, e.g. ``5`` or ``'a'``, (note that ``5`` is
+      interpreted as a *label* of the index, and **never** as an
+      integer position along the index).
+    - A list or array of labels, e.g. ``['a', 'b', 'c']``.
+    - A slice object with labels, e.g. ``'a':'f'``.
+      .. warning:: Note that contrary to usual python slices, **both** the
+          start and the stop are included
+    - A boolean array of the same length as the axis being sliced,
+      e.g. ``[True, False, True]``.
+    - An alignable boolean Series. The index of the key will be aligned before
+      masking.
+    - An alignable Index. The Index of the returned selection will be the input.
+    - A ``callable`` function with one argument (the calling Series or
+      DataFrame) and that returns valid output for indexing (one of the above)
+    See more at :ref:`Selection by Label <indexing.label>`.
+    Raises
+    ------
+    KeyError
+        If any items are not found.
+    IndexingError
+        If an indexed key is passed and its index is unalignable to the frame index.
+    See Also
+    --------
+    DataFrame.at : Access a single value for a row/column label pair.
+    DataFrame.iloc : Access group of rows and columns by integer position(s).
+    DataFrame.xs : Returns a cross-section (row(s) or column(s)) from the
+        Series/DataFrame.
+    Series.loc : Access group of values using labels.
+    Examples
+    --------
+    **Getting values**
+    >>> import maxframe.dataframe as md
+    >>> df = md.DataFrame([[1, 2], [4, 5], [7, 8]],
+    ...      index=['cobra', 'viper', 'sidewinder'],
+    ...      columns=['max_speed', 'shield'])
+    >>> df.execute()
+                max_speed  shield
+    cobra               1       2
+    viper               4       5
+    sidewinder          7       8
+    Single label. Note this returns the row as a Series.
+    >>> df.loc['viper'].execute()
+    max_speed    4
+    shield       5
+    Name: viper, dtype: int64
+    List of labels. Note using ``[[]]`` returns a DataFrame.
+    >>> df.loc[['viper', 'sidewinder']].execute()
+                max_speed  shield
+    viper               4       5
+    sidewinder          7       8
+    Single label for row and column
+    >>> df.loc['cobra', 'shield'].execute()
+    2
+    Slice with labels for row and single label for column. As mentioned
+    above, note that both the start and stop of the slice are included.
+    >>> df.loc['cobra':'viper', 'max_speed'].execute()
+    cobra    1
+    viper    4
+    Name: max_speed, dtype: int64
+    Boolean list with the same length as the row axis
+    >>> df.loc[[False, False, True]].execute()
+                max_speed  shield
+    sidewinder          7       8
+    Alignable boolean Series:
+    >>> df.loc[md.Series([False, True, False],
+    ...        index=['viper', 'sidewinder', 'cobra'])].execute()
+                max_speed  shield
+    sidewinder          7       8
+    Index (same behavior as ``df.reindex``)
+    >>> df.loc[md.Index(["cobra", "viper"], name="foo")].execute()
+           max_speed  shield
+    foo
+    cobra          1       2
+    viper          4       5
+    Conditional that returns a boolean Series
+    >>> df.loc[df['shield'] > 6].execute()
+                max_speed  shield
+    sidewinder          7       8
+    Conditional that returns a boolean Series with column labels specified
+    >>> df.loc[df['shield'] > 6, ['max_speed']].execute()
+                max_speed
+    sidewinder          7
+    Callable that returns a boolean Series
+    >>> df.loc[lambda df: df['shield'] == 8].execute()
+                max_speed  shield
+    sidewinder          7       8
+    **Setting values**
+    Set value for all items matching the list of labels
+    >>> df.loc[['viper', 'sidewinder'], ['shield']] = 50
+    >>> df.execute()
+                max_speed  shield
+    cobra               1       2
+    viper               4      50
+    sidewinder          7      50
+    Set value for an entire row
+    >>> df.loc['cobra'] = 10
+    >>> df.execute()
+                max_speed  shield
+    cobra              10      10
+    viper               4      50
+    sidewinder          7      50
+    Set value for an entire column
+    >>> df.loc[:, 'max_speed'] = 30
+    >>> df.execute()
+                max_speed  shield
+    cobra              30      10
+    viper              30      50
+    sidewinder         30      50
+    Set value for rows matching callable condition
+    >>> df.loc[df['shield'] > 35] = 0
+    >>> df.execute()
+                max_speed  shield
+    cobra              30      10
+    viper               0       0
+    sidewinder          0       0
+    **Getting values on a DataFrame with an index that has integer labels**
+    Another example using integers for the index
+    >>> df = md.DataFrame([[1, 2], [4, 5], [7, 8]],
+    ...      index=[7, 8, 9], columns=['max_speed', 'shield'])
+    >>> df.execute()
+       max_speed  shield
+    7          1       2
+    8          4       5
+    9          7       8
+    Slice with integer labels for rows. As mentioned above, note that both
+    the start and stop of the slice are included.
+    >>> df.loc[7:9].execute()
+       max_speed  shield
+    7          1       2
+    8          4       5
+    9          7       8
+    **Getting values with a MultiIndex**
+    A number of examples using a DataFrame with a MultiIndex
+    >>> tuples = [
+    ...    ('cobra', 'mark i'), ('cobra', 'mark ii'),
+    ...    ('sidewinder', 'mark i'), ('sidewinder', 'mark ii'),
+    ...    ('viper', 'mark ii'), ('viper', 'mark iii')
+    ... ]
+    >>> index = md.MultiIndex.from_tuples(tuples)
+    >>> values = [[12, 2], [0, 4], [10, 20],
+    ...         [1, 4], [7, 1], [16, 36]]
+    >>> df = md.DataFrame(values, columns=['max_speed', 'shield'], index=index)
+    >>> df.execute()
+                         max_speed  shield
+    cobra      mark i           12       2
+               mark ii           0       4
+    sidewinder mark i           10      20
+               mark ii           1       4
+    viper      mark ii           7       1
+               mark iii         16      36
+    Single label. Note this returns a DataFrame with a single index.
+    >>> df.loc['cobra'].execute()
+             max_speed  shield
+    mark i          12       2
+    mark ii          0       4
+    Single index tuple. Note this returns a Series.
+    >>> df.loc[('cobra', 'mark ii')].execute()
+    max_speed    0
+    shield       4
+    Name: (cobra, mark ii), dtype: int64
+    Single label for row and column. Similar to passing in a tuple, this
+    returns a Series.
+    >>> df.loc['cobra', 'mark i'].execute()
+    max_speed    12
+    shield        2
+    Name: (cobra, mark i), dtype: int64
+    Single tuple. Note using ``[[]]`` returns a DataFrame.
+    >>> df.loc[[('cobra', 'mark ii')]].execute()
+                   max_speed  shield
+    cobra mark ii          0       4
+    Single tuple for the index with a single label for the column
+    >>> df.loc[('cobra', 'mark i'), 'shield'].execute()
+    2
+    Slice from index tuple to single label
+    >>> df.loc[('cobra', 'mark i'):'viper'].execute()
+                         max_speed  shield
+    cobra      mark i           12       2
+               mark ii           0       4
+    sidewinder mark i           10      20
+               mark ii           1       4
+    viper      mark ii           7       1
+               mark iii         16      36
+    Slice from index tuple to index tuple
+    >>> df.loc[('cobra', 'mark i'):('viper', 'mark ii')].execute()
+                        max_speed  shield
+    cobra      mark i          12       2
+               mark ii          0       4
+    sidewinder mark i          10      20
+               mark ii          1       4
+    viper      mark ii          7       1
+    """
     return DataFrameLoc(a)

maxframe/dataframe/indexing/reindex.py CHANGED Viewed

@@ -16,6 +16,8 @@ from typing import List
 import numpy as np
+from ...core.operator import OperatorStage
 try:
     import scipy.sparse as sps
 except ImportError:  # pragma: no cover
@@ -31,7 +33,7 @@ from ...serialization.serializables import (
     StringField,
 )
 from ...tensor import tensor as astensor
-from ...utils import lazy_import, pd_release_version
+from ...utils import is_full_slice, lazy_import, pd_release_version
 from ..core import INDEX_TYPE
 from ..core import Index as DataFrameIndexType
 from ..initializer import Index as asindex
@@ -92,12 +94,19 @@ class DataFrameReindex(DataFrameOperator, DataFrameOperatorMixin):
     @classmethod
     def _set_inputs(cls, op: "DataFrameReindex", inputs: List[EntityData]):
         super()._set_inputs(op, inputs)
-        inputs_iter = iter(op._inputs)
+        if getattr(op, "indexes", None):
+            op.index, op.columns = [
+                None if is_full_slice(idx) else idx for idx in list(op.indexes) + [None]
+            ][:2]
+        inputs_iter = iter(inputs)
         op._input = next(inputs_iter)
         if op.index is not None and isinstance(op.index, ENTITY_TYPE):
             op.index = next(inputs_iter)
-        if op.fill_value is not None and isinstance(op.fill_value, ENTITY_TYPE):
-            op.fill_value = next(inputs_iter)
+        if op.fill_value is not None:
+            if op.stage == OperatorStage.agg:
+                op.fill_value = None
+            elif isinstance(op.fill_value, ENTITY_TYPE):
+                op.fill_value = next(inputs_iter)
     def __call__(self, df_or_series):
         inputs = [df_or_series]
@@ -363,7 +372,7 @@ def reindex(
     axes_kwargs = dict(index=index, columns=columns, axis=axis)
     axes = validate_axis_style_args(
         df_or_series,
-        (labels,),
+        (labels,) if labels is not None else (),
         {k: v for k, v in axes_kwargs.items() if v is not None},
         "labels",
         "reindex",

maxframe/dataframe/indexing/rename.py CHANGED Viewed

@@ -16,6 +16,7 @@ import warnings
 from ... import opcodes
 from ...core import get_output_types
+from ...serialization import PickleContainer
 from ...serialization.serializables import AnyField, StringField
 from ..core import INDEX_TYPE, SERIES_TYPE
 from ..operators import DataFrameOperator, DataFrameOperatorMixin
@@ -34,6 +35,11 @@ class DataFrameRename(DataFrameOperator, DataFrameOperatorMixin):
     def __init__(self, output_types=None, **kw):
         super().__init__(_output_types=output_types, **kw)
+    def has_custom_code(self) -> bool:
+        return isinstance(self.columns_mapper, PickleContainer) or isinstance(
+            self.index_mapper, PickleContainer
+        )
     def _calc_renamed_df(self, df, errors="ignore"):
         empty_df = build_df(df)
         return empty_df.rename(

maxframe/dataframe/indexing/rename_axis.py CHANGED Viewed

@@ -85,8 +85,8 @@ def rename_axis_with_level(
         else:
             columns = mapper
     op = DataFrameRenameAxis(
-        index=None if index is no_default else index,
-        columns=None if columns is no_default else columns,
+        index=index,
+        columns=columns,
         copy_value=copy,
         level=level,
         axis=0 if index is not no_default else 1,

maxframe/dataframe/indexing/reorder_levels.py ADDED Viewed

@@ -0,0 +1,143 @@
+# Copyright 1999-2025 Alibaba Group Holding Ltd.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#      http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import pandas as pd
+from ... import opcodes
+from ...core import get_output_types
+from ...serialization.serializables import AnyField, Int32Field
+from ..operators import DataFrameOperator, DataFrameOperatorMixin
+from ..utils import parse_index, validate_axis
+class DataFrameReorderLevels(DataFrameOperator, DataFrameOperatorMixin):
+    _op_type_ = opcodes.REORDER_LEVELS
+    order = AnyField("order")
+    axis = Int32Field("axis", default=0)
+    def __call__(self, df_or_series):
+        # Determine output type
+        self._output_types = get_output_types(df_or_series)
+        if self.axis == 0:
+            src_idx_value = df_or_series.index_value
+        else:
+            src_idx_value = df_or_series.columns_value
+        # Create reordered index
+        pd_index = src_idx_value.to_pandas()
+        if not isinstance(pd_index, pd.MultiIndex):
+            raise ValueError("reorder_levels can only be used with MultiIndex")
+        pd_index = pd_index.reorder_levels(self.order)
+        params = df_or_series.params
+        if self.axis == 0:
+            params["index_value"] = parse_index(pd_index)
+        else:
+            params["columns_value"] = parse_index(pd_index, store_data=True)
+        return self.new_tileable([df_or_series], **params)
+def _reorder_levels(df_or_series, order, axis=0):
+    axis = validate_axis(axis, df_or_series)
+    op = DataFrameReorderLevels(order=order, axis=axis)
+    return op(df_or_series)
+def df_reorder_levels(df, order, axis=0):
+    """
+    Rearrange index levels using input order. May not drop or duplicate levels.
+    Parameters
+    ----------
+    order : list of int or list of str
+        List representing new level order. Reference level by number
+        (position) or by key (label).
+    axis : {0 or 'index', 1 or 'columns'}, default 0
+        Where to reorder levels.
+    Returns
+    -------
+    DataFrame
+    Examples
+    --------
+    >>> import maxframe.dataframe as md
+    >>> data = {
+    ...     "class": ["Mammals", "Mammals", "Reptiles"],
+    ...     "diet": ["Omnivore", "Carnivore", "Carnivore"],
+    ...     "species": ["Humans", "Dogs", "Snakes"],
+    ... }
+    >>> df = md.DataFrame(data, columns=["class", "diet", "species"])
+    >>> df = df.set_index(["class", "diet"])
+    >>> df.execute()
+                                      species
+    class      diet
+    Mammals    Omnivore                Humans
+               Carnivore                 Dogs
+    Reptiles   Carnivore               Snakes
+    Let's reorder the levels of the index:
+    >>> df.reorder_levels(["diet", "class"]).execute()
+                                      species
+    diet      class
+    Omnivore  Mammals                  Humans
+    Carnivore Mammals                    Dogs
+              Reptiles                 Snakes
+    """
+    return _reorder_levels(df, order, axis=axis)
+def series_reorder_levels(series, order):
+    """
+    Rearrange index levels using input order.
+    May not drop or duplicate levels.
+    Parameters
+    ----------
+    order : list of int representing new level order
+        Reference level by number or key.
+    Returns
+    -------
+    type of caller (new object)
+    Examples
+    --------
+    >>> import maxframe.tensor as mt
+    >>> import maxframe.dataframe as md
+    >>> arrays = [mt.array(["dog", "dog", "cat", "cat", "bird", "bird"]),
+    ...           mt.array(["white", "black", "white", "black", "white", "black"])]
+    >>> s = md.Series([1, 2, 3, 3, 5, 2], index=arrays)
+    >>> s.execute()
+    dog   white    1
+          black    2
+    cat   white    3
+          black    3
+    bird  white    5
+          black    2
+    dtype: int64
+    >>> s.reorder_levels([1, 0]).execute()
+    white  dog     1
+    black  dog     2
+    white  cat     3
+    black  cat     3
+    white  bird    5
+    black  bird    2
+    dtype: int64
+    """
+    return _reorder_levels(series, order)

maxframe/dataframe/indexing/reset_index.py CHANGED Viewed

@@ -18,10 +18,12 @@ import pandas as pd
 from ... import opcodes
 from ...core import OutputType
 from ...serialization.serializables import AnyField, BoolField
-from ...utils import no_default
+from ...utils import no_default, pd_release_version
 from ..operators import DATAFRAME_TYPE, DataFrameOperator, DataFrameOperatorMixin
 from ..utils import build_empty_df, build_empty_series, parse_index
+_reset_index_has_names = pd_release_version >= (1, 5)
 class DataFrameResetIndex(DataFrameOperator, DataFrameOperatorMixin):
     _op_type_ = opcodes.RESET_INDEX
@@ -29,8 +31,10 @@ class DataFrameResetIndex(DataFrameOperator, DataFrameOperatorMixin):
     level = AnyField("level", default=None)
     drop = BoolField("drop", default=False)
     name = AnyField("name", default=None)
-    col_level = AnyField("col_level", default=0)
-    col_fill = AnyField("col_fill", default="")
+    col_level = AnyField("col_level", default=None)
+    col_fill = AnyField("col_fill", default=None)
+    incremental_index = BoolField("incremental_index", default=False)
+    names = AnyField("names", default=None)
     def __init__(self, output_types=None, **kwargs):
         super().__init__(_output_types=output_types, **kwargs)
@@ -76,9 +80,26 @@ class DataFrameResetIndex(DataFrameOperator, DataFrameOperatorMixin):
         else:
             empty_df = build_empty_df(a.dtypes)
             empty_df.index = a.index_value.to_pandas()[:0]
-            empty_df = empty_df.reset_index(
-                level=self.level, col_level=self.col_level, col_fill=self.col_fill
-            )
+            if self.names and _reset_index_has_names:
+                empty_df = empty_df.reset_index(
+                    level=self.level,
+                    col_level=self.col_level,
+                    col_fill=self.col_fill,
+                    names=self.names,
+                )
+            else:
+                empty_df = empty_df.reset_index(
+                    level=self.level, col_level=self.col_level, col_fill=self.col_fill
+                )
+                if self.names:
+                    names = (
+                        [self.names] if not isinstance(self.names, list) else self.names
+                    )
+                    cols = list(empty_df.columns)
+                    cols[: len(names)] = names
+                    empty_df.columns = pd.Index(cols, name=empty_df.columns.name)
             shape = (a.shape[0], len(empty_df.columns))
             columns_value = parse_index(empty_df.columns, store_data=True)
             dtypes = empty_df.dtypes
@@ -105,6 +126,8 @@ def df_reset_index(
     inplace=False,
     col_level=0,
     col_fill="",
+    names=None,
+    incremental_index=False,
 ):
     """
     Reset the index, or a level of it.
@@ -255,6 +278,8 @@ def df_reset_index(
         drop=drop,
         col_level=col_level,
         col_fill=col_fill,
+        names=names,
+        incremental_index=incremental_index,
         output_types=[OutputType.dataframe],
     )
     ret = op(df)
@@ -270,6 +295,7 @@ def series_reset_index(
     drop=False,
     name=no_default,
     inplace=False,
+    incremental_index=False,
 ):
     """
     Generate a new DataFrame or Series with the index reset.
@@ -389,6 +415,7 @@ def series_reset_index(
         level=level,
         drop=drop,
         name=name,
+        incremental_index=incremental_index,
         output_types=[OutputType.series if drop else OutputType.dataframe],
     )
     ret = op(series)

maxframe/dataframe/indexing/sample.py CHANGED Viewed

@@ -25,6 +25,7 @@ from ...serialization.serializables import (
     Float64Field,
     Int8Field,
     Int64Field,
+    KeyField,
 )
 from ...tensor.random import RandomStateField
 from ..operators import DataFrameOperator, DataFrameOperatorMixin
@@ -41,6 +42,11 @@ class DataFrameSample(DataFrameOperator, DataFrameOperatorMixin):
     axis = Int8Field("axis", default=None)
     seed = Int64Field("seed", default=None)
     random_state = RandomStateField("random_state", default=None)
+    always_multinomial = BoolField("always_multinomial", default=None)
+    # for chunks
+    # num of instances for chunks
+    chunk_samples = KeyField("chunk_samples", default=None)
     def __init__(self, random_state=None, seed=None, **kw):
         if random_state is None:
@@ -54,6 +60,8 @@ class DataFrameSample(DataFrameOperator, DataFrameOperatorMixin):
         next(it)
         if isinstance(op.weights, ENTITY_TYPE):
             op.weights = next(it)
+        if isinstance(op.chunk_samples, ENTITY_TYPE):
+            op.chunk_samples = next(it)
     def __call__(self, df):
         params = df.params

maxframe 2.0.0b2__cp37-cp37m-win32.whl → 2.3.0rc1__cp37-cp37m-win32.whl

Potentially problematic release.

maxframe 2.0.0b2cp37-cp37m-win32.whl → 2.3.0rc1cp37-cp37m-win32.whl