PyPI - teradataml - Versions diffs - 17.20.0.7__py3-none-any.whl → 20.0.0.1__py3-none-any.whl - Mend

teradataml 17.20.0.7py3-none-any.whl → 20.0.0.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of teradataml might be problematic. Click here for more details.

Files changed (1303) hide show

teradataml/LICENSE-3RD-PARTY.pdf +0 -0
teradataml/LICENSE.pdf +0 -0
teradataml/README.md +1935 -1640
teradataml/__init__.py +70 -60
teradataml/_version.py +11 -11
teradataml/analytics/Transformations.py +2995 -2995
teradataml/analytics/__init__.py +81 -83
teradataml/analytics/analytic_function_executor.py +2040 -2010
teradataml/analytics/analytic_query_generator.py +958 -958
teradataml/analytics/byom/H2OPredict.py +514 -514
teradataml/analytics/byom/PMMLPredict.py +437 -437
teradataml/analytics/byom/__init__.py +14 -14
teradataml/analytics/json_parser/__init__.py +130 -130
teradataml/analytics/json_parser/analytic_functions_argument.py +1707 -1707
teradataml/analytics/json_parser/json_store.py +191 -191
teradataml/analytics/json_parser/metadata.py +1637 -1637
teradataml/analytics/json_parser/utils.py +798 -803
teradataml/analytics/meta_class.py +196 -196
teradataml/analytics/sqle/DecisionTreePredict.py +455 -470
teradataml/analytics/sqle/NaiveBayesPredict.py +419 -428
teradataml/analytics/sqle/__init__.py +97 -110
teradataml/analytics/sqle/json/decisiontreepredict_sqle.json +78 -78
teradataml/analytics/sqle/json/naivebayespredict_sqle.json +62 -62
teradataml/analytics/table_operator/__init__.py +10 -10
teradataml/analytics/uaf/__init__.py +63 -63
teradataml/analytics/utils.py +693 -692
teradataml/analytics/valib.py +1603 -1600
teradataml/automl/__init__.py +1683 -0
teradataml/automl/custom_json_utils.py +1270 -0
teradataml/automl/data_preparation.py +1011 -0
teradataml/automl/data_transformation.py +789 -0
teradataml/automl/feature_engineering.py +1580 -0
teradataml/automl/feature_exploration.py +554 -0
teradataml/automl/model_evaluation.py +151 -0
teradataml/automl/model_training.py +1026 -0
teradataml/catalog/__init__.py +1 -3
teradataml/catalog/byom.py +1759 -1716
teradataml/catalog/function_argument_mapper.py +859 -861
teradataml/catalog/model_cataloging_utils.py +491 -1510
teradataml/clients/auth_client.py +133 -0
teradataml/clients/pkce_client.py +481 -481
teradataml/common/aed_utils.py +7 -2
teradataml/common/bulk_exposed_utils.py +111 -111
teradataml/common/constants.py +1438 -1441
teradataml/common/deprecations.py +160 -0
teradataml/common/exceptions.py +73 -73
teradataml/common/formula.py +742 -742
teradataml/common/garbagecollector.py +597 -635
teradataml/common/messagecodes.py +424 -431
teradataml/common/messages.py +228 -231
teradataml/common/sqlbundle.py +693 -693
teradataml/common/td_coltype_code_to_tdtype.py +48 -48
teradataml/common/utils.py +2424 -2500
teradataml/common/warnings.py +25 -25
teradataml/common/wrapper_utils.py +1 -110
teradataml/config/dummy_file1.cfg +4 -4
teradataml/config/dummy_file2.cfg +2 -2
teradataml/config/sqlengine_alias_definitions_v1.0 +13 -13
teradataml/config/sqlengine_alias_definitions_v1.1 +19 -19
teradataml/config/sqlengine_alias_definitions_v1.3 +18 -18
teradataml/context/aed_context.py +217 -217
teradataml/context/context.py +1091 -999
teradataml/data/A_loan.csv +19 -19
teradataml/data/BINARY_REALS_LEFT.csv +11 -11
teradataml/data/BINARY_REALS_RIGHT.csv +11 -11
teradataml/data/B_loan.csv +49 -49
teradataml/data/BuoyData2.csv +17 -17
teradataml/data/CONVOLVE2_COMPLEX_LEFT.csv +5 -5
teradataml/data/CONVOLVE2_COMPLEX_RIGHT.csv +5 -5
teradataml/data/Convolve2RealsLeft.csv +5 -5
teradataml/data/Convolve2RealsRight.csv +5 -5
teradataml/data/Convolve2ValidLeft.csv +11 -11
teradataml/data/Convolve2ValidRight.csv +11 -11
teradataml/data/DFFTConv_Real_8_8.csv +65 -65
teradataml/data/Orders1_12mf.csv +24 -24
teradataml/data/Pi_loan.csv +7 -7
teradataml/data/SMOOTHED_DATA.csv +7 -7
teradataml/data/TestDFFT8.csv +9 -9
teradataml/data/TestRiver.csv +109 -109
teradataml/data/Traindata.csv +28 -28
teradataml/data/acf.csv +17 -17
teradataml/data/adaboost_example.json +34 -34
teradataml/data/adaboostpredict_example.json +24 -24
teradataml/data/additional_table.csv +10 -10
teradataml/data/admissions_test.csv +21 -21
teradataml/data/admissions_train.csv +41 -41
teradataml/data/admissions_train_nulls.csv +41 -41
teradataml/data/advertising.csv +201 -0
teradataml/data/ageandheight.csv +13 -13
teradataml/data/ageandpressure.csv +31 -31
teradataml/data/antiselect_example.json +36 -36
teradataml/data/antiselect_input.csv +8 -8
teradataml/data/antiselect_input_mixed_case.csv +8 -8
teradataml/data/applicant_external.csv +6 -6
teradataml/data/applicant_reference.csv +6 -6
teradataml/data/arima_example.json +9 -9
teradataml/data/assortedtext_input.csv +8 -8
teradataml/data/attribution_example.json +33 -33
teradataml/data/attribution_sample_table.csv +27 -27
teradataml/data/attribution_sample_table1.csv +6 -6
teradataml/data/attribution_sample_table2.csv +11 -11
teradataml/data/bank_churn.csv +10001 -0
teradataml/data/bank_marketing.csv +11163 -0
teradataml/data/bank_web_clicks1.csv +42 -42
teradataml/data/bank_web_clicks2.csv +91 -91
teradataml/data/bank_web_url.csv +85 -85
teradataml/data/barrier.csv +2 -2
teradataml/data/barrier_new.csv +3 -3
teradataml/data/betweenness_example.json +13 -13
teradataml/data/bike_sharing.csv +732 -0
teradataml/data/bin_breaks.csv +8 -8
teradataml/data/bin_fit_ip.csv +3 -3
teradataml/data/binary_complex_left.csv +11 -11
teradataml/data/binary_complex_right.csv +11 -11
teradataml/data/binary_matrix_complex_left.csv +21 -21
teradataml/data/binary_matrix_complex_right.csv +21 -21
teradataml/data/binary_matrix_real_left.csv +21 -21
teradataml/data/binary_matrix_real_right.csv +21 -21
teradataml/data/blood2ageandweight.csv +26 -26
teradataml/data/bmi.csv +501 -0
teradataml/data/boston.csv +507 -507
teradataml/data/boston2cols.csv +721 -0
teradataml/data/breast_cancer.csv +570 -0
teradataml/data/buoydata_mix.csv +11 -11
teradataml/data/burst_data.csv +5 -5
teradataml/data/burst_example.json +20 -20
teradataml/data/byom_example.json +17 -17
teradataml/data/bytes_table.csv +3 -3
teradataml/data/cal_housing_ex_raw.csv +70 -70
teradataml/data/callers.csv +7 -7
teradataml/data/calls.csv +10 -10
teradataml/data/cars_hist.csv +33 -33
teradataml/data/cat_table.csv +24 -24
teradataml/data/ccm_example.json +31 -31
teradataml/data/ccm_input.csv +91 -91
teradataml/data/ccm_input2.csv +13 -13
teradataml/data/ccmexample.csv +101 -101
teradataml/data/ccmprepare_example.json +8 -8
teradataml/data/ccmprepare_input.csv +91 -91
teradataml/data/cfilter_example.json +12 -12
teradataml/data/changepointdetection_example.json +18 -18
teradataml/data/changepointdetectionrt_example.json +8 -8
teradataml/data/chi_sq.csv +2 -2
teradataml/data/churn_data.csv +14 -14
teradataml/data/churn_emission.csv +35 -35
teradataml/data/churn_initial.csv +3 -3
teradataml/data/churn_state_transition.csv +5 -5
teradataml/data/citedges_2.csv +745 -745
teradataml/data/citvertices_2.csv +1210 -1210
teradataml/data/clicks2.csv +16 -16
teradataml/data/clickstream.csv +12 -12
teradataml/data/clickstream1.csv +11 -11
teradataml/data/closeness_example.json +15 -15
teradataml/data/complaints.csv +21 -21
teradataml/data/complaints_mini.csv +3 -3
teradataml/data/complaints_testtoken.csv +224 -224
teradataml/data/complaints_tokens_test.csv +353 -353
teradataml/data/complaints_traintoken.csv +472 -472
teradataml/data/computers_category.csv +1001 -1001
teradataml/data/computers_test1.csv +1252 -1252
teradataml/data/computers_train1.csv +5009 -5009
teradataml/data/computers_train1_clustered.csv +5009 -5009
teradataml/data/confusionmatrix_example.json +9 -9
teradataml/data/conversion_event_table.csv +3 -3
teradataml/data/corr_input.csv +17 -17
teradataml/data/correlation_example.json +11 -11
teradataml/data/coxhazardratio_example.json +39 -39
teradataml/data/coxph_example.json +15 -15
teradataml/data/coxsurvival_example.json +28 -28
teradataml/data/cpt.csv +41 -41
teradataml/data/credit_ex_merged.csv +45 -45
teradataml/data/customer_loyalty.csv +301 -301
teradataml/data/customer_loyalty_newseq.csv +31 -31
teradataml/data/customer_segmentation_test.csv +2628 -0
teradataml/data/customer_segmentation_train.csv +8069 -0
teradataml/data/dataframe_example.json +146 -146
teradataml/data/decisionforest_example.json +37 -37
teradataml/data/decisionforestpredict_example.json +38 -38
teradataml/data/decisiontree_example.json +21 -21
teradataml/data/decisiontreepredict_example.json +45 -45
teradataml/data/dfft2_size4_real.csv +17 -17
teradataml/data/dfft2_test_matrix16.csv +17 -17
teradataml/data/dfft2conv_real_4_4.csv +65 -65
teradataml/data/diabetes.csv +443 -443
teradataml/data/diabetes_test.csv +89 -89
teradataml/data/dict_table.csv +5 -5
teradataml/data/docperterm_table.csv +4 -4
teradataml/data/docs/__init__.py +1 -1
teradataml/data/docs/byom/docs/DataRobotPredict.py +180 -180
teradataml/data/docs/byom/docs/DataikuPredict.py +177 -177
teradataml/data/docs/byom/docs/H2OPredict.py +324 -324
teradataml/data/docs/byom/docs/ONNXPredict.py +283 -283
teradataml/data/docs/byom/docs/PMMLPredict.py +277 -277
teradataml/data/docs/sqle/docs_17_10/Antiselect.py +82 -82
teradataml/data/docs/sqle/docs_17_10/Attribution.py +199 -199
teradataml/data/docs/sqle/docs_17_10/BincodeFit.py +171 -171
teradataml/data/docs/sqle/docs_17_10/BincodeTransform.py +131 -130
teradataml/data/docs/sqle/docs_17_10/CategoricalSummary.py +86 -86
teradataml/data/docs/sqle/docs_17_10/ChiSq.py +90 -90
teradataml/data/docs/sqle/docs_17_10/ColumnSummary.py +85 -85
teradataml/data/docs/sqle/docs_17_10/ConvertTo.py +95 -95
teradataml/data/docs/sqle/docs_17_10/DecisionForestPredict.py +139 -139
teradataml/data/docs/sqle/docs_17_10/DecisionTreePredict.py +151 -151
teradataml/data/docs/sqle/docs_17_10/FTest.py +160 -160
teradataml/data/docs/sqle/docs_17_10/FillRowId.py +82 -82
teradataml/data/docs/sqle/docs_17_10/Fit.py +87 -87
teradataml/data/docs/sqle/docs_17_10/GLMPredict.py +144 -144
teradataml/data/docs/sqle/docs_17_10/GetRowsWithMissingValues.py +84 -84
teradataml/data/docs/sqle/docs_17_10/GetRowsWithoutMissingValues.py +81 -81
teradataml/data/docs/sqle/docs_17_10/Histogram.py +164 -164
teradataml/data/docs/sqle/docs_17_10/MovingAverage.py +134 -134
teradataml/data/docs/sqle/docs_17_10/NGramSplitter.py +208 -208
teradataml/data/docs/sqle/docs_17_10/NPath.py +265 -265
teradataml/data/docs/sqle/docs_17_10/NaiveBayesPredict.py +116 -116
teradataml/data/docs/sqle/docs_17_10/NaiveBayesTextClassifierPredict.py +176 -176
teradataml/data/docs/sqle/docs_17_10/NumApply.py +147 -147
teradataml/data/docs/sqle/docs_17_10/OneHotEncodingFit.py +134 -132
teradataml/data/docs/sqle/docs_17_10/OneHotEncodingTransform.py +109 -103
teradataml/data/docs/sqle/docs_17_10/OutlierFilterFit.py +165 -165
teradataml/data/docs/sqle/docs_17_10/OutlierFilterTransform.py +105 -101
teradataml/data/docs/sqle/docs_17_10/Pack.py +128 -128
teradataml/data/docs/sqle/docs_17_10/PolynomialFeaturesFit.py +111 -111
teradataml/data/docs/sqle/docs_17_10/PolynomialFeaturesTransform.py +102 -102
teradataml/data/docs/sqle/docs_17_10/QQNorm.py +104 -104
teradataml/data/docs/sqle/docs_17_10/RoundColumns.py +109 -109
teradataml/data/docs/sqle/docs_17_10/RowNormalizeFit.py +117 -117
teradataml/data/docs/sqle/docs_17_10/RowNormalizeTransform.py +99 -98
teradataml/data/docs/sqle/docs_17_10/SVMSparsePredict.py +152 -152
teradataml/data/docs/sqle/docs_17_10/ScaleFit.py +197 -197
teradataml/data/docs/sqle/docs_17_10/ScaleTransform.py +99 -98
teradataml/data/docs/sqle/docs_17_10/Sessionize.py +113 -113
teradataml/data/docs/sqle/docs_17_10/SimpleImputeFit.py +116 -116
teradataml/data/docs/sqle/docs_17_10/SimpleImputeTransform.py +98 -98
teradataml/data/docs/sqle/docs_17_10/StrApply.py +187 -187
teradataml/data/docs/sqle/docs_17_10/StringSimilarity.py +145 -145
teradataml/data/docs/sqle/docs_17_10/Transform.py +105 -104
teradataml/data/docs/sqle/docs_17_10/UnivariateStatistics.py +141 -141
teradataml/data/docs/sqle/docs_17_10/Unpack.py +214 -214
teradataml/data/docs/sqle/docs_17_10/WhichMax.py +83 -83
teradataml/data/docs/sqle/docs_17_10/WhichMin.py +83 -83
teradataml/data/docs/sqle/docs_17_10/ZTest.py +155 -155
teradataml/data/docs/sqle/docs_17_20/ANOVA.py +186 -126
teradataml/data/docs/sqle/docs_17_20/Antiselect.py +82 -82
teradataml/data/docs/sqle/docs_17_20/Attribution.py +200 -200
teradataml/data/docs/sqle/docs_17_20/BincodeFit.py +171 -171
teradataml/data/docs/sqle/docs_17_20/BincodeTransform.py +139 -138
teradataml/data/docs/sqle/docs_17_20/CategoricalSummary.py +86 -86
teradataml/data/docs/sqle/docs_17_20/ChiSq.py +90 -90
teradataml/data/docs/sqle/docs_17_20/ClassificationEvaluator.py +166 -166
teradataml/data/docs/sqle/docs_17_20/ColumnSummary.py +85 -85
teradataml/data/docs/sqle/docs_17_20/ColumnTransformer.py +245 -243
teradataml/data/docs/sqle/docs_17_20/ConvertTo.py +113 -113
teradataml/data/docs/sqle/docs_17_20/DecisionForest.py +279 -279
teradataml/data/docs/sqle/docs_17_20/DecisionForestPredict.py +144 -144
teradataml/data/docs/sqle/docs_17_20/DecisionTreePredict.py +135 -135
teradataml/data/docs/sqle/docs_17_20/FTest.py +239 -160
teradataml/data/docs/sqle/docs_17_20/FillRowId.py +82 -82
teradataml/data/docs/sqle/docs_17_20/Fit.py +87 -87
teradataml/data/docs/sqle/docs_17_20/GLM.py +541 -380
teradataml/data/docs/sqle/docs_17_20/GLMPerSegment.py +414 -414
teradataml/data/docs/sqle/docs_17_20/GLMPredict.py +144 -144
teradataml/data/docs/sqle/docs_17_20/GLMPredictPerSegment.py +233 -234
teradataml/data/docs/sqle/docs_17_20/GetFutileColumns.py +125 -123
teradataml/data/docs/sqle/docs_17_20/GetRowsWithMissingValues.py +108 -108
teradataml/data/docs/sqle/docs_17_20/GetRowsWithoutMissingValues.py +105 -105
teradataml/data/docs/sqle/docs_17_20/Histogram.py +223 -223
teradataml/data/docs/sqle/docs_17_20/KMeans.py +251 -204
teradataml/data/docs/sqle/docs_17_20/KMeansPredict.py +144 -143
teradataml/data/docs/sqle/docs_17_20/KNN.py +214 -214
teradataml/data/docs/sqle/docs_17_20/MovingAverage.py +134 -134
teradataml/data/docs/sqle/docs_17_20/NGramSplitter.py +208 -208
teradataml/data/docs/sqle/docs_17_20/NPath.py +265 -265
teradataml/data/docs/sqle/docs_17_20/NaiveBayesPredict.py +116 -116
teradataml/data/docs/sqle/docs_17_20/NaiveBayesTextClassifierPredict.py +177 -176
teradataml/data/docs/sqle/docs_17_20/NaiveBayesTextClassifierTrainer.py +126 -126
teradataml/data/docs/sqle/docs_17_20/NonLinearCombineFit.py +118 -117
teradataml/data/docs/sqle/docs_17_20/NonLinearCombineTransform.py +112 -112
teradataml/data/docs/sqle/docs_17_20/NumApply.py +147 -147
teradataml/data/docs/sqle/docs_17_20/OneClassSVM.py +307 -307
teradataml/data/docs/sqle/docs_17_20/OneClassSVMPredict.py +185 -184
teradataml/data/docs/sqle/docs_17_20/OneHotEncodingFit.py +230 -225
teradataml/data/docs/sqle/docs_17_20/OneHotEncodingTransform.py +121 -115
teradataml/data/docs/sqle/docs_17_20/OrdinalEncodingFit.py +219 -219
teradataml/data/docs/sqle/docs_17_20/OrdinalEncodingTransform.py +127 -127
teradataml/data/docs/sqle/docs_17_20/OutlierFilterFit.py +189 -189
teradataml/data/docs/sqle/docs_17_20/OutlierFilterTransform.py +117 -112
teradataml/data/docs/sqle/docs_17_20/Pack.py +128 -128
teradataml/data/docs/sqle/docs_17_20/PolynomialFeaturesFit.py +111 -111
teradataml/data/docs/sqle/docs_17_20/PolynomialFeaturesTransform.py +112 -111
teradataml/data/docs/sqle/docs_17_20/QQNorm.py +104 -104
teradataml/data/docs/sqle/docs_17_20/ROC.py +164 -163
teradataml/data/docs/sqle/docs_17_20/RandomProjectionFit.py +154 -154
teradataml/data/docs/sqle/docs_17_20/RandomProjectionMinComponents.py +106 -106
teradataml/data/docs/sqle/docs_17_20/RandomProjectionTransform.py +120 -120
teradataml/data/docs/sqle/docs_17_20/RegressionEvaluator.py +211 -211
teradataml/data/docs/sqle/docs_17_20/RoundColumns.py +108 -108
teradataml/data/docs/sqle/docs_17_20/RowNormalizeFit.py +117 -117
teradataml/data/docs/sqle/docs_17_20/RowNormalizeTransform.py +111 -110
teradataml/data/docs/sqle/docs_17_20/SVM.py +413 -413
teradataml/data/docs/sqle/docs_17_20/SVMPredict.py +213 -202
teradataml/data/docs/sqle/docs_17_20/SVMSparsePredict.py +152 -152
teradataml/data/docs/sqle/docs_17_20/ScaleFit.py +315 -197
teradataml/data/docs/sqle/docs_17_20/ScaleTransform.py +202 -109
teradataml/data/docs/sqle/docs_17_20/SentimentExtractor.py +206 -206
teradataml/data/docs/sqle/docs_17_20/Sessionize.py +113 -113
teradataml/data/docs/sqle/docs_17_20/Silhouette.py +152 -152
teradataml/data/docs/sqle/docs_17_20/SimpleImputeFit.py +116 -116
teradataml/data/docs/sqle/docs_17_20/SimpleImputeTransform.py +109 -108
teradataml/data/docs/sqle/docs_17_20/StrApply.py +187 -187
teradataml/data/docs/sqle/docs_17_20/StringSimilarity.py +145 -145
teradataml/data/docs/sqle/docs_17_20/TDDecisionForestPredict.py +207 -207
teradataml/data/docs/sqle/docs_17_20/TDGLMPredict.py +333 -171
teradataml/data/docs/sqle/docs_17_20/TargetEncodingFit.py +266 -266
teradataml/data/docs/sqle/docs_17_20/TargetEncodingTransform.py +141 -140
teradataml/data/docs/sqle/docs_17_20/TextParser.py +172 -172
teradataml/data/docs/sqle/docs_17_20/TrainTestSplit.py +159 -159
teradataml/data/docs/sqle/docs_17_20/Transform.py +123 -123
teradataml/data/docs/sqle/docs_17_20/UnivariateStatistics.py +141 -141
teradataml/data/docs/sqle/docs_17_20/Unpack.py +214 -214
teradataml/data/docs/sqle/docs_17_20/VectorDistance.py +168 -168
teradataml/data/docs/sqle/docs_17_20/WhichMax.py +83 -83
teradataml/data/docs/sqle/docs_17_20/WhichMin.py +83 -83
teradataml/data/docs/sqle/docs_17_20/WordEmbeddings.py +236 -236
teradataml/data/docs/sqle/docs_17_20/XGBoost.py +361 -353
teradataml/data/docs/sqle/docs_17_20/XGBoostPredict.py +281 -275
teradataml/data/docs/sqle/docs_17_20/ZTest.py +220 -155
teradataml/data/docs/tableoperator/docs_17_00/ReadNOS.py +429 -429
teradataml/data/docs/tableoperator/docs_17_05/ReadNOS.py +429 -429
teradataml/data/docs/tableoperator/docs_17_05/WriteNOS.py +347 -347
teradataml/data/docs/tableoperator/docs_17_10/ReadNOS.py +428 -428
teradataml/data/docs/tableoperator/docs_17_10/WriteNOS.py +347 -347
teradataml/data/docs/tableoperator/docs_17_20/ReadNOS.py +439 -439
teradataml/data/docs/tableoperator/docs_17_20/WriteNOS.py +386 -386
teradataml/data/docs/uaf/docs_17_20/ACF.py +195 -195
teradataml/data/docs/uaf/docs_17_20/ArimaEstimate.py +369 -369
teradataml/data/docs/uaf/docs_17_20/ArimaForecast.py +142 -142
teradataml/data/docs/uaf/docs_17_20/ArimaValidate.py +159 -159
teradataml/data/docs/uaf/docs_17_20/BinaryMatrixOp.py +247 -247
teradataml/data/docs/uaf/docs_17_20/BinarySeriesOp.py +252 -252
teradataml/data/docs/uaf/docs_17_20/BreuschGodfrey.py +177 -177
teradataml/data/docs/uaf/docs_17_20/BreuschPaganGodfrey.py +174 -174
teradataml/data/docs/uaf/docs_17_20/Convolve.py +226 -226
teradataml/data/docs/uaf/docs_17_20/Convolve2.py +214 -214
teradataml/data/docs/uaf/docs_17_20/CumulPeriodogram.py +183 -183
teradataml/data/docs/uaf/docs_17_20/DFFT.py +203 -203
teradataml/data/docs/uaf/docs_17_20/DFFT2.py +216 -216
teradataml/data/docs/uaf/docs_17_20/DFFT2Conv.py +215 -215
teradataml/data/docs/uaf/docs_17_20/DFFTConv.py +191 -191
teradataml/data/docs/uaf/docs_17_20/DTW.py +179 -179
teradataml/data/docs/uaf/docs_17_20/DickeyFuller.py +144 -144
teradataml/data/docs/uaf/docs_17_20/DurbinWatson.py +183 -183
teradataml/data/docs/uaf/docs_17_20/ExtractResults.py +184 -184
teradataml/data/docs/uaf/docs_17_20/FitMetrics.py +172 -172
teradataml/data/docs/uaf/docs_17_20/GenseriesFormula.py +205 -205
teradataml/data/docs/uaf/docs_17_20/GenseriesSinusoids.py +142 -142
teradataml/data/docs/uaf/docs_17_20/HoltWintersForecaster.py +258 -258
teradataml/data/docs/uaf/docs_17_20/IDFFT.py +164 -164
teradataml/data/docs/uaf/docs_17_20/IDFFT2.py +198 -198
teradataml/data/docs/uaf/docs_17_20/InputValidator.py +120 -120
teradataml/data/docs/uaf/docs_17_20/LineSpec.py +155 -155
teradataml/data/docs/uaf/docs_17_20/LinearRegr.py +214 -214
teradataml/data/docs/uaf/docs_17_20/MAMean.py +173 -173
teradataml/data/docs/uaf/docs_17_20/MInfo.py +133 -133
teradataml/data/docs/uaf/docs_17_20/MatrixMultiply.py +135 -135
teradataml/data/docs/uaf/docs_17_20/MultivarRegr.py +190 -190
teradataml/data/docs/uaf/docs_17_20/PACF.py +158 -158
teradataml/data/docs/uaf/docs_17_20/Portman.py +216 -216
teradataml/data/docs/uaf/docs_17_20/PowerTransform.py +154 -154
teradataml/data/docs/uaf/docs_17_20/Resample.py +228 -228
teradataml/data/docs/uaf/docs_17_20/SInfo.py +122 -122
teradataml/data/docs/uaf/docs_17_20/SeasonalNormalize.py +165 -165
teradataml/data/docs/uaf/docs_17_20/SelectionCriteria.py +173 -173
teradataml/data/docs/uaf/docs_17_20/SignifPeriodicities.py +170 -170
teradataml/data/docs/uaf/docs_17_20/SignifResidmean.py +163 -163
teradataml/data/docs/uaf/docs_17_20/SimpleExp.py +179 -179
teradataml/data/docs/uaf/docs_17_20/Smoothma.py +207 -207
teradataml/data/docs/uaf/docs_17_20/TrackingOp.py +150 -150
teradataml/data/docs/uaf/docs_17_20/UNDIFF.py +171 -171
teradataml/data/docs/uaf/docs_17_20/Unnormalize.py +201 -201
teradataml/data/docs/uaf/docs_17_20/WhitesGeneral.py +169 -169
teradataml/data/dtw_example.json +17 -17
teradataml/data/dtw_t1.csv +11 -11
teradataml/data/dtw_t2.csv +4 -4
teradataml/data/dwt2d_example.json +15 -15
teradataml/data/dwt_example.json +14 -14
teradataml/data/dwt_filter_dim.csv +5 -5
teradataml/data/emission.csv +9 -9
teradataml/data/emp_table_by_dept.csv +19 -19
teradataml/data/employee_info.csv +4 -4
teradataml/data/employee_table.csv +6 -6
teradataml/data/excluding_event_table.csv +2 -2
teradataml/data/finance_data.csv +6 -6
teradataml/data/finance_data2.csv +61 -61
teradataml/data/finance_data3.csv +93 -93
teradataml/data/fish.csv +160 -0
teradataml/data/fm_blood2ageandweight.csv +26 -26
teradataml/data/fmeasure_example.json +11 -11
teradataml/data/followers_leaders.csv +10 -10
teradataml/data/fpgrowth_example.json +12 -12
teradataml/data/frequentpaths_example.json +29 -29
teradataml/data/friends.csv +9 -9
teradataml/data/fs_input.csv +33 -33
teradataml/data/fs_input1.csv +33 -33
teradataml/data/genData.csv +513 -513
teradataml/data/geodataframe_example.json +39 -39
teradataml/data/glass_types.csv +215 -0
teradataml/data/glm_admissions_model.csv +12 -12
teradataml/data/glm_example.json +56 -29
teradataml/data/glml1l2_example.json +28 -28
teradataml/data/glml1l2predict_example.json +54 -54
teradataml/data/glmpredict_example.json +54 -54
teradataml/data/gq_t1.csv +21 -21
teradataml/data/hconvolve_complex_right.csv +5 -5
teradataml/data/hconvolve_complex_rightmulti.csv +5 -5
teradataml/data/histogram_example.json +11 -11
teradataml/data/hmmdecoder_example.json +78 -78
teradataml/data/hmmevaluator_example.json +24 -24
teradataml/data/hmmsupervised_example.json +10 -10
teradataml/data/hmmunsupervised_example.json +7 -7
teradataml/data/house_values.csv +12 -12
teradataml/data/house_values2.csv +13 -13
teradataml/data/housing_cat.csv +7 -7
teradataml/data/housing_data.csv +9 -9
teradataml/data/housing_test.csv +47 -47
teradataml/data/housing_test_binary.csv +47 -47
teradataml/data/housing_train.csv +493 -493
teradataml/data/housing_train_attribute.csv +4 -4
teradataml/data/housing_train_binary.csv +437 -437
teradataml/data/housing_train_parameter.csv +2 -2
teradataml/data/housing_train_response.csv +493 -493
teradataml/data/housing_train_segment.csv +201 -0
teradataml/data/ibm_stock.csv +370 -370
teradataml/data/ibm_stock1.csv +370 -370
teradataml/data/identitymatch_example.json +21 -21
teradataml/data/idf_table.csv +4 -4
teradataml/data/impressions.csv +101 -101
teradataml/data/inflation.csv +21 -21
teradataml/data/initial.csv +3 -3
teradataml/data/insect2Cols.csv +61 -0
teradataml/data/insect_sprays.csv +12 -12
teradataml/data/insurance.csv +1339 -1339
teradataml/data/interpolator_example.json +12 -12
teradataml/data/iris_altinput.csv +481 -481
teradataml/data/iris_attribute_output.csv +8 -8
teradataml/data/iris_attribute_test.csv +121 -121
teradataml/data/iris_attribute_train.csv +481 -481
teradataml/data/iris_category_expect_predict.csv +31 -31
teradataml/data/iris_data.csv +151 -0
teradataml/data/iris_input.csv +151 -151
teradataml/data/iris_response_train.csv +121 -121
teradataml/data/iris_test.csv +31 -31
teradataml/data/iris_train.csv +121 -121
teradataml/data/join_table1.csv +4 -4
teradataml/data/join_table2.csv +4 -4
teradataml/data/jsons/anly_function_name.json +6 -6
teradataml/data/jsons/byom/dataikupredict.json +147 -147
teradataml/data/jsons/byom/datarobotpredict.json +146 -146
teradataml/data/jsons/byom/h2opredict.json +194 -194
teradataml/data/jsons/byom/onnxpredict.json +186 -186
teradataml/data/jsons/byom/pmmlpredict.json +146 -146
teradataml/data/jsons/paired_functions.json +435 -435
teradataml/data/jsons/sqle/16.20/Antiselect.json +56 -56
teradataml/data/jsons/sqle/16.20/Attribution.json +249 -249
teradataml/data/jsons/sqle/16.20/DecisionForestPredict.json +156 -156
teradataml/data/jsons/sqle/16.20/DecisionTreePredict.json +170 -170
teradataml/data/jsons/sqle/16.20/GLMPredict.json +122 -122
teradataml/data/jsons/sqle/16.20/MovingAverage.json +367 -367
teradataml/data/jsons/sqle/16.20/NGramSplitter.json +239 -239
teradataml/data/jsons/sqle/16.20/NaiveBayesPredict.json +136 -136
teradataml/data/jsons/sqle/16.20/NaiveBayesTextClassifierPredict.json +235 -235
teradataml/data/jsons/sqle/16.20/Pack.json +98 -98
teradataml/data/jsons/sqle/16.20/SVMSparsePredict.json +162 -162
teradataml/data/jsons/sqle/16.20/Sessionize.json +105 -105
teradataml/data/jsons/sqle/16.20/StringSimilarity.json +86 -86
teradataml/data/jsons/sqle/16.20/Unpack.json +166 -166
teradataml/data/jsons/sqle/16.20/nPath.json +269 -269
teradataml/data/jsons/sqle/17.00/Antiselect.json +56 -56
teradataml/data/jsons/sqle/17.00/Attribution.json +249 -249
teradataml/data/jsons/sqle/17.00/DecisionForestPredict.json +156 -156
teradataml/data/jsons/sqle/17.00/DecisionTreePredict.json +170 -170
teradataml/data/jsons/sqle/17.00/GLMPredict.json +122 -122
teradataml/data/jsons/sqle/17.00/MovingAverage.json +367 -367
teradataml/data/jsons/sqle/17.00/NGramSplitter.json +239 -239
teradataml/data/jsons/sqle/17.00/NaiveBayesPredict.json +136 -136
teradataml/data/jsons/sqle/17.00/NaiveBayesTextClassifierPredict.json +235 -235
teradataml/data/jsons/sqle/17.00/Pack.json +98 -98
teradataml/data/jsons/sqle/17.00/SVMSparsePredict.json +162 -162
teradataml/data/jsons/sqle/17.00/Sessionize.json +105 -105
teradataml/data/jsons/sqle/17.00/StringSimilarity.json +86 -86
teradataml/data/jsons/sqle/17.00/Unpack.json +166 -166
teradataml/data/jsons/sqle/17.00/nPath.json +269 -269
teradataml/data/jsons/sqle/17.05/Antiselect.json +56 -56
teradataml/data/jsons/sqle/17.05/Attribution.json +249 -249
teradataml/data/jsons/sqle/17.05/DecisionForestPredict.json +156 -156
teradataml/data/jsons/sqle/17.05/DecisionTreePredict.json +170 -170
teradataml/data/jsons/sqle/17.05/GLMPredict.json +122 -122
teradataml/data/jsons/sqle/17.05/MovingAverage.json +367 -367
teradataml/data/jsons/sqle/17.05/NGramSplitter.json +239 -239
teradataml/data/jsons/sqle/17.05/NaiveBayesPredict.json +136 -136
teradataml/data/jsons/sqle/17.05/NaiveBayesTextClassifierPredict.json +235 -235
teradataml/data/jsons/sqle/17.05/Pack.json +98 -98
teradataml/data/jsons/sqle/17.05/SVMSparsePredict.json +162 -162
teradataml/data/jsons/sqle/17.05/Sessionize.json +105 -105
teradataml/data/jsons/sqle/17.05/StringSimilarity.json +86 -86
teradataml/data/jsons/sqle/17.05/Unpack.json +166 -166
teradataml/data/jsons/sqle/17.05/nPath.json +269 -269
teradataml/data/jsons/sqle/17.10/Antiselect.json +56 -56
teradataml/data/jsons/sqle/17.10/Attribution.json +249 -249
teradataml/data/jsons/sqle/17.10/DecisionForestPredict.json +185 -185
teradataml/data/jsons/sqle/17.10/DecisionTreePredict.json +171 -171
teradataml/data/jsons/sqle/17.10/GLMPredict.json +151 -151
teradataml/data/jsons/sqle/17.10/MovingAverage.json +368 -368
teradataml/data/jsons/sqle/17.10/NGramSplitter.json +239 -239
teradataml/data/jsons/sqle/17.10/NaiveBayesPredict.json +149 -149
teradataml/data/jsons/sqle/17.10/NaiveBayesTextClassifierPredict.json +288 -288
teradataml/data/jsons/sqle/17.10/Pack.json +133 -133
teradataml/data/jsons/sqle/17.10/SVMSparsePredict.json +193 -193
teradataml/data/jsons/sqle/17.10/Sessionize.json +105 -105
teradataml/data/jsons/sqle/17.10/StringSimilarity.json +86 -86
teradataml/data/jsons/sqle/17.10/TD_BinCodeFit.json +239 -239
teradataml/data/jsons/sqle/17.10/TD_BinCodeTransform.json +70 -70
teradataml/data/jsons/sqle/17.10/TD_CategoricalSummary.json +53 -53
teradataml/data/jsons/sqle/17.10/TD_Chisq.json +67 -67
teradataml/data/jsons/sqle/17.10/TD_ColumnSummary.json +53 -53
teradataml/data/jsons/sqle/17.10/TD_ConvertTo.json +68 -68
teradataml/data/jsons/sqle/17.10/TD_FTest.json +187 -187
teradataml/data/jsons/sqle/17.10/TD_FillRowID.json +51 -51
teradataml/data/jsons/sqle/17.10/TD_FunctionFit.json +46 -46
teradataml/data/jsons/sqle/17.10/TD_FunctionTransform.json +72 -71
teradataml/data/jsons/sqle/17.10/TD_GetRowsWithMissingValues.json +52 -52
teradataml/data/jsons/sqle/17.10/TD_GetRowsWithoutMissingValues.json +52 -52
teradataml/data/jsons/sqle/17.10/TD_Histogram.json +132 -132
teradataml/data/jsons/sqle/17.10/TD_NumApply.json +147 -147
teradataml/data/jsons/sqle/17.10/TD_OneHotEncodingFit.json +182 -182
teradataml/data/jsons/sqle/17.10/TD_OneHotEncodingTransform.json +65 -64
teradataml/data/jsons/sqle/17.10/TD_OutlierFilterFit.json +196 -196
teradataml/data/jsons/sqle/17.10/TD_OutlierFilterTransform.json +48 -47
teradataml/data/jsons/sqle/17.10/TD_PolynomialFeaturesFit.json +114 -114
teradataml/data/jsons/sqle/17.10/TD_PolynomialFeaturesTransform.json +72 -71
teradataml/data/jsons/sqle/17.10/TD_QQNorm.json +111 -111
teradataml/data/jsons/sqle/17.10/TD_RoundColumns.json +93 -93
teradataml/data/jsons/sqle/17.10/TD_RowNormalizeFit.json +127 -127
teradataml/data/jsons/sqle/17.10/TD_RowNormalizeTransform.json +70 -69
teradataml/data/jsons/sqle/17.10/TD_ScaleFit.json +156 -156
teradataml/data/jsons/sqle/17.10/TD_ScaleTransform.json +70 -69
teradataml/data/jsons/sqle/17.10/TD_SimpleImputeFit.json +147 -147
teradataml/data/jsons/sqle/17.10/TD_SimpleImputeTransform.json +48 -47
teradataml/data/jsons/sqle/17.10/TD_StrApply.json +240 -240
teradataml/data/jsons/sqle/17.10/TD_UnivariateStatistics.json +118 -118
teradataml/data/jsons/sqle/17.10/TD_WhichMax.json +52 -52
teradataml/data/jsons/sqle/17.10/TD_WhichMin.json +52 -52
teradataml/data/jsons/sqle/17.10/TD_ZTest.json +171 -171
teradataml/data/jsons/sqle/17.10/Unpack.json +188 -188
teradataml/data/jsons/sqle/17.10/nPath.json +269 -269
teradataml/data/jsons/sqle/17.20/Antiselect.json +56 -56
teradataml/data/jsons/sqle/17.20/Attribution.json +249 -249
teradataml/data/jsons/sqle/17.20/DecisionForestPredict.json +185 -185
teradataml/data/jsons/sqle/17.20/DecisionTreePredict.json +172 -172
teradataml/data/jsons/sqle/17.20/GLMPredict.json +151 -151
teradataml/data/jsons/sqle/17.20/MovingAverage.json +367 -367
teradataml/data/jsons/sqle/17.20/NGramSplitter.json +239 -239
teradataml/data/jsons/sqle/17.20/NaiveBayesPredict.json +149 -149
teradataml/data/jsons/sqle/17.20/NaiveBayesTextClassifierPredict.json +287 -287
teradataml/data/jsons/sqle/17.20/Pack.json +133 -133
teradataml/data/jsons/sqle/17.20/SVMSparsePredict.json +192 -192
teradataml/data/jsons/sqle/17.20/Sessionize.json +105 -105
teradataml/data/jsons/sqle/17.20/StringSimilarity.json +86 -86
teradataml/data/jsons/sqle/17.20/TD_ANOVA.json +148 -76
teradataml/data/jsons/sqle/17.20/TD_BinCodeFit.json +239 -239
teradataml/data/jsons/sqle/17.20/TD_BinCodeTransform.json +71 -71
teradataml/data/jsons/sqle/17.20/TD_CategoricalSummary.json +53 -53
teradataml/data/jsons/sqle/17.20/TD_Chisq.json +67 -67
teradataml/data/jsons/sqle/17.20/TD_ClassificationEvaluator.json +145 -145
teradataml/data/jsons/sqle/17.20/TD_ColumnSummary.json +53 -53
teradataml/data/jsons/sqle/17.20/TD_ColumnTransformer.json +218 -218
teradataml/data/jsons/sqle/17.20/TD_ConvertTo.json +92 -92
teradataml/data/jsons/sqle/17.20/TD_DecisionForest.json +259 -259
teradataml/data/jsons/sqle/17.20/TD_DecisionForestPredict.json +139 -139
teradataml/data/jsons/sqle/17.20/TD_FTest.json +269 -186
teradataml/data/jsons/sqle/17.20/TD_FillRowID.json +52 -52
teradataml/data/jsons/sqle/17.20/TD_FunctionFit.json +46 -46
teradataml/data/jsons/sqle/17.20/TD_FunctionTransform.json +72 -72
teradataml/data/jsons/sqle/17.20/TD_GLM.json +507 -431
teradataml/data/jsons/sqle/17.20/TD_GLMPREDICT.json +168 -125
teradataml/data/jsons/sqle/17.20/TD_GLMPerSegment.json +411 -411
teradataml/data/jsons/sqle/17.20/TD_GLMPredictPerSegment.json +146 -146
teradataml/data/jsons/sqle/17.20/TD_GetFutileColumns.json +93 -91
teradataml/data/jsons/sqle/17.20/TD_GetRowsWithMissingValues.json +76 -76
teradataml/data/jsons/sqle/17.20/TD_GetRowsWithoutMissingValues.json +76 -76
teradataml/data/jsons/sqle/17.20/TD_Histogram.json +152 -152
teradataml/data/jsons/sqle/17.20/TD_KMeans.json +231 -211
teradataml/data/jsons/sqle/17.20/TD_KMeansPredict.json +86 -86
teradataml/data/jsons/sqle/17.20/TD_KNN.json +262 -262
teradataml/data/jsons/sqle/17.20/TD_NaiveBayesTextClassifierTrainer.json +137 -137
teradataml/data/jsons/sqle/17.20/TD_NonLinearCombineFit.json +102 -101
teradataml/data/jsons/sqle/17.20/TD_NonLinearCombineTransform.json +71 -71
teradataml/data/jsons/sqle/17.20/TD_NumApply.json +147 -147
teradataml/data/jsons/sqle/17.20/TD_OneClassSVM.json +315 -315
teradataml/data/jsons/sqle/17.20/TD_OneClassSVMPredict.json +123 -123
teradataml/data/jsons/sqle/17.20/TD_OneHotEncodingFit.json +271 -271
teradataml/data/jsons/sqle/17.20/TD_OneHotEncodingTransform.json +65 -65
teradataml/data/jsons/sqle/17.20/TD_OrdinalEncodingFit.json +229 -229
teradataml/data/jsons/sqle/17.20/TD_OrdinalEncodingTransform.json +75 -75
teradataml/data/jsons/sqle/17.20/TD_OutlierFilterFit.json +217 -217
teradataml/data/jsons/sqle/17.20/TD_OutlierFilterTransform.json +48 -48
teradataml/data/jsons/sqle/17.20/TD_PolynomialFeaturesFit.json +114 -114
teradataml/data/jsons/sqle/17.20/TD_PolynomialFeaturesTransform.json +72 -72
teradataml/data/jsons/sqle/17.20/TD_QQNorm.json +111 -111
teradataml/data/jsons/sqle/17.20/TD_ROC.json +178 -177
teradataml/data/jsons/sqle/17.20/TD_RandomProjectionFit.json +178 -178
teradataml/data/jsons/sqle/17.20/TD_RandomProjectionMinComponents.json +73 -73
teradataml/data/jsons/sqle/17.20/TD_RandomProjectionTransform.json +74 -74
teradataml/data/jsons/sqle/17.20/TD_RegressionEvaluator.json +137 -137
teradataml/data/jsons/sqle/17.20/TD_RoundColumns.json +93 -93
teradataml/data/jsons/sqle/17.20/TD_RowNormalizeFit.json +127 -127
teradataml/data/jsons/sqle/17.20/TD_RowNormalizeTransform.json +70 -70
teradataml/data/jsons/sqle/17.20/TD_SVM.json +389 -389
teradataml/data/jsons/sqle/17.20/TD_SVMPredict.json +142 -124
teradataml/data/jsons/sqle/17.20/TD_ScaleFit.json +309 -156
teradataml/data/jsons/sqle/17.20/TD_ScaleTransform.json +119 -70
teradataml/data/jsons/sqle/17.20/TD_SentimentExtractor.json +193 -193
teradataml/data/jsons/sqle/17.20/TD_Silhouette.json +142 -142
teradataml/data/jsons/sqle/17.20/TD_SimpleImputeFit.json +147 -147
teradataml/data/jsons/sqle/17.20/TD_SimpleImputeTransform.json +48 -48
teradataml/data/jsons/sqle/17.20/TD_StrApply.json +240 -240
teradataml/data/jsons/sqle/17.20/TD_TargetEncodingFit.json +248 -248
teradataml/data/jsons/sqle/17.20/TD_TargetEncodingTransform.json +75 -75
teradataml/data/jsons/sqle/17.20/TD_TextParser.json +192 -192
teradataml/data/jsons/sqle/17.20/TD_TrainTestSplit.json +142 -142
teradataml/data/jsons/sqle/17.20/TD_UnivariateStatistics.json +117 -117
teradataml/data/jsons/sqle/17.20/TD_VectorDistance.json +182 -182
teradataml/data/jsons/sqle/17.20/TD_WhichMax.json +52 -52
teradataml/data/jsons/sqle/17.20/TD_WhichMin.json +52 -52
teradataml/data/jsons/sqle/17.20/TD_WordEmbeddings.json +241 -241
teradataml/data/jsons/sqle/17.20/TD_XGBoost.json +330 -312
teradataml/data/jsons/sqle/17.20/TD_XGBoostPredict.json +195 -182
teradataml/data/jsons/sqle/17.20/TD_ZTest.json +247 -170
teradataml/data/jsons/sqle/17.20/Unpack.json +188 -188
teradataml/data/jsons/sqle/17.20/nPath.json +269 -269
teradataml/data/jsons/tableoperator/17.00/read_nos.json +197 -197
teradataml/data/jsons/tableoperator/17.05/read_nos.json +197 -197
teradataml/data/jsons/tableoperator/17.05/write_nos.json +194 -194
teradataml/data/jsons/tableoperator/17.10/read_nos.json +183 -183
teradataml/data/jsons/tableoperator/17.10/write_nos.json +194 -194
teradataml/data/jsons/tableoperator/17.20/read_nos.json +182 -182
teradataml/data/jsons/tableoperator/17.20/write_nos.json +223 -223
teradataml/data/jsons/uaf/17.20/TD_ACF.json +149 -149
teradataml/data/jsons/uaf/17.20/TD_ARIMAESTIMATE.json +409 -409
teradataml/data/jsons/uaf/17.20/TD_ARIMAFORECAST.json +79 -79
teradataml/data/jsons/uaf/17.20/TD_ARIMAVALIDATE.json +151 -151
teradataml/data/jsons/uaf/17.20/TD_BINARYMATRIXOP.json +109 -109
teradataml/data/jsons/uaf/17.20/TD_BINARYSERIESOP.json +107 -107
teradataml/data/jsons/uaf/17.20/TD_BREUSCH_GODFREY.json +87 -87
teradataml/data/jsons/uaf/17.20/TD_BREUSCH_PAGAN_GODFREY.json +106 -106
teradataml/data/jsons/uaf/17.20/TD_CONVOLVE.json +80 -80
teradataml/data/jsons/uaf/17.20/TD_CONVOLVE2.json +67 -67
teradataml/data/jsons/uaf/17.20/TD_CUMUL_PERIODOGRAM.json +91 -91
teradataml/data/jsons/uaf/17.20/TD_DFFT.json +136 -136
teradataml/data/jsons/uaf/17.20/TD_DFFT2.json +148 -148
teradataml/data/jsons/uaf/17.20/TD_DFFT2CONV.json +108 -108
teradataml/data/jsons/uaf/17.20/TD_DFFTCONV.json +109 -109
teradataml/data/jsons/uaf/17.20/TD_DICKEY_FULLER.json +86 -86
teradataml/data/jsons/uaf/17.20/TD_DIFF.json +91 -91
teradataml/data/jsons/uaf/17.20/TD_DTW.json +116 -116
teradataml/data/jsons/uaf/17.20/TD_DURBIN_WATSON.json +100 -100
teradataml/data/jsons/uaf/17.20/TD_EXTRACT_RESULTS.json +38 -38
teradataml/data/jsons/uaf/17.20/TD_FITMETRICS.json +100 -100
teradataml/data/jsons/uaf/17.20/TD_GENSERIES4FORMULA.json +84 -84
teradataml/data/jsons/uaf/17.20/TD_GENSERIES4SINUSOIDS.json +70 -70
teradataml/data/jsons/uaf/17.20/TD_GOLDFELD_QUANDT.json +152 -152
teradataml/data/jsons/uaf/17.20/TD_HOLT_WINTERS_FORECAST.json +313 -313
teradataml/data/jsons/uaf/17.20/TD_IDFFT.json +57 -57
teradataml/data/jsons/uaf/17.20/TD_IDFFT2.json +94 -94
teradataml/data/jsons/uaf/17.20/TD_INPUTVALIDATOR.json +63 -63
teradataml/data/jsons/uaf/17.20/TD_LINEAR_REGR.json +181 -181
teradataml/data/jsons/uaf/17.20/TD_LINESPEC.json +102 -102
teradataml/data/jsons/uaf/17.20/TD_MAMEAN.json +182 -182
teradataml/data/jsons/uaf/17.20/TD_MATRIXMULTIPLY.json +67 -67
teradataml/data/jsons/uaf/17.20/TD_MINFO.json +66 -66
teradataml/data/jsons/uaf/17.20/TD_MULTIVAR_REGR.json +178 -178
teradataml/data/jsons/uaf/17.20/TD_PACF.json +114 -114
teradataml/data/jsons/uaf/17.20/TD_PORTMAN.json +118 -118
teradataml/data/jsons/uaf/17.20/TD_POWERSPEC.json +175 -175
teradataml/data/jsons/uaf/17.20/TD_POWERTRANSFORM.json +97 -97
teradataml/data/jsons/uaf/17.20/TD_RESAMPLE.json +173 -173
teradataml/data/jsons/uaf/17.20/TD_SEASONALNORMALIZE.json +136 -136
teradataml/data/jsons/uaf/17.20/TD_SELECTION_CRITERIA.json +89 -89
teradataml/data/jsons/uaf/17.20/TD_SIGNIF_PERIODICITIES.json +79 -79
teradataml/data/jsons/uaf/17.20/TD_SIGNIF_RESIDMEAN.json +67 -67
teradataml/data/jsons/uaf/17.20/TD_SIMPLEEXP.json +184 -184
teradataml/data/jsons/uaf/17.20/TD_SINFO.json +57 -57
teradataml/data/jsons/uaf/17.20/TD_SMOOTHMA.json +162 -162
teradataml/data/jsons/uaf/17.20/TD_TRACKINGOP.json +100 -100
teradataml/data/jsons/uaf/17.20/TD_UNDIFF.json +111 -111
teradataml/data/jsons/uaf/17.20/TD_UNNORMALIZE.json +95 -95
teradataml/data/jsons/uaf/17.20/TD_WHITES_GENERAL.json +77 -77
teradataml/data/kmeans_example.json +22 -17
teradataml/data/kmeans_table.csv +10 -0
teradataml/data/kmeans_us_arrests_data.csv +0 -0
teradataml/data/knn_example.json +18 -18
teradataml/data/knnrecommender_example.json +6 -6
teradataml/data/knnrecommenderpredict_example.json +12 -12
teradataml/data/lar_example.json +17 -17
teradataml/data/larpredict_example.json +30 -30
teradataml/data/lc_new_predictors.csv +5 -5
teradataml/data/lc_new_reference.csv +9 -9
teradataml/data/lda_example.json +8 -8
teradataml/data/ldainference_example.json +14 -14
teradataml/data/ldatopicsummary_example.json +8 -8
teradataml/data/levendist_input.csv +13 -13
teradataml/data/levenshteindistance_example.json +10 -10
teradataml/data/linreg_example.json +9 -9
teradataml/data/load_example_data.py +326 -323
teradataml/data/loan_prediction.csv +295 -295
teradataml/data/lungcancer.csv +138 -138
teradataml/data/mappingdata.csv +12 -12
teradataml/data/milk_timeseries.csv +157 -157
teradataml/data/min_max_titanic.csv +4 -4
teradataml/data/minhash_example.json +6 -6
teradataml/data/ml_ratings.csv +7547 -7547
teradataml/data/ml_ratings_10.csv +2445 -2445
teradataml/data/model1_table.csv +5 -5
teradataml/data/model2_table.csv +5 -5
teradataml/data/models/iris_db_glm_model.pmml +56 -56
teradataml/data/models/iris_db_xgb_model.pmml +4471 -4471
teradataml/data/modularity_example.json +12 -12
teradataml/data/movavg_example.json +7 -7
teradataml/data/mtx1.csv +7 -7
teradataml/data/mtx2.csv +13 -13
teradataml/data/multi_model_classification.csv +401 -0
teradataml/data/multi_model_regression.csv +401 -0
teradataml/data/mvdfft8.csv +9 -9
teradataml/data/naivebayes_example.json +9 -9
teradataml/data/naivebayespredict_example.json +19 -19
teradataml/data/naivebayestextclassifier2_example.json +6 -6
teradataml/data/naivebayestextclassifier_example.json +8 -8
teradataml/data/naivebayestextclassifierpredict_example.json +20 -20
teradataml/data/name_Find_configure.csv +10 -10
teradataml/data/namedentityfinder_example.json +14 -14
teradataml/data/namedentityfinderevaluator_example.json +10 -10
teradataml/data/namedentityfindertrainer_example.json +6 -6
teradataml/data/nb_iris_input_test.csv +31 -31
teradataml/data/nb_iris_input_train.csv +121 -121
teradataml/data/nbp_iris_model.csv +13 -13
teradataml/data/ner_extractor_text.csv +2 -2
teradataml/data/ner_sports_test2.csv +29 -29
teradataml/data/ner_sports_train.csv +501 -501
teradataml/data/nerevaluator_example.json +5 -5
teradataml/data/nerextractor_example.json +18 -18
teradataml/data/nermem_sports_test.csv +17 -17
teradataml/data/nermem_sports_train.csv +50 -50
teradataml/data/nertrainer_example.json +6 -6
teradataml/data/ngrams_example.json +6 -6
teradataml/data/notebooks/sqlalchemy/Teradata Vantage Aggregate Functions using SQLAlchemy.ipynb +1455 -1455
teradataml/data/notebooks/sqlalchemy/Teradata Vantage Arithmetic Functions Using SQLAlchemy.ipynb +1993 -1993
teradataml/data/notebooks/sqlalchemy/Teradata Vantage Bit-Byte Manipulation Functions using SQLAlchemy.ipynb +1492 -1492
teradataml/data/notebooks/sqlalchemy/Teradata Vantage Built-in functions using SQLAlchemy.ipynb +536 -536
teradataml/data/notebooks/sqlalchemy/Teradata Vantage Regular Expressions Using SQLAlchemy.ipynb +570 -570
teradataml/data/notebooks/sqlalchemy/Teradata Vantage String Functions Using SQLAlchemy.ipynb +2559 -2559
teradataml/data/notebooks/sqlalchemy/Teradata Vantage Window Aggregate Functions using SQLAlchemy.ipynb +2911 -2911
teradataml/data/notebooks/sqlalchemy/Using Generic SQLAlchemy ClauseElements teradataml DataFrame assign method.ipynb +698 -698
teradataml/data/notebooks/sqlalchemy/teradataml filtering using SQLAlchemy ClauseElements.ipynb +784 -784
teradataml/data/npath_example.json +23 -23
teradataml/data/ntree_example.json +14 -14
teradataml/data/numeric_strings.csv +4 -4
teradataml/data/numerics.csv +4 -4
teradataml/data/ocean_buoy.csv +17 -17
teradataml/data/ocean_buoy2.csv +17 -17
teradataml/data/ocean_buoys.csv +27 -27
teradataml/data/ocean_buoys2.csv +10 -10
teradataml/data/ocean_buoys_nonpti.csv +28 -28
teradataml/data/ocean_buoys_seq.csv +29 -29
teradataml/data/onehot_encoder_train.csv +4 -0
teradataml/data/openml_example.json +92 -0
teradataml/data/optional_event_table.csv +4 -4
teradataml/data/orders1.csv +11 -11
teradataml/data/orders1_12.csv +12 -12
teradataml/data/orders_ex.csv +4 -4
teradataml/data/pack_example.json +8 -8
teradataml/data/package_tracking.csv +19 -19
teradataml/data/package_tracking_pti.csv +18 -18
teradataml/data/pagerank_example.json +13 -13
teradataml/data/paragraphs_input.csv +6 -6
teradataml/data/pathanalyzer_example.json +7 -7
teradataml/data/pathgenerator_example.json +7 -7
teradataml/data/phrases.csv +7 -7
teradataml/data/pivot_example.json +8 -8
teradataml/data/pivot_input.csv +22 -22
teradataml/data/playerRating.csv +31 -31
teradataml/data/postagger_example.json +6 -6
teradataml/data/posttagger_output.csv +44 -44
teradataml/data/production_data.csv +16 -16
teradataml/data/production_data2.csv +7 -7
teradataml/data/randomsample_example.json +31 -31
teradataml/data/randomwalksample_example.json +8 -8
teradataml/data/rank_table.csv +6 -6
teradataml/data/ref_mobile_data.csv +4 -4
teradataml/data/ref_mobile_data_dense.csv +2 -2
teradataml/data/ref_url.csv +17 -17
teradataml/data/restaurant_reviews.csv +7 -7
teradataml/data/river_data.csv +145 -145
teradataml/data/roc_example.json +7 -7
teradataml/data/roc_input.csv +101 -101
teradataml/data/rule_inputs.csv +6 -6
teradataml/data/rule_table.csv +2 -2
teradataml/data/sales.csv +7 -7
teradataml/data/sales_transaction.csv +501 -501
teradataml/data/salesdata.csv +342 -342
teradataml/data/sample_cities.csv +2 -2
teradataml/data/sample_shapes.csv +10 -10
teradataml/data/sample_streets.csv +2 -2
teradataml/data/sampling_example.json +15 -15
teradataml/data/sax_example.json +8 -8
teradataml/data/scale_attributes.csv +3 -0
teradataml/data/scale_example.json +74 -23
teradataml/data/scale_housing.csv +11 -11
teradataml/data/scale_housing_test.csv +6 -6
teradataml/data/scale_input_part_sparse.csv +31 -0
teradataml/data/scale_input_partitioned.csv +16 -0
teradataml/data/scale_input_sparse.csv +11 -0
teradataml/data/scale_parameters.csv +3 -0
teradataml/data/scale_stat.csv +11 -11
teradataml/data/scalebypartition_example.json +13 -13
teradataml/data/scalemap_example.json +13 -13
teradataml/data/scalesummary_example.json +12 -12
teradataml/data/score_category.csv +101 -101
teradataml/data/score_summary.csv +4 -4
teradataml/data/script_example.json +9 -9
teradataml/data/scripts/deploy_script.py +84 -0
teradataml/data/scripts/mapper.R +20 -0
teradataml/data/scripts/mapper.py +15 -15
teradataml/data/scripts/mapper_replace.py +15 -15
teradataml/data/scripts/sklearn/__init__.py +0 -0
teradataml/data/scripts/sklearn/sklearn_fit.py +171 -0
teradataml/data/scripts/sklearn/sklearn_fit_predict.py +127 -0
teradataml/data/scripts/sklearn/sklearn_function.template +108 -0
teradataml/data/scripts/sklearn/sklearn_model_selection_split.py +148 -0
teradataml/data/scripts/sklearn/sklearn_neighbors.py +143 -0
teradataml/data/scripts/sklearn/sklearn_score.py +119 -0
teradataml/data/scripts/sklearn/sklearn_transform.py +171 -0
teradataml/data/seeds.csv +10 -10
teradataml/data/sentenceextractor_example.json +6 -6
teradataml/data/sentiment_extract_input.csv +11 -11
teradataml/data/sentiment_train.csv +16 -16
teradataml/data/sentiment_word.csv +20 -20
teradataml/data/sentiment_word_input.csv +19 -19
teradataml/data/sentimentextractor_example.json +24 -24
teradataml/data/sentimenttrainer_example.json +8 -8
teradataml/data/sequence_table.csv +10 -10
teradataml/data/seriessplitter_example.json +7 -7
teradataml/data/sessionize_example.json +17 -17
teradataml/data/sessionize_table.csv +116 -116
teradataml/data/setop_test1.csv +24 -24
teradataml/data/setop_test2.csv +22 -22
teradataml/data/soc_nw_edges.csv +10 -10
teradataml/data/soc_nw_vertices.csv +7 -7
teradataml/data/souvenir_timeseries.csv +167 -167
teradataml/data/sparse_iris_attribute.csv +5 -5
teradataml/data/sparse_iris_test.csv +121 -121
teradataml/data/sparse_iris_train.csv +601 -601
teradataml/data/star1.csv +6 -6
teradataml/data/state_transition.csv +5 -5
teradataml/data/stock_data.csv +53 -53
teradataml/data/stock_movement.csv +11 -11
teradataml/data/stock_vol.csv +76 -76
teradataml/data/stop_words.csv +8 -8
teradataml/data/store_sales.csv +37 -37
teradataml/data/stringsimilarity_example.json +7 -7
teradataml/data/strsimilarity_input.csv +13 -13
teradataml/data/students.csv +101 -101
teradataml/data/svm_iris_input_test.csv +121 -121
teradataml/data/svm_iris_input_train.csv +481 -481
teradataml/data/svm_iris_model.csv +7 -7
teradataml/data/svmdense_example.json +9 -9
teradataml/data/svmdensepredict_example.json +18 -18
teradataml/data/svmsparse_example.json +7 -7
teradataml/data/svmsparsepredict_example.json +13 -13
teradataml/data/svmsparsesummary_example.json +7 -7
teradataml/data/target_mobile_data.csv +13 -13
teradataml/data/target_mobile_data_dense.csv +5 -5
teradataml/data/templatedata.csv +1201 -1201
teradataml/data/templates/open_source_ml.json +9 -0
teradataml/data/teradataml_example.json +150 -1
teradataml/data/test_classification.csv +101 -0
teradataml/data/test_loan_prediction.csv +53 -53
teradataml/data/test_pacf_12.csv +37 -37
teradataml/data/test_prediction.csv +101 -0
teradataml/data/test_regression.csv +101 -0
teradataml/data/test_river2.csv +109 -109
teradataml/data/text_inputs.csv +6 -6
teradataml/data/textchunker_example.json +7 -7
teradataml/data/textclassifier_example.json +6 -6
teradataml/data/textclassifier_input.csv +7 -7
teradataml/data/textclassifiertrainer_example.json +6 -6
teradataml/data/textmorph_example.json +5 -5
teradataml/data/textparser_example.json +15 -15
teradataml/data/texttagger_example.json +11 -11
teradataml/data/texttokenizer_example.json +6 -6
teradataml/data/texttrainer_input.csv +11 -11
teradataml/data/tf_example.json +6 -6
teradataml/data/tfidf_example.json +13 -13
teradataml/data/tfidf_input1.csv +201 -201
teradataml/data/tfidf_train.csv +6 -6
teradataml/data/time_table1.csv +535 -535
teradataml/data/time_table2.csv +14 -14
teradataml/data/timeseriesdata.csv +1601 -1601
teradataml/data/timeseriesdatasetsd4.csv +105 -105
teradataml/data/titanic.csv +892 -892
teradataml/data/token_table.csv +696 -696
teradataml/data/train_multiclass.csv +101 -0
teradataml/data/train_regression.csv +101 -0
teradataml/data/train_regression_multiple_labels.csv +101 -0
teradataml/data/train_tracking.csv +27 -27
teradataml/data/transformation_table.csv +5 -5
teradataml/data/transformation_table_new.csv +1 -1
teradataml/data/tv_spots.csv +16 -16
teradataml/data/twod_climate_data.csv +117 -117
teradataml/data/uaf_example.json +475 -475
teradataml/data/univariatestatistics_example.json +8 -8
teradataml/data/unpack_example.json +9 -9
teradataml/data/unpivot_example.json +9 -9
teradataml/data/unpivot_input.csv +8 -8
teradataml/data/us_air_pass.csv +36 -36
teradataml/data/us_population.csv +624 -624
teradataml/data/us_states_shapes.csv +52 -52
teradataml/data/varmax_example.json +17 -17
teradataml/data/vectordistance_example.json +25 -25
teradataml/data/ville_climatedata.csv +121 -121
teradataml/data/ville_tempdata.csv +12 -12
teradataml/data/ville_tempdata1.csv +12 -12
teradataml/data/ville_temperature.csv +11 -11
teradataml/data/waveletTable.csv +1605 -1605
teradataml/data/waveletTable2.csv +1605 -1605
teradataml/data/weightedmovavg_example.json +8 -8
teradataml/data/wft_testing.csv +5 -5
teradataml/data/wine_data.csv +1600 -0
teradataml/data/word_embed_input_table1.csv +5 -5
teradataml/data/word_embed_input_table2.csv +4 -4
teradataml/data/word_embed_model.csv +22 -22
teradataml/data/words_input.csv +13 -13
teradataml/data/xconvolve_complex_left.csv +6 -6
teradataml/data/xconvolve_complex_leftmulti.csv +6 -6
teradataml/data/xgboost_example.json +35 -35
teradataml/data/xgboostpredict_example.json +31 -31
teradataml/data/ztest_example.json +16 -0
teradataml/dataframe/copy_to.py +1769 -1698
teradataml/dataframe/data_transfer.py +2812 -2745
teradataml/dataframe/dataframe.py +17630 -16946
teradataml/dataframe/dataframe_utils.py +1875 -1740
teradataml/dataframe/fastload.py +794 -603
teradataml/dataframe/indexer.py +424 -424
teradataml/dataframe/setop.py +1179 -1166
teradataml/dataframe/sql.py +10174 -6432
teradataml/dataframe/sql_function_parameters.py +439 -388
teradataml/dataframe/sql_functions.py +652 -652
teradataml/dataframe/sql_interfaces.py +220 -220
teradataml/dataframe/vantage_function_types.py +674 -630
teradataml/dataframe/window.py +693 -692
teradataml/dbutils/__init__.py +3 -3
teradataml/dbutils/dbutils.py +1167 -1150
teradataml/dbutils/filemgr.py +267 -267
teradataml/gen_ai/__init__.py +2 -2
teradataml/gen_ai/convAI.py +472 -472
teradataml/geospatial/__init__.py +3 -3
teradataml/geospatial/geodataframe.py +1105 -1094
teradataml/geospatial/geodataframecolumn.py +392 -387
teradataml/geospatial/geometry_types.py +925 -925
teradataml/hyperparameter_tuner/__init__.py +1 -1
teradataml/hyperparameter_tuner/optimizer.py +3783 -2993
teradataml/hyperparameter_tuner/utils.py +281 -187
teradataml/lib/aed_0_1.dll +0 -0
teradataml/lib/libaed_0_1.dylib +0 -0
teradataml/lib/libaed_0_1.so +0 -0
teradataml/libaed_0_1.dylib +0 -0
teradataml/libaed_0_1.so +0 -0
teradataml/opensource/__init__.py +1 -0
teradataml/opensource/sklearn/__init__.py +1 -0
teradataml/opensource/sklearn/_class.py +255 -0
teradataml/opensource/sklearn/_sklearn_wrapper.py +1715 -0
teradataml/opensource/sklearn/_wrapper_utils.py +268 -0
teradataml/opensource/sklearn/constants.py +54 -0
teradataml/options/__init__.py +130 -124
teradataml/options/configure.py +358 -336
teradataml/options/display.py +176 -176
teradataml/plot/__init__.py +2 -2
teradataml/plot/axis.py +1388 -1388
teradataml/plot/constants.py +15 -15
teradataml/plot/figure.py +398 -398
teradataml/plot/plot.py +760 -760
teradataml/plot/query_generator.py +83 -83
teradataml/plot/subplot.py +216 -216
teradataml/scriptmgmt/UserEnv.py +3791 -3761
teradataml/scriptmgmt/__init__.py +3 -3
teradataml/scriptmgmt/lls_utils.py +1719 -1604
teradataml/series/series.py +532 -532
teradataml/series/series_utils.py +71 -71
teradataml/table_operators/Apply.py +949 -917
teradataml/table_operators/Script.py +1718 -1982
teradataml/table_operators/TableOperator.py +1255 -1616
teradataml/table_operators/__init__.py +2 -3
teradataml/table_operators/apply_query_generator.py +262 -262
teradataml/table_operators/query_generator.py +507 -507
teradataml/table_operators/table_operator_query_generator.py +460 -460
teradataml/table_operators/table_operator_util.py +631 -639
teradataml/table_operators/templates/dataframe_apply.template +184 -184
teradataml/table_operators/templates/dataframe_map.template +176 -176
teradataml/table_operators/templates/script_executor.template +170 -170
teradataml/utils/dtypes.py +684 -684
teradataml/utils/internal_buffer.py +84 -84
teradataml/utils/print_versions.py +205 -205
teradataml/utils/utils.py +410 -410
teradataml/utils/validators.py +2277 -2115
{teradataml-17.20.0.7.dist-info → teradataml-20.0.0.1.dist-info}/METADATA +346 -45
teradataml-20.0.0.1.dist-info/RECORD +1056 -0
{teradataml-17.20.0.7.dist-info → teradataml-20.0.0.1.dist-info}/WHEEL +1 -1
{teradataml-17.20.0.7.dist-info → teradataml-20.0.0.1.dist-info}/zip-safe +1 -1
teradataml/analytics/mle/AdaBoost.py +0 -651
teradataml/analytics/mle/AdaBoostPredict.py +0 -564
teradataml/analytics/mle/Antiselect.py +0 -342
teradataml/analytics/mle/Arima.py +0 -641
teradataml/analytics/mle/ArimaPredict.py +0 -477
teradataml/analytics/mle/Attribution.py +0 -1070
teradataml/analytics/mle/Betweenness.py +0 -658
teradataml/analytics/mle/Burst.py +0 -711
teradataml/analytics/mle/CCM.py +0 -600
teradataml/analytics/mle/CCMPrepare.py +0 -324
teradataml/analytics/mle/CFilter.py +0 -460
teradataml/analytics/mle/ChangePointDetection.py +0 -572
teradataml/analytics/mle/ChangePointDetectionRT.py +0 -477
teradataml/analytics/mle/Closeness.py +0 -737
teradataml/analytics/mle/ConfusionMatrix.py +0 -420
teradataml/analytics/mle/Correlation.py +0 -477
teradataml/analytics/mle/Correlation2.py +0 -573
teradataml/analytics/mle/CoxHazardRatio.py +0 -679
teradataml/analytics/mle/CoxPH.py +0 -556
teradataml/analytics/mle/CoxSurvival.py +0 -478
teradataml/analytics/mle/CumulativeMovAvg.py +0 -363
teradataml/analytics/mle/DTW.py +0 -623
teradataml/analytics/mle/DWT.py +0 -564
teradataml/analytics/mle/DWT2D.py +0 -599
teradataml/analytics/mle/DecisionForest.py +0 -716
teradataml/analytics/mle/DecisionForestEvaluator.py +0 -363
teradataml/analytics/mle/DecisionForestPredict.py +0 -561
teradataml/analytics/mle/DecisionTree.py +0 -830
teradataml/analytics/mle/DecisionTreePredict.py +0 -528
teradataml/analytics/mle/ExponentialMovAvg.py +0 -418
teradataml/analytics/mle/FMeasure.py +0 -402
teradataml/analytics/mle/FPGrowth.py +0 -734
teradataml/analytics/mle/FrequentPaths.py +0 -695
teradataml/analytics/mle/GLM.py +0 -558
teradataml/analytics/mle/GLML1L2.py +0 -547
teradataml/analytics/mle/GLML1L2Predict.py +0 -519
teradataml/analytics/mle/GLMPredict.py +0 -529
teradataml/analytics/mle/HMMDecoder.py +0 -945
teradataml/analytics/mle/HMMEvaluator.py +0 -901
teradataml/analytics/mle/HMMSupervised.py +0 -521
teradataml/analytics/mle/HMMUnsupervised.py +0 -572
teradataml/analytics/mle/Histogram.py +0 -561
teradataml/analytics/mle/IDWT.py +0 -476
teradataml/analytics/mle/IDWT2D.py +0 -493
teradataml/analytics/mle/IdentityMatch.py +0 -763
teradataml/analytics/mle/Interpolator.py +0 -918
teradataml/analytics/mle/KMeans.py +0 -485
teradataml/analytics/mle/KNN.py +0 -627
teradataml/analytics/mle/KNNRecommender.py +0 -488
teradataml/analytics/mle/KNNRecommenderPredict.py +0 -581
teradataml/analytics/mle/LAR.py +0 -439
teradataml/analytics/mle/LARPredict.py +0 -478
teradataml/analytics/mle/LDA.py +0 -548
teradataml/analytics/mle/LDAInference.py +0 -492
teradataml/analytics/mle/LDATopicSummary.py +0 -464
teradataml/analytics/mle/LevenshteinDistance.py +0 -450
teradataml/analytics/mle/LinReg.py +0 -433
teradataml/analytics/mle/LinRegPredict.py +0 -438
teradataml/analytics/mle/MinHash.py +0 -544
teradataml/analytics/mle/Modularity.py +0 -587
teradataml/analytics/mle/NEREvaluator.py +0 -410
teradataml/analytics/mle/NERExtractor.py +0 -595
teradataml/analytics/mle/NERTrainer.py +0 -458
teradataml/analytics/mle/NGrams.py +0 -570
teradataml/analytics/mle/NPath.py +0 -634
teradataml/analytics/mle/NTree.py +0 -549
teradataml/analytics/mle/NaiveBayes.py +0 -462
teradataml/analytics/mle/NaiveBayesPredict.py +0 -513
teradataml/analytics/mle/NaiveBayesTextClassifier.py +0 -607
teradataml/analytics/mle/NaiveBayesTextClassifier2.py +0 -531
teradataml/analytics/mle/NaiveBayesTextClassifierPredict.py +0 -799
teradataml/analytics/mle/NamedEntityFinder.py +0 -529
teradataml/analytics/mle/NamedEntityFinderEvaluator.py +0 -414
teradataml/analytics/mle/NamedEntityFinderTrainer.py +0 -396
teradataml/analytics/mle/POSTagger.py +0 -417
teradataml/analytics/mle/Pack.py +0 -411
teradataml/analytics/mle/PageRank.py +0 -535
teradataml/analytics/mle/PathAnalyzer.py +0 -426
teradataml/analytics/mle/PathGenerator.py +0 -367
teradataml/analytics/mle/PathStart.py +0 -464
teradataml/analytics/mle/PathSummarizer.py +0 -470
teradataml/analytics/mle/Pivot.py +0 -471
teradataml/analytics/mle/ROC.py +0 -425
teradataml/analytics/mle/RandomSample.py +0 -637
teradataml/analytics/mle/RandomWalkSample.py +0 -490
teradataml/analytics/mle/SAX.py +0 -779
teradataml/analytics/mle/SVMDense.py +0 -677
teradataml/analytics/mle/SVMDensePredict.py +0 -536
teradataml/analytics/mle/SVMDenseSummary.py +0 -437
teradataml/analytics/mle/SVMSparse.py +0 -557
teradataml/analytics/mle/SVMSparsePredict.py +0 -553
teradataml/analytics/mle/SVMSparseSummary.py +0 -435
teradataml/analytics/mle/Sampling.py +0 -549
teradataml/analytics/mle/Scale.py +0 -565
teradataml/analytics/mle/ScaleByPartition.py +0 -496
teradataml/analytics/mle/ScaleMap.py +0 -378
teradataml/analytics/mle/ScaleSummary.py +0 -320
teradataml/analytics/mle/SentenceExtractor.py +0 -363
teradataml/analytics/mle/SentimentEvaluator.py +0 -432
teradataml/analytics/mle/SentimentExtractor.py +0 -578
teradataml/analytics/mle/SentimentTrainer.py +0 -405
teradataml/analytics/mle/SeriesSplitter.py +0 -641
teradataml/analytics/mle/Sessionize.py +0 -475
teradataml/analytics/mle/SimpleMovAvg.py +0 -397
teradataml/analytics/mle/StringSimilarity.py +0 -425
teradataml/analytics/mle/TF.py +0 -389
teradataml/analytics/mle/TFIDF.py +0 -504
teradataml/analytics/mle/TextChunker.py +0 -414
teradataml/analytics/mle/TextClassifier.py +0 -399
teradataml/analytics/mle/TextClassifierEvaluator.py +0 -413
teradataml/analytics/mle/TextClassifierTrainer.py +0 -565
teradataml/analytics/mle/TextMorph.py +0 -494
teradataml/analytics/mle/TextParser.py +0 -623
teradataml/analytics/mle/TextTagger.py +0 -530
teradataml/analytics/mle/TextTokenizer.py +0 -502
teradataml/analytics/mle/UnivariateStatistics.py +0 -488
teradataml/analytics/mle/Unpack.py +0 -526
teradataml/analytics/mle/Unpivot.py +0 -438
teradataml/analytics/mle/VarMax.py +0 -776
teradataml/analytics/mle/VectorDistance.py +0 -762
teradataml/analytics/mle/WeightedMovAvg.py +0 -400
teradataml/analytics/mle/XGBoost.py +0 -842
teradataml/analytics/mle/XGBoostPredict.py +0 -627
teradataml/analytics/mle/__init__.py +0 -123
teradataml/analytics/mle/json/adaboost_mle.json +0 -135
teradataml/analytics/mle/json/adaboostpredict_mle.json +0 -85
teradataml/analytics/mle/json/antiselect_mle.json +0 -34
teradataml/analytics/mle/json/antiselect_mle_mle.json +0 -34
teradataml/analytics/mle/json/arima_mle.json +0 -172
teradataml/analytics/mle/json/arimapredict_mle.json +0 -52
teradataml/analytics/mle/json/attribution_mle_mle.json +0 -143
teradataml/analytics/mle/json/betweenness_mle.json +0 -97
teradataml/analytics/mle/json/burst_mle.json +0 -140
teradataml/analytics/mle/json/ccm_mle.json +0 -124
teradataml/analytics/mle/json/ccmprepare_mle.json +0 -14
teradataml/analytics/mle/json/cfilter_mle.json +0 -93
teradataml/analytics/mle/json/changepointdetection_mle.json +0 -92
teradataml/analytics/mle/json/changepointdetectionrt_mle.json +0 -78
teradataml/analytics/mle/json/closeness_mle.json +0 -104
teradataml/analytics/mle/json/confusionmatrix_mle.json +0 -79
teradataml/analytics/mle/json/correlation_mle.json +0 -86
teradataml/analytics/mle/json/correlationreduce_mle.json +0 -49
teradataml/analytics/mle/json/coxhazardratio_mle.json +0 -89
teradataml/analytics/mle/json/coxph_mle.json +0 -98
teradataml/analytics/mle/json/coxsurvival_mle.json +0 -79
teradataml/analytics/mle/json/cumulativemovavg_mle.json +0 -34
teradataml/analytics/mle/json/decisionforest_mle.json +0 -167
teradataml/analytics/mle/json/decisionforestevaluator_mle.json +0 -33
teradataml/analytics/mle/json/decisionforestpredict_mle_mle.json +0 -74
teradataml/analytics/mle/json/decisiontree_mle.json +0 -194
teradataml/analytics/mle/json/decisiontreepredict_mle_mle.json +0 -86
teradataml/analytics/mle/json/dtw_mle.json +0 -97
teradataml/analytics/mle/json/dwt2d_mle.json +0 -116
teradataml/analytics/mle/json/dwt_mle.json +0 -101
teradataml/analytics/mle/json/exponentialmovavg_mle.json +0 -55
teradataml/analytics/mle/json/fmeasure_mle.json +0 -58
teradataml/analytics/mle/json/fpgrowth_mle.json +0 -159
teradataml/analytics/mle/json/frequentpaths_mle.json +0 -129
teradataml/analytics/mle/json/glm_mle.json +0 -111
teradataml/analytics/mle/json/glml1l2_mle.json +0 -106
teradataml/analytics/mle/json/glml1l2predict_mle.json +0 -57
teradataml/analytics/mle/json/glmpredict_mle_mle.json +0 -74
teradataml/analytics/mle/json/histogram_mle.json +0 -100
teradataml/analytics/mle/json/hmmdecoder_mle.json +0 -192
teradataml/analytics/mle/json/hmmevaluator_mle.json +0 -206
teradataml/analytics/mle/json/hmmsupervised_mle.json +0 -91
teradataml/analytics/mle/json/hmmunsupervised_mle.json +0 -114
teradataml/analytics/mle/json/identitymatch_mle.json +0 -88
teradataml/analytics/mle/json/idwt2d_mle.json +0 -73
teradataml/analytics/mle/json/idwt_mle.json +0 -66
teradataml/analytics/mle/json/interpolator_mle.json +0 -151
teradataml/analytics/mle/json/kmeans_mle.json +0 -97
teradataml/analytics/mle/json/knn_mle.json +0 -141
teradataml/analytics/mle/json/knnrecommender_mle.json +0 -111
teradataml/analytics/mle/json/knnrecommenderpredict_mle.json +0 -75
teradataml/analytics/mle/json/lar_mle.json +0 -78
teradataml/analytics/mle/json/larpredict_mle.json +0 -69
teradataml/analytics/mle/json/lda_mle.json +0 -130
teradataml/analytics/mle/json/ldainference_mle.json +0 -78
teradataml/analytics/mle/json/ldatopicsummary_mle.json +0 -64
teradataml/analytics/mle/json/levenshteindistance_mle.json +0 -92
teradataml/analytics/mle/json/linreg_mle.json +0 -42
teradataml/analytics/mle/json/linregpredict_mle.json +0 -56
teradataml/analytics/mle/json/minhash_mle.json +0 -113
teradataml/analytics/mle/json/modularity_mle.json +0 -91
teradataml/analytics/mle/json/naivebayespredict_mle_mle.json +0 -85
teradataml/analytics/mle/json/naivebayesreduce_mle.json +0 -52
teradataml/analytics/mle/json/naivebayestextclassifierpredict_mle_mle.json +0 -147
teradataml/analytics/mle/json/naivebayestextclassifiertrainer2_mle.json +0 -108
teradataml/analytics/mle/json/naivebayestextclassifiertrainer_mle.json +0 -102
teradataml/analytics/mle/json/namedentityfinder_mle.json +0 -84
teradataml/analytics/mle/json/namedentityfinderevaluatorreduce_mle.json +0 -43
teradataml/analytics/mle/json/namedentityfindertrainer_mle.json +0 -64
teradataml/analytics/mle/json/nerevaluator_mle.json +0 -54
teradataml/analytics/mle/json/nerextractor_mle.json +0 -87
teradataml/analytics/mle/json/nertrainer_mle.json +0 -89
teradataml/analytics/mle/json/ngrams_mle.json +0 -137
teradataml/analytics/mle/json/ngramsplitter_mle_mle.json +0 -137
teradataml/analytics/mle/json/npath@coprocessor_mle.json +0 -73
teradataml/analytics/mle/json/ntree@coprocessor_mle.json +0 -123
teradataml/analytics/mle/json/pack_mle.json +0 -58
teradataml/analytics/mle/json/pack_mle_mle.json +0 -58
teradataml/analytics/mle/json/pagerank_mle.json +0 -81
teradataml/analytics/mle/json/pathanalyzer_mle.json +0 -63
teradataml/analytics/mle/json/pathgenerator_mle.json +0 -40
teradataml/analytics/mle/json/pathstart_mle.json +0 -62
teradataml/analytics/mle/json/pathsummarizer_mle.json +0 -72
teradataml/analytics/mle/json/pivoting_mle.json +0 -71
teradataml/analytics/mle/json/postagger_mle.json +0 -51
teradataml/analytics/mle/json/randomsample_mle.json +0 -131
teradataml/analytics/mle/json/randomwalksample_mle.json +0 -85
teradataml/analytics/mle/json/roc_mle.json +0 -73
teradataml/analytics/mle/json/sampling_mle.json +0 -75
teradataml/analytics/mle/json/sax_mle.json +0 -154
teradataml/analytics/mle/json/scale_mle.json +0 -93
teradataml/analytics/mle/json/scalebypartition_mle.json +0 -89
teradataml/analytics/mle/json/scalemap_mle.json +0 -44
teradataml/analytics/mle/json/scalesummary_mle.json +0 -14
teradataml/analytics/mle/json/sentenceextractor_mle.json +0 -41
teradataml/analytics/mle/json/sentimentevaluator_mle.json +0 -43
teradataml/analytics/mle/json/sentimentextractor_mle.json +0 -100
teradataml/analytics/mle/json/sentimenttrainer_mle.json +0 -68
teradataml/analytics/mle/json/seriessplitter_mle.json +0 -133
teradataml/analytics/mle/json/sessionize_mle_mle.json +0 -62
teradataml/analytics/mle/json/simplemovavg_mle.json +0 -48
teradataml/analytics/mle/json/stringsimilarity_mle.json +0 -50
teradataml/analytics/mle/json/stringsimilarity_mle_mle.json +0 -50
teradataml/analytics/mle/json/svmdense_mle.json +0 -165
teradataml/analytics/mle/json/svmdensepredict_mle.json +0 -95
teradataml/analytics/mle/json/svmdensesummary_mle.json +0 -58
teradataml/analytics/mle/json/svmsparse_mle.json +0 -148
teradataml/analytics/mle/json/svmsparsepredict_mle_mle.json +0 -103
teradataml/analytics/mle/json/svmsparsesummary_mle.json +0 -57
teradataml/analytics/mle/json/textchunker_mle.json +0 -40
teradataml/analytics/mle/json/textclassifier_mle.json +0 -51
teradataml/analytics/mle/json/textclassifierevaluator_mle.json +0 -43
teradataml/analytics/mle/json/textclassifiertrainer_mle.json +0 -103
teradataml/analytics/mle/json/textmorph_mle.json +0 -63
teradataml/analytics/mle/json/textparser_mle.json +0 -166
teradataml/analytics/mle/json/texttagger_mle.json +0 -81
teradataml/analytics/mle/json/texttokenizer_mle.json +0 -91
teradataml/analytics/mle/json/tf_mle.json +0 -33
teradataml/analytics/mle/json/tfidf_mle.json +0 -34
teradataml/analytics/mle/json/univariatestatistics_mle.json +0 -81
teradataml/analytics/mle/json/unpack_mle.json +0 -91
teradataml/analytics/mle/json/unpack_mle_mle.json +0 -91
teradataml/analytics/mle/json/unpivoting_mle.json +0 -63
teradataml/analytics/mle/json/varmax_mle.json +0 -176
teradataml/analytics/mle/json/vectordistance_mle.json +0 -179
teradataml/analytics/mle/json/weightedmovavg_mle.json +0 -48
teradataml/analytics/mle/json/xgboost_mle.json +0 -178
teradataml/analytics/mle/json/xgboostpredict_mle.json +0 -104
teradataml/analytics/sqle/Antiselect.py +0 -321
teradataml/analytics/sqle/Attribution.py +0 -603
teradataml/analytics/sqle/DecisionForestPredict.py +0 -408
teradataml/analytics/sqle/GLMPredict.py +0 -430
teradataml/analytics/sqle/MovingAverage.py +0 -543
teradataml/analytics/sqle/NGramSplitter.py +0 -548
teradataml/analytics/sqle/NPath.py +0 -632
teradataml/analytics/sqle/NaiveBayesTextClassifierPredict.py +0 -515
teradataml/analytics/sqle/Pack.py +0 -388
teradataml/analytics/sqle/SVMSparsePredict.py +0 -464
teradataml/analytics/sqle/Sessionize.py +0 -390
teradataml/analytics/sqle/StringSimilarity.py +0 -400
teradataml/analytics/sqle/Unpack.py +0 -503
teradataml/analytics/sqle/json/antiselect_sqle.json +0 -21
teradataml/analytics/sqle/json/attribution_sqle.json +0 -92
teradataml/analytics/sqle/json/decisionforestpredict_sqle.json +0 -48
teradataml/analytics/sqle/json/glmpredict_sqle.json +0 -48
teradataml/analytics/sqle/json/h2opredict_sqle.json +0 -63
teradataml/analytics/sqle/json/movingaverage_sqle.json +0 -58
teradataml/analytics/sqle/json/naivebayestextclassifierpredict_sqle.json +0 -76
teradataml/analytics/sqle/json/ngramsplitter_sqle.json +0 -126
teradataml/analytics/sqle/json/npath_sqle.json +0 -67
teradataml/analytics/sqle/json/pack_sqle.json +0 -47
teradataml/analytics/sqle/json/pmmlpredict_sqle.json +0 -55
teradataml/analytics/sqle/json/sessionize_sqle.json +0 -43
teradataml/analytics/sqle/json/stringsimilarity_sqle.json +0 -39
teradataml/analytics/sqle/json/svmsparsepredict_sqle.json +0 -74
teradataml/analytics/sqle/json/unpack_sqle.json +0 -80
teradataml/catalog/model_cataloging.py +0 -980
teradataml/config/mlengine_alias_definitions_v1.0 +0 -118
teradataml/config/mlengine_alias_definitions_v1.1 +0 -127
teradataml/config/mlengine_alias_definitions_v1.3 +0 -129
teradataml/table_operators/sandbox_container_util.py +0 -643
teradataml-17.20.0.7.dist-info/RECORD +0 -1280
{teradataml-17.20.0.7.dist-info → teradataml-20.0.0.1.dist-info}/top_level.txt +0 -0

teradataml/opensource/sklearn/_sklearn_wrapper.py ADDED Viewed

@@ -0,0 +1,1715 @@
+# ##################################################################
+#
+# Copyright 2023 Teradata. All rights reserved.
+# TERADATA CONFIDENTIAL AND TRADE SECRET
+#
+# Primary Owner: Adithya Avvaru (adithya.avvaru@teradata.com)
+# Secondary Owner: Pankaj Purandare (pankajvinod.purandare@teradata.com)
+#
+# Version: 1.0
+# Function Version: 1.0
+#
+# This file contains object wrapper class for opensource packages and child object
+# wrapper classes for each opensource package. Currently, we have child object
+# wrapper class for scikit-learn.
+#
+# ##################################################################
+from collections import OrderedDict, defaultdict
+from importlib import import_module
+import base64
+import functools
+import json
+import numpy
+import os
+import pickle
+import time
+import inspect
+import warnings
+import json
+import random
+import pandas as pd
+from teradatasqlalchemy import BLOB, CLOB, FLOAT, TIMESTAMP, VARCHAR, INTEGER
+import pandas.api.types as pt
+from teradataml import _TDML_DIRECTORY, Script, TeradataMlException, Apply
+from teradataml.dataframe.copy_to import _get_sqlalchemy_mapping
+from teradataml.common import pylogger
+from teradataml.common.utils import UtilFuncs
+from teradataml.context.context import _get_current_databasename, get_connection
+from teradataml.dbutils.filemgr import install_file, remove_file
+from teradataml.utils.utils import execute_sql
+from teradataml.options.configure import configure
+from teradataml.opensource.sklearn._wrapper_utils import _validate_fit_run, _generate_new_name,\
+    _validate_opensource_func_args, _derive_df_and_required_columns, _validate_df_query_type
+from teradataml.opensource.sklearn.constants import OpenSourcePackage, _OSML_MODELS_PRIMARY_INDEX,\
+    _OSML_MODELS_TABLE_NAME, _OSML_MODELS_TABLE_COLUMNS_TYPE_DICT, OpensourceModels,\
+    _OSML_ADDITIONAL_COLUMN_TYPES
+from teradataml.common.messagecodes import MessageCodes
+from teradataml.common.messages import Messages
+from teradataml.catalog.byom import save_byom, retrieve_byom, delete_byom
+from teradataml.dbutils.dbutils import _create_table
+from teradataml.utils.validators import _Validators
+from teradataml.dataframe.dataframe import DataFrame
+from teradataml.dataframe.dataframe_utils import DataFrameUtils
+from teradataml.scriptmgmt.lls_utils import create_env, get_env
+from teradataml.common.garbagecollector import GarbageCollector
+from teradataml.common.constants import TeradataConstants
+logger = pylogger.getLogger()
+validator = _Validators()
+installed_model_files = defaultdict(int)
+class _GenericObjectWrapper:
+    def __init__(self) -> None:
+        self._db_name = _get_current_databasename()
+        self._scripts_path = os.path.join(_TDML_DIRECTORY, "data", "scripts", "sklearn")
+        # Some random number to be used as partition value if partition_columns is None for fit().
+        self._default_data_partition_value = -1001
+        self.modelObj = None
+        self._model_data = None
+        self._tdml_tmp_dir = GarbageCollector._get_temp_dir_name()
+        self._env = None
+        self._is_lake_system = UtilFuncs._is_lake()
+        if self._is_lake_system:
+            if configure.openml_user_env is not None:
+                self._env = configure.openml_user_env
+            else:
+                self._create_or_get_env()
+        else:
+            execute_sql(f"SET SESSION SEARCHUIFDBPATH = {self._db_name};")
+    def _create_or_get_env(self):
+        """
+        Internal function to return the env if already exists else
+        creates the environment using template file and return the env.
+        """
+        # Get the template file path.
+        template_dir_path = os.path.join(_TDML_DIRECTORY, "data", "templates",
+                                         "open_source_ml.json")
+        # Read template file.
+        with open(template_dir_path, "r") as r_file:
+            data = json.load(r_file)
+        # Get env_name.
+        _env_name = data["env_specs"][0]["env_name"]
+        try:
+            # Call function to 'openml_env' get env.
+            self._env = get_env(_env_name)
+        except TeradataMlException as tdml_e:
+            # We will get here when error says, env does not exist otherwise raise the exception as is.
+            # Env does not exist so create one.
+            exc_msg = "Failed to execute get_env(). User environment '{}' not " \
+                      "found.".format(_env_name)
+            if exc_msg in tdml_e.args[0]:
+                print(f"No OpenAF environment with name '{_env_name}' found. Creating one with "\
+                      "latest supported python and required packages.")
+                _env = create_env(template=template_dir_path)
+            else:
+                raise tdml_e
+        except Exception as exc:
+            raise exc
+    def _get_columns_as_list(self, cols):
+        """
+        Internal function to get columns as list of strings.
+        Empty list is returned if cols is None.
+        """
+        if cols is None:
+            return []
+        if not isinstance(cols, list) and not isinstance(cols, tuple):
+            return [cols]
+        return cols
+    def _get_data_and_data_partition_columns(self, data, feature_columns, label_columns,
+                                             partition_columns=None, group_columns=[]):
+        """
+        Internal function to generate one new partition column (if not provided) and return
+        data and partition columns (either generated or passed one).
+        """
+        new_partition_columns = self._get_columns_as_list(partition_columns)
+        if not partition_columns:
+            # If partition column is not specified, create a partition column and run Script.
+            # This runs the Script in one AMP as we are partitioning data using this column
+            # which contains only one value.
+            new_partition_columns = [_generate_new_name(type="column")]
+            data = data.assign(**{new_partition_columns[0]: self._default_data_partition_value})
+        # Filter out partition columns from feature columns and label columns.
+        new_partition_columns_filtered = [col for col in new_partition_columns
+                                          if col not in (feature_columns + label_columns + group_columns)]
+        all_columns = feature_columns + label_columns + group_columns + new_partition_columns_filtered
+        return data.select(all_columns), new_partition_columns
+    def _run_script(self, data, command, partition_columns, return_types):
+        """
+        Internal function to run Script(), given the argument needed by STO's or
+        Apply's Script.
+        """
+        if isinstance(partition_columns, list) and len(partition_columns) == 0:
+            partition_columns = None
+        if self._is_lake_system:
+            obj = Apply(data=data,
+                        returns=OrderedDict(return_types),
+                        apply_command=command,
+                        data_partition_column=partition_columns,
+                        env_name=self._env,
+                        delimiter="\t")
+        else:
+            obj = Script(data=data,
+                         returns=OrderedDict(return_types),
+                         script_command=command,
+                         data_partition_column=partition_columns)
+            obj.check_reserved_keyword = False
+        obj.skip_argument_validation = True
+        return obj.execute_script(output_style="TABLE")
+    def _install_script_file(self,
+                             file_identifier=None,
+                             file_name=None,
+                             is_binary=False,
+                             file_location=None):
+        """
+        Internal function to install script file in Vantage.
+        """
+        if file_location is None:
+            file_location = self._scripts_path
+        new_script = os.path.join(file_location, file_name)
+        # _env is set while object creation
+        # If not set, it is Vantage Enterprise. Otherwise, it is Vantage Lake.
+        if not self._is_lake_system:
+            status = install_file(file_identifier=file_identifier,
+                                  file_path=new_script,
+                                  replace=True,
+                                  suppress_output=True,
+                                  is_binary=is_binary)
+        else:
+            status = self._env.install_file(file_path=new_script,
+                                       replace=True,
+                                       suppress_output=True)
+        if not status:
+            raise TeradataMlException(
+                f"Script file '{file_name}' failed to get installed/replaced in Vantage."
+            )
+    def _get_data_col_types_and_partition_col_indices_and_types(self, data, partition_columns,
+                                                                idx_delim=",",
+                                                                types_delim="--"):
+        """
+        Internal function to get the data column types and partition column names, indices and types.
+        Function returns delimiter separated string of types and indices if idx_delim and
+        types_delim are provided. Otherwise, it returns list of types and indices. Partition names
+        are returned as list always.
+        """
+        data_column_types = "" if types_delim else []
+        partition_indices = "" if idx_delim else []
+        partition_types = "" if types_delim else []
+        new_partition_columns = []
+        j = 0
+        for i, col in enumerate(data.columns):
+            _type = data._td_column_names_and_sqlalchemy_types[col.lower()].python_type.__name__
+            if types_delim:
+                data_column_types += (_type if i == 0 else f"{types_delim}{_type}")
+            else:
+                data_column_types.append(_type)
+            if col in partition_columns:
+                new_partition_columns.append(col)
+                if idx_delim:
+                    partition_indices += (str(i) if j == 0 else f"{idx_delim}{str(i)}")
+                else:
+                    partition_indices.append(i)
+                if types_delim:
+                    partition_types += (_type if j == 0 else f"{types_delim}{_type}")
+                else:
+                    partition_types.append(_type)
+                j += 1
+        # Return types of all columns (as list or str), partition column indices (as list or str)
+        # and partition column types (as list or str).
+        return data_column_types, partition_indices, partition_types, new_partition_columns
+    def _get_kwargs_str(self, kwargs):
+        """
+        Returns string of kwargs in the format:
+            key1 val1-type1 key2 val2-type2 ...
+        """
+        args_str = ""
+        for key, val in kwargs.items():
+            strr = f"{key} {str(val)}-{type(val).__name__}"
+            if args_str == "":
+                args_str += strr
+            else:
+                args_str += f" {strr}"
+        return args_str
+    def extract_sklearn_obj(self, n_unique_partitions = 1, n_partition_cols = 1):
+        """
+        Internal function to extract sklearn object from the model(s) depending on the number of
+        partitions. When it is only one model, it is directly used as sklearn object (modelObj).
+        When it is multiple models, it is converted to pandas DataFrame and stored in sklearn
+        object.
+        """
+        vals = execute_sql("select * from {}".format(self._model_data._table_name)).fetchall()
+        # pickle will issue a caution warning, if model pickling was done with
+        # different library version than used here. The following disables any warnings
+        # that might otherwise show in the scriptlog files on the Advanced SQL Engine
+        # nodes in this case. Yet, do keep an eye for incompatible pickle versions.
+        warnings.filterwarnings("ignore")
+        model_obj = None
+        # Extract and unpickle last column which is the model object.
+        for i, row in enumerate(vals):
+            if self._is_lake_system:
+                model_obj = pickle.loads(row[n_partition_cols])
+            else:
+                model_obj = pickle.loads(base64.b64decode(row[n_partition_cols].partition("'")[2]))
+            row[n_partition_cols] = model_obj
+            vals[i] = row
+        if n_unique_partitions == 1:
+            self.modelObj = model_obj
+        elif n_unique_partitions > 1:
+            self.modelObj = pd.DataFrame(vals, columns=self._model_data.columns)
+        else:
+            ValueError("Number of partitions should be greater than 0.")
+        warnings.filterwarnings("default")
+class _OpenSourceObjectWrapper(_GenericObjectWrapper):
+    # This has to be set for every package which subclasses this class.
+    OPENSOURCE_PACKAGE_NAME = None
+    def __init__(self, model=None, module_name=None, class_name=None, pos_args=None, kwargs=None):
+        if not model and not module_name and not class_name:
+            raise TeradataMlException(Messages.get_message(MessageCodes.EITHER_THIS_OR_THAT_ARGUMENT, "model",
+                                                           "module_name and class_name"),
+                                      MessageCodes.EITHER_THIS_OR_THAT_ARGUMENT)
+        validator._validate_mutually_inclusive_arguments(module_name, "module_name",
+                                                         class_name, "class_name")
+        super().__init__()
+        self.module_name = module_name
+        self.class_name = class_name
+        self.kwargs = kwargs if kwargs is not None else {}
+        self.pos_args = pos_args if pos_args is not None else tuple()
+        self._fit_label_columns_types = None
+        self._table_name_prefix = None
+        self._is_default_partition_value_fit = True # False when the user provides partition columns.
+        self._fit_partition_colums_non_default = None
+        self._is_default_partition_value_predict = True # False when the user provides partition columns.
+    def _validate_equality_of_partition_values(self, fit_values, trans_values):
+        """
+        Internal function to compare the partition values in fit() and predict() are same.
+        """
+        if len(fit_values) != len(trans_values):
+            return False
+        for val in fit_values:
+            if not all([val in trans_values]):
+                return False
+        return True
+    def _validate_unique_partition_values(self, data, partition_columns):
+        """
+        Internal function to validate if the partition values in partition_columns used in fit()
+        and predict() are same.
+        """
+        data._index_label = None
+        unique_values = data.drop_duplicate(partition_columns).get_values()
+        trans_unique_values = sorted(unique_values.tolist(), key=lambda x: tuple(x))
+        fit_unique_values = sorted(self._fit_partition_unique_values.tolist() \
+                                    if not isinstance(self._fit_partition_unique_values, list) \
+                                    else self._fit_partition_unique_values, key=lambda x: tuple(x))
+        default_unique_values = [[self._default_data_partition_value]]
+        if fit_unique_values == default_unique_values and \
+            trans_unique_values != default_unique_values:
+            error_msg = Messages.get_message(MessageCodes.PARTITION_IN_BOTH_FIT_AND_PREDICT,
+                                             "without", "with")
+            msg_code = MessageCodes.PARTITION_IN_BOTH_FIT_AND_PREDICT
+            raise TeradataMlException(error_msg, msg_code)
+        if not self._validate_equality_of_partition_values(fit_unique_values, trans_unique_values):
+            raise TeradataMlException(
+                Messages.get_message(MessageCodes.PARTITION_VALUES_NOT_MATCHING),
+                MessageCodes.PARTITION_VALUES_NOT_MATCHING
+            )
+    def fit(self, **kwargs):
+        pass
+    def __get_obj_attributes_multi_model(self, name):
+        """
+        Internal function to get attributes of all sklearn model objects when multiple models are
+        generated by fit.
+        """
+        # Wrapper function to invoke dynamic method, using arguments
+        # passed by user, on model in each row.
+        def __sklearn_method_invoker_for_multimodel(*c, **kwargs):
+            multi_models = self.modelObj.copy()
+            for i in range(multi_models.shape[0]):
+                curr_model = multi_models.iloc[i]["model"]
+                multi_models.at[i, "model"] = getattr(curr_model, name)(*c, **kwargs)
+            return multi_models.rename(columns={"model": name})
+        # Identify if attribute is callable or not to avoid
+        # this check in loop for every model.
+        is_attr_callable = False
+        # Assuming that self.modelObj will have at least 1 row.
+        is_attr_callable = callable(getattr(self.modelObj.iloc[0]["model"], name))
+        # If attribute is callable, it should be applied on model in each row
+        # using passed arguments.
+        if is_attr_callable:
+            return __sklearn_method_invoker_for_multimodel
+        output_attributes = self.modelObj.copy()
+        for i in range(output_attributes.shape[0]):
+            model = output_attributes.iloc[i]["model"]
+            output_attributes.at[i, "model"] = getattr(model, name)
+        return output_attributes.rename(columns={"model": name})
+    def __getattr__(self, name):
+        # This just run attributes (functions and properties) from sklearn object.
+        def __sklearn_method_invoker(*c, **kwargs):
+            return atrribute_instance(*c, **kwargs)
+        if isinstance(self.modelObj, pd.DataFrame):
+            return self.__get_obj_attributes_multi_model(name)
+        atrribute_instance = getattr(self.modelObj, name)
+        if callable(atrribute_instance):
+            return __sklearn_method_invoker
+        return atrribute_instance
+    @classmethod
+    def _validate_model_supportability(cls, model):
+        """
+        Internal function to validate if the model provided for deployment is supported by
+        teradataml's opensourceML.
+        """
+        error_msg = Messages.get_message(MessageCodes.MODEL_CATALOGING_OPERATION_FAILED, "validate",
+                                         "The given model is not a supported opensource model.")
+        msg_code = MessageCodes.MODEL_CATALOGING_OPERATION_FAILED
+        try:
+            # For scikit-learn, model.__module__ is similar to 'sklearn.linear_model._base'.
+            # TODO: check for other supported packages.
+            if model.__module__.split(".")[0] not in OpenSourcePackage.values():
+                raise TeradataMlException(error_msg, msg_code)
+        except Exception as ex:
+            # If in case, model.__module__ fails.
+            raise TeradataMlException(error_msg, msg_code) from ex
+    def _save_model(self, model_name, replace_if_exists=False):
+        """
+        Internal function to save the model stored in file at location mentioned by class variable
+        "model_file_path_local" to Vantage using BYOM methods save_byom() and delete_byom() based
+        on the value of "replace_if_exists" argument.
+        """
+        # Creating a table, if doesn't exist, in Vantage to store the model info.
+        conn = get_connection()
+        osml_models_table_exists = conn.dialect.has_table(conn,
+                                                          table_name=_OSML_MODELS_TABLE_NAME,
+                                                          schema=self._db_name)
+        if not osml_models_table_exists:
+            all_columns = _OSML_MODELS_TABLE_COLUMNS_TYPE_DICT.copy()
+            all_columns.update(_OSML_ADDITIONAL_COLUMN_TYPES)
+            _create_table(table_name=_OSML_MODELS_TABLE_NAME, columns=all_columns,
+                          primary_index=_OSML_MODELS_PRIMARY_INDEX, schema_name=self._db_name)
+        model_obj = OpensourceModels(is_default_partition_value=self._is_default_partition_value_fit,
+                                     partition_file_prefix=self._model_file_name_prefix,
+                                     fit_partition_columns_non_default=self._fit_partition_colums_non_default,
+                                     model=self.modelObj,
+                                     pos_args=self.pos_args,
+                                     key_args=self.kwargs)
+        # Saved the model object to a file to be used in save_byom() for writing to Vantage table.
+        file_name = os.path.join(self._tdml_tmp_dir, "deployed_file.pickle")
+        with open(file_name, "wb+") as fp:
+            fp.write(pickle.dumps(model_obj))
+        try:
+            save_byom(model_id=model_name,
+                    model_file=file_name,
+                    table_name=_OSML_MODELS_TABLE_NAME,
+                    additional_columns_types=_OSML_ADDITIONAL_COLUMN_TYPES,
+                    additional_columns={"package": self.OPENSOURCE_PACKAGE_NAME.value})
+        except TeradataMlException as ex:
+            model_exists_msg = Messages.get_message(MessageCodes.MODEL_ALREADY_EXISTS, model_name)
+            if not replace_if_exists and model_exists_msg == str(ex):
+                raise
+            elif replace_if_exists and model_exists_msg == str(ex):
+                # Delete the model from Model table and save again.
+                delete_byom(model_id=model_name, table_name=_OSML_MODELS_TABLE_NAME)
+                save_byom(model_id=model_name,
+                          model_file=file_name,
+                          table_name=_OSML_MODELS_TABLE_NAME,
+                          additional_columns_types=_OSML_ADDITIONAL_COLUMN_TYPES,
+                          additional_columns={"package": self.OPENSOURCE_PACKAGE_NAME.value})
+            else:
+                raise
+        finally:
+            os.remove(file_name)
+    @classmethod
+    def _deploy(cls, model_name, model, replace_if_exists=False):
+        """
+        Internal function to create an instance of the class using the model and deploy
+        the model to Vantage.
+        """
+        cls._validate_model_supportability(model=model)
+        cls = cls(model=model)
+        # Load the model file into Vantage node as file can be used in
+        # predict or other operations.
+        cls._install_initial_model_file()
+        cls._save_model(model_name, replace_if_exists)
+        return cls
+    @classmethod
+    def _load(cls, model_name):
+        """
+        Internal function to load model corresponding to the package (like sklearn etc)
+        from Vantage to client using retrieve_byom() and create an instance of the class if
+        the model is from the same package.
+        """
+        try:
+            model = retrieve_byom(model_id=model_name, table_name=_OSML_MODELS_TABLE_NAME,
+                                  return_addition_columns=True)
+        except TeradataMlException as ex:
+            # Not showing table name in error message as it is an internal table.
+            part_msg = f"Model '{model_name}' not found in the table "
+            if part_msg in str(ex):
+                raise TeradataMlException(Messages.get_message(MessageCodes.MODEL_NOT_FOUND, model_name, ""),
+                                          MessageCodes.MODEL_NOT_FOUND)
+            raise
+        model_vals_list = model.get_values()[0]
+        # List of 3 elements -
+        #   - model name as index column,
+        #   - 1st contains model object with fields: is_default_partition_value, partition_file_prefix, model. etc
+        #   - 2nd contains package name.
+        model_obj = pickle.loads(model_vals_list[0])
+        model = model_obj.model
+        package = model_vals_list[1]
+        if package != cls.OPENSOURCE_PACKAGE_NAME.value:
+            # Raise error if trying to access model of different package.
+            raise TeradataMlException(Messages.get_message(MessageCodes.MODEL_NOT_FOUND, model_name,
+                                        f". Requested model is from '{package}' package"),
+                                      MessageCodes.MODEL_NOT_FOUND)
+        if isinstance(model, pd.DataFrame):
+            # Create a new instance of the class and set the model object to the instance.
+            # Instantiation can take only model, not model object. Hence, passing one of the model
+            # from pandas df. Updating modelObj and other fields later
+            cls = cls(model=model.iloc[1,2])
+            cls.modelObj = model
+            cls._fit_partition_unique_values = [lst[:len(lst)-1] for lst in model.values.tolist()]
+        else:
+            cls = cls(model=model)
+        cls._model_file_name_prefix = model_obj.partition_file_prefix
+        cls._is_default_partition_value_fit = model_obj.is_default_partition_value
+        cls._fit_partition_colums_non_default = model_obj.fit_partition_columns_non_default
+        cls.pos_args = model_obj.pos_args
+        cls.kwargs = model_obj.key_args
+        # Load the model file into Vantage node as file can be used in
+        # predict or other operations.
+        cls._install_initial_model_file()
+        return cls
+    def deploy(self, model_name, replace_if_exists=False):
+        """
+        DESCRIPTION:
+            Deploys the model held by interface object to Vantage.
+        PARAMETERS:
+            model_name:
+                Required Argument.
+                Specifies the unique name of the model to be deployed.
+                Types: str
+            replace_if_exists:
+                Optional Argument.
+                Specifies whether to replace the model if a model with the same name already
+                exists in Vantage. If this argument is set to False and a model with the same
+                name already exists, then the function raises an exception.
+                Default Value: False
+                Types: bool
+        RETURNS:
+            The opensource object wrapper.
+        RAISES:
+            TeradataMLException if model with "model_name" already exists and the argument
+            "replace_if_exists" is set to False.
+        EXAMPLES:
+            >>> from teradataml import td_sklearn
+            >>> model = td_sklearn.LinearRegression(normalize=True)
+            >>> model
+            LinearRegression(normalize=True)
+            # Example 1: Deploy the model held by interface object to Vantage.
+            >>> lin_reg = model.deploy("linreg_model_ver_2")
+            Model is saved.
+            >>> lin_reg
+            LinearRegression(normalize=True)
+            # Example 2: Deploy the model held by interface object to Vantage with the name same
+            #            as that of model that already existed in Vantage.
+            >>> lin_reg = model.deploy("linreg_model_ver_2", replace_if_exists=True)
+            Model is deleted.
+            Model is saved.
+            >>> lin_reg
+            LinearRegression(normalize=True)
+        """
+        # Install model file into Vantage, if not installed.
+        self._install_initial_model_file()
+        self._save_model(model_name, replace_if_exists)
+        return self
+class _SkLearnObjectWrapper(_OpenSourceObjectWrapper):
+    OPENSOURCE_PACKAGE_NAME = OpenSourcePackage.SKLEARN
+    def __init__(self, model=None, module_name=None, class_name=None, pos_args=None, kwargs=None):
+        super().__init__(model=model, module_name=module_name, class_name=class_name,
+                         pos_args=pos_args, kwargs=kwargs)
+        self._initialize_variables()
+        if model:
+            self.modelObj = model
+            self.module_name = model.__module__.split("._")[0]
+            self.class_name = model.__class__.__name__
+            # __dict__ gets all the arguments as dictionary including default ones and positional
+            # args.
+            self.kwargs = model.__dict__
+            self.pos_args = tuple() # Kept empty as all are moved to kwargs.
+        else:
+            self._initialize_object()
+    def __repr__(self):
+        if self._is_default_partition_value_fit:
+            # Single model use case.
+            return self.modelObj.__repr__()
+        pd.set_option("display.expand_frame_repr", None)
+        pd.set_option("display.max_colwidth", None)
+        opt = self.modelObj.__repr__()
+        pd.reset_option("display.expand_frame_repr")
+        pd.reset_option("display.max_colwidth")
+        return opt
+    def _validate_args_and_get_data(self, X=None, y=None, groups=None, kwargs={},
+                                    skip_either_or_that=False):
+        """
+        Internal function to validate arguments passed to exposed opensource APIs and return
+        parent DataFrame, feature columns, label columns, group columns, data partition columns.
+        """
+        _validate_opensource_func_args(X=X, y=y, groups=groups,
+                                       fit_partition_cols=self._fit_partition_colums_non_default,
+                                       kwargs=kwargs,
+                                       skip_either_or_that=skip_either_or_that)
+        return _derive_df_and_required_columns(X=X, y=y, groups=groups, kwargs=kwargs,
+                                        fit_partition_cols=self._fit_partition_colums_non_default)
+    def _initialize_object(self):
+        """
+        Internal function to initialize sklearn object from module name and class name.
+        """
+        # Needed when writing imported modules to generated file. TODO: Remove later.
+        imported_args = {}
+        # If there are any objects of class `_SkLearnObjectWrapper`, it is modified to
+        # corresponding sklearn object.
+        new_sklearn_pos_args = self.modify_args(None, self.pos_args, imported_args)
+        new_sklearn_kwargs = self.modify_args(None, self.kwargs, imported_args)
+        # Create model object from new positional and keyword arguments.
+        class_obj = getattr(import_module(self.module_name), self.class_name)
+        if new_sklearn_pos_args:
+            self.modelObj = class_obj(*new_sklearn_pos_args, **new_sklearn_kwargs)
+        else:
+            self.modelObj = class_obj(**new_sklearn_kwargs)
+        # All arguments are moved to kwargs and kept pos_args empty.
+        # Might help in set_params() bug fix.
+        self.pos_args = tuple()
+        _arguments = self.modelObj.__dict__
+        if hasattr(self.modelObj, "get_params"):
+            # Update kwargs that are both in modelObj and get_params() as there are
+            # some classes which return other internals variables also.
+            # Hence, filtering them using get_params().
+            for k, v in _arguments.items():
+                if type(v).__name__ in ["function", "generator"]:
+                    # TODO: ELE-6351: Skipping adding functions and generators to kwargs as these
+                    #       are not supported yet due to pickling issue.
+                    continue
+                if k in self.get_params():
+                    self.kwargs[k] = v
+        else:
+            # Model selection classes will not have `get_params`, in which case modelObj's __dict__
+            # is saved as kwargs.
+            self.kwargs = _arguments
+    def _initialize_variables(self):
+        """
+        Internal function to initialize variables used in this class.
+        """
+        self.feature_names_in_ = None
+        self._table_name_prefix = "td_sklearn_"
+        self._model_file_name_prefix = _generate_new_name(type="file")
+        self.model_file_paths_local = set()
+        self._fit_execution_time = None
+        self._fit_predict_execution_time = None
+        self._partial_fit_execution_time = None
+        self._predict_execution_time = None
+        self._transform_execution_time = None
+        self._score_execution_time = None
+        # Set to partition columns when training is done with partition columns.
+        self._fit_partition_colums_non_default = None
+        self._is_model_installed = False
+        self._fit_partition_unique_values = [[self._default_data_partition_value]]
+    def modify_args(self, fp1, arg, imported_args):
+        """
+        Internal function to recursively (if "arg" is list/tuple/dict) check if any sklearn object
+        of opensourceML is present in the argument "arg" and modify it to corresponding sklearn
+        object.
+        This function can also be used to write import statements to file (if "fp1" is not
+        None). Update "imported_args" dictionary with imported module and class name to avoid
+        importing same module and class again when writing to file. This is useful when we want to
+        generate script from template file.
+        Pass None to "fp1" if we don't want to write to file and just modify opensourceML sklearn
+        object to corresponding sklearn object.
+        """
+        if isinstance(arg, type(self)):
+            imported_tuple = (arg.module_name, arg.class_name)
+            already_imported = imported_args.get(imported_tuple, False)
+            if not already_imported:
+                imported_args[imported_tuple] = True
+                if fp1:
+                    fp1.write(f"from {arg.module_name} import {arg.class_name}\n")
+                self.modify_args(fp1, arg.pos_args, imported_args)
+                self.modify_args(fp1, arg.kwargs, imported_args)
+            return arg.modelObj
+        elif isinstance(arg, list):
+            return [self.modify_args(fp1, val, imported_args) for val in arg]
+        elif isinstance(arg, tuple):
+            return tuple([self.modify_args(fp1, val, imported_args) for val in arg])
+        elif type(arg).__name__ == "generator":
+            # Raising exception as generator object can't be pickled.
+            # TODO: ELE-6351 - Find ways to pickle generator object later.
+            raise ValueError("Generator type/iterator is not supported for any argument. "\
+                             "Support will be added later.")
+        elif type(arg).__name__ == "function":
+            # Raising exception as functions/lambda functions can't be pickled.
+            # TODO: ELE-6351 - Find ways to pickle functions later.
+            raise ValueError("Functions are not supported for any argument. "\
+                             "Support will be added later.")
+        elif isinstance(arg, dict):
+            return dict(
+                (
+                    self.modify_args(fp1, k, imported_args),
+                    self.modify_args(fp1, v, imported_args),
+                )
+                for k, v in arg.items()
+            )
+        else:
+            return arg
+    def _install_initial_model_file(self):
+        """
+        If model file(s) is/are not installed in Vantage, then install it/them.
+        """
+        if isinstance(self.modelObj, pd.DataFrame):
+            # Get list of unique partition values and corresponding model object as dict.
+            partition_values_model_dict = {}
+            obj_list = self.modelObj.values.tolist()
+            for lst in obj_list:
+                partition_values_model_dict[tuple(lst[:len(lst)-1])] = lst[len(lst)-1]
+        for partition in self._fit_partition_unique_values:
+            # Create a new file with file name with partition values and
+            # dump sklearn object into it. Finally install the file to Vantage.
+            partition_join = "_".join([str(x) for x in partition])
+            file_name = f"{self._model_file_name_prefix}_{partition_join}"
+            # Replace '-' with '_' as '-' can't be present in file identifier.
+            # Needed this replace because partition_columns can be negative.
+            file_name = file_name.replace("-", "_")
+            full_file_name = os.path.join(self._tdml_tmp_dir, file_name)
+            with open(full_file_name, "wb+") as fp:
+                # Write sklearn object to file.
+                if isinstance(self.modelObj, pd.DataFrame):
+                    # If multiple models, then write the model corresponding to the partition value.
+                    fp.write(pickle.dumps(partition_values_model_dict[tuple(partition)]))
+                else:
+                    fp.write(pickle.dumps(self.modelObj))
+            self.model_file_paths_local.add(file_name)
+            self._install_script_file(file_identifier=file_name,
+                                      file_name=file_name,
+                                      is_binary=True,
+                                      file_location=self._tdml_tmp_dir)
+            if self._is_lake_system:
+                # Need to pass env_name along with file_name for cleaning up the files in env.
+                obj = f"{self._env.env_name}::{file_name}"
+                if installed_model_files[obj] == 0:
+                    # Add to GC for the first time the model file (along with env name) is encountered.
+                    installed_model_files[obj] = 1
+                    GarbageCollector._add_to_garbagecollector(object_name=obj,
+                                                object_type=TeradataConstants.TERADATA_APPLY)
+            else:
+                if installed_model_files[file_name] == 0:
+                    # Add to GC for the first time the model file is encountered.
+                    installed_model_files[file_name] = 1
+                    GarbageCollector._add_to_garbagecollector(object_name=file_name,
+                                                object_type=TeradataConstants.TERADATA_SCRIPT)
+            self._is_model_installed = True
+    def _run_fit_related_functions(self,
+                                   data,
+                                   feature_columns,
+                                   label_columns,
+                                   partition_columns,
+                                   func,
+                                   classes=None):
+        """
+        Internal function to run fit() and partial_fit() functions.
+        """
+        label_columns = self._get_columns_as_list(label_columns)
+        data, new_partition_columns = self._get_data_and_data_partition_columns(data,
+                                                                                feature_columns,
+                                                                                label_columns,
+                                                                                partition_columns)
+        model_type = BLOB() if self._is_lake_system else CLOB()
+        return_types = [(col, data._td_column_names_and_sqlalchemy_types[col.lower()])
+                        for col in new_partition_columns] + [("model", model_type)]
+        file_name = "sklearn_fit.py"
+        self._install_script_file(file_identifier=file_name.split(".")[0], file_name=file_name)
+        if classes:
+            class_type = type(classes[0]).__name__
+            classes = "--".join([str(x) for x in classes])
+        else:
+            classes = str(None)
+            class_type = str(None)
+        data_column_types_str, partition_indices_str, _, new_partition_columns = \
+            self._get_data_col_types_and_partition_col_indices_and_types(data, new_partition_columns)
+        # db_name is applicable for enterprise system.
+        db_file_name = file_name if self._is_lake_system else f"./{self._db_name}/{file_name}"
+        py_exc = UtilFuncs._get_python_execution_path()
+        script_command = f"{py_exc} {db_file_name} {func} {len(feature_columns)} "\
+            f"{len(label_columns)} {partition_indices_str} {data_column_types_str} "\
+            f"{self._model_file_name_prefix} {classes} {class_type} {self._is_lake_system}"
+        # Get unique values in partitioning columns.
+        self._fit_partition_unique_values = data.drop_duplicate(new_partition_columns).get_values()
+        self._install_initial_model_file()
+        self._model_data = self._run_script(data, script_command, new_partition_columns,
+                                            return_types)
+        # Extract sklearn object(s) from the depending on the number of unique partitioning values.
+        self.extract_sklearn_obj(n_unique_partitions=len(self._fit_partition_unique_values),
+                                 n_partition_cols=len(new_partition_columns))
+        # Need this label columns types in prediction.
+        self._fit_label_columns_types = [data._td_column_names_and_sqlalchemy_types[l_c.lower()]
+                                         for l_c in label_columns]
+    def partial_fit(self, X=None, y=None, classes=None, **kwargs):
+        """
+        Please check the description in Docs/OpensourceML/sklearn.py.
+        """
+        st_time = time.time()
+        # "classes" argument validation.
+        arg_info_matrix = []
+        arg_info_matrix.append(["classes", classes, True, (list)])
+        _Validators._validate_function_arguments(arg_info_matrix)
+        self._is_default_partition_value_fit = True # False when the user provides partition columns.
+        data, feature_columns, label_columns, _, partition_columns = \
+            self._validate_args_and_get_data(X=X, y=y, groups=None, kwargs=kwargs)
+        if partition_columns:
+            self._is_default_partition_value_fit = False
+            self._fit_partition_colums_non_default = partition_columns
+        self._run_fit_related_functions(data,
+                                        feature_columns,
+                                        label_columns,
+                                        partition_columns,
+                                        inspect.stack()[0][3],
+                                        classes)
+        self._partial_fit_execution_time = time.time() - st_time
+        return self
+    def fit(self, X=None, y=None, **kwargs):
+        """
+        Please check the description in Docs/OpensourceML/sklearn.py.
+        """
+        st_time = time.time()
+        self._is_default_partition_value_fit = True # False when the user provides partition columns.
+        data, feature_columns, label_columns, _, partition_columns = \
+            self._validate_args_and_get_data(X=X, y=y, groups=None, kwargs=kwargs)
+        if partition_columns:
+            self._is_default_partition_value_fit = False
+            self._fit_partition_colums_non_default = partition_columns
+        self._run_fit_related_functions(data,
+                                        feature_columns,
+                                        label_columns,
+                                        partition_columns,
+                                        inspect.stack()[0][3])
+        self._fit_execution_time = time.time() - st_time
+        return self
+    def set_params(self, **params):
+        """
+        Please check the description in Docs/OpensourceML/sklearn.py.
+        """
+        for key, val in params.items():
+            self.kwargs[key] = val
+        # Initialize with new arguments and return the class/model object.
+        # set_params takes all keyword arguments and no positional arguments.
+        self.__init__(None, self.module_name, self.class_name, tuple(), self.kwargs)
+        return self
+    # get_params() will be executed through __getattr__().
+    # @_validate_fit_run
+    def __getattr__(self, name):
+        def __run_transform(*c, **kwargs):
+            kwargs["name"] = name
+            return self._transform(*c, **kwargs)
+        def __run_function_needing_all_rows(*c, **kwargs):
+            kwargs["name"] = name
+            return self._run_function_needing_all_rows(*c, **kwargs)
+        def __run_kneighbors(*c, **kwargs):
+            kwargs["name"] = name
+            return self._run_neighbors(*c, **kwargs)
+        if name in ["score", "aic", "bic", "perplexity"]:
+            # TODO: ELE-6352 - Implement error_norm() function later.
+            return __run_function_needing_all_rows
+        if name in ["kneighbors",
+                    "radius_neighbors",
+                    "kneighbors_graph",
+                    "radius_neighbors_graph"]:
+            return __run_kneighbors
+        if name in ["predict",
+                    "transform",
+                    "inverse_transform",
+                    "predict_proba",
+                    "predict_log_proba",
+                    "decision_function",
+                    "score_samples",
+                    "decision_path",
+                    "apply",
+                    "cost_complexity_pruning_path",
+                    "gibbs",
+                    "kneighbors_graph",
+                    "radius_neighbors_graph",
+                    "mahalanobis",
+                    "correct_covariance",
+                    "reweight_covariance",
+                    "path"]:
+            return __run_transform
+        return super().__getattr__(name)
+    def _get_return_columns_for_function_(self,
+                                          data,
+                                          feature_columns,
+                                          label_columns,
+                                          func_name,
+                                          kwargs):
+        """
+        Internal function to return list of column names and their sqlalchemy types
+        which should be used in return_types of Script.
+        """
+        if func_name == "fit_predict":
+            """
+            Get return columns using label_columns.
+            """
+            return [(f"{self.class_name.lower()}_{func_name}_{(i + 1)}",
+                     data._td_column_names_and_sqlalchemy_types[col.lower()])
+                    for i, col in enumerate(label_columns)]
+        if func_name == "predict":
+            """
+            Return predict columns using either label_columns (if provided) or
+            self._fit_label_columns_types (if the function is trained using label columns).
+            Otherwise run predict on ten rows of data to get the number of columns and their types
+            after this if condition.
+            """
+            if label_columns:
+                return [(f"{self.class_name.lower()}_{func_name}_{(i + 1)}",
+                         data._td_column_names_and_sqlalchemy_types[col.lower()])
+                             for i, col in enumerate(label_columns)]
+            if self._fit_label_columns_types:
+                return [(f"{self.class_name.lower()}_{func_name}_{(i + 1)}", col_type)
+                        for i, col_type in enumerate(self._fit_label_columns_types)]
+        data = data.select(feature_columns + label_columns)
+        ## If function is not `fit_predict`:
+        #   then take one row of transform/other functions to execute in client
+        #   to get number of columns in return clause and their Vantage types.
+        n_f = len(feature_columns)
+        n_c = len(label_columns)
+        # For paritioning columns, it will be a dataframe and getattr(modelObj, func_name) fails.
+        # Just for getting the number of columns and their types, using only one model of all.
+        if len(self._fit_partition_unique_values) == 1:
+            # Single model case.
+            skl_obj = self.modelObj
+        else:
+            # Multi model case.
+            skl_obj = self.modelObj.iloc[0]["model"]
+        ten_row_data = data.head(10).get_values()
+        X = numpy.array(ten_row_data)
+        if label_columns:
+            y = X[:,n_f : n_f + n_c]
+            X = X[:,:n_f]
+            # predict() now takes 'y' also for it to return the labels from script. Skipping 'y'
+            # in local run if passed. Generally, 'y' is passed to return y along with actual output.
+            try:
+                trans_opt = getattr(skl_obj, func_name)(X, y, **kwargs)
+            except TypeError as ex:
+                # Function which does not accept 'y' like predict_proba() raises error like
+                # "predict_proba() takes 2 positional arguments but 3 were given".
+                trans_opt = getattr(skl_obj, func_name)(X, **kwargs)
+        else:
+            trans_opt = getattr(skl_obj, func_name)(X, **kwargs)
+        if func_name == "path":
+            raise NotImplementedError(
+                "path() returns tuple of ndarrays of different shapes. Not Implemented yet."
+            )
+        if isinstance(trans_opt, numpy.ndarray) and trans_opt.shape == (X.shape[0],):
+            trans_opt = trans_opt.reshape(X.shape[0], 1)
+        if type(trans_opt).__name__ in ["csr_matrix", "csc_matrix"]:
+            no_of_columns = trans_opt.get_shape()[1]
+            trans_opt = trans_opt.toarray()
+        elif isinstance(trans_opt, dict):
+            raise NotImplementedError(f"Output returns dictionary {trans_opt}. NOT implemented yet.")
+        elif isinstance(trans_opt[0], numpy.ndarray) \
+                or isinstance(trans_opt[0], list) \
+                or isinstance(trans_opt[0], tuple):
+            no_of_columns = len(trans_opt[0])
+        else:
+            no_of_columns = 1
+        # Special handling when inverse_transform of no_of_columns returns no of rows
+        # less than the no of classes. Such columns are filled with NaN values.
+        # Updating number of columns here (new columns with NaN values will be added).
+        if func_name == "inverse_transform" and self.class_name == "MultiLabelBinarizer":
+            no_of_columns = len(self.classes_)
+            for i in range(len(ten_row_data)):
+                trans_opt[i] += tuple([numpy.nan] * (no_of_columns - len(trans_opt[i])))
+        # Special handling required for cross_decomposition classes's transform function, which
+        # takes label columns also. In this case, output is a tuple of numpy arrays - x_scores and
+        # y_scores. If label columns are not provided, only x_scores are returned.
+        if self.module_name == "sklearn.cross_decomposition" and func_name == "transform":
+            # For cross_decomposition, output is a tuple of arrays when label columns are provided
+            # along with feature columns for transform function. In this case, concatenate the
+            # arrays and return the column names accordingly.
+            if isinstance(trans_opt, tuple): # tuple when label_columns is provided.
+                assert trans_opt[0].shape == trans_opt[1].shape,\
+                    "Output arrays should be of same shape when transform/fit_transform is run "\
+                    "with label columns for cross_decomposition classes.."
+                first_cols = [f"x_scores_{(i + 1)}" for i in range(trans_opt[0].shape[1])]
+                second_cols = [f"y_scores_{(i + 1)}" for i in range(trans_opt[1].shape[1])]
+                no_of_columns = trans_opt[0].shape[1] + trans_opt[1].shape[1]
+                col_names = first_cols + second_cols
+                trans_opt = numpy.concatenate(trans_opt, axis=1)
+            else:
+                assert isinstance(trans_opt, numpy.ndarray), "When transform/fit_transform is run "\
+                    "without label columns for cross_decomposition classes, "\
+                    "output should be a numpy array."
+                no_of_columns = trans_opt.shape[1]
+                col_names =[f"x_scores_{(i + 1)}" for i in range(trans_opt.shape[1])]
+        else:
+            # Generate list of new column names.
+            col_names = [f"{self.class_name.lower()}_{func_name}_{(i + 1)}" for i in range(no_of_columns)]
+        # Get new column sqlalchemy types for pandas df columns of transform output.
+        opt_pd = pd.DataFrame(trans_opt)
+        # Get output column types for each column in pandas df from the output of transform
+        # type functions.
+        types = {}
+        for idx, col in enumerate(list(opt_pd.columns)):
+            # Get type of column using data from all rows, in case if the column has None values.
+            # 'and' of types of all values in the column with type(None) gives the type of the column.
+            type_ = type(None)
+            for i in range(len(trans_opt)):
+                type_ = type_ and type(trans_opt[i][idx])
+            # If all the values of the output (trans_opt) is None, thelen use `str` as type since
+            # pandas astype() does not accept None type.
+            if type_ is type(None):
+                type_ = str
+            # numpy integer columns with nan values can't be typecasted using pd.astype() to int64.
+            # It raises error like "Cannot convert non-finite values (NA or inf) to integer:
+            #                       Error while type casting for column '2'"
+            # Hence, using pd.Int64Dtype() for integer columns with nan values.
+            types[col] = type_ if type_ != numpy.int64 else pd.Int64Dtype()
+        # Without this, all columns will be of object type and gets converted to VARCHAR in Vantage.
+        opt_pd = opt_pd.astype(types)
+        # If the datatype is not specified then check if the datatype is datetime64 and timezone is present then map it to
+        # TIMESTAMP(timezone=True) else map it according to default value.
+        col_types = [TIMESTAMP(timezone=True)
+                     if pt.is_datetime64_ns_dtype(opt_pd.dtypes[key]) and (opt_pd[col_name].dt.tz is not None)
+                     else _get_sqlalchemy_mapping(str(opt_pd.dtypes[key]))
+                     for key, col_name in enumerate(list(opt_pd.columns))]
+        return [(c_name, c_type) for c_name, c_type in zip(col_names, col_types)]
+    @_validate_fit_run
+    def _run_function_needing_all_rows(self, X=None, y=None, **kwargs):
+        """
+        Internal function to run functions like score, aic, bic which needs all rows and return
+        one floating number as result.
+        """
+        st_time = time.time()
+        assert kwargs["name"], "function name should be passed."
+        func_name = kwargs["name"]
+        # Remove 'name' to pass other kwargs to script. TODO: Not passing it now.
+        kwargs.pop("name")
+        data, feature_columns, label_columns, _, partition_columns = \
+            self._validate_args_and_get_data(X=X, y=y, groups=None, kwargs=kwargs)
+        label_columns = self._get_columns_as_list(label_columns)
+        data, new_partition_columns = self._get_data_and_data_partition_columns(data,
+                                                                                feature_columns,
+                                                                                label_columns,
+                                                                                partition_columns)
+        file_name = "sklearn_score.py"
+        self._install_script_file(file_identifier=file_name.split(".")[0], file_name=file_name)
+        script_file_path = f"{file_name}" if self._is_lake_system \
+            else f"./{self._db_name}/{file_name}"
+        data_column_types_str, partition_indices_str, _, new_partition_columns = \
+            self._get_data_col_types_and_partition_col_indices_and_types(data, new_partition_columns)
+        self._validate_unique_partition_values(data, new_partition_columns)
+        py_exc = UtilFuncs._get_python_execution_path()
+        script_command = f"{py_exc} {script_file_path} {func_name} {len(feature_columns)} "\
+            f"{len(label_columns)} {partition_indices_str} {data_column_types_str} "\
+            f"{self._model_file_name_prefix} {self._is_lake_system}"
+        # score, aic, bic returns float values.
+        return_types = [(col, data._td_column_names_and_sqlalchemy_types[col.lower()])
+                        for col in new_partition_columns] + [(func_name, FLOAT())]
+        self._install_initial_model_file()
+        opt = self._run_script(data, script_command, new_partition_columns, return_types)
+        self._score_execution_time = time.time() - st_time
+        if self._is_default_partition_value_fit:
+            # For single model case, partition column is internally generated and
+            # no point in returning it to the user.
+            return opt.select(func_name)
+        return opt
+    @_validate_fit_run
+    def _transform(self, X=None, y=None, **kwargs):
+        """
+        Internal function to run predict/transform and similar functions, which returns
+        multiple columns. This function will return data row along with the generated
+        columns' row data, unlike sklearn's functions which returns just output data.
+        """
+        st_time = time.time()
+        assert kwargs["name"], "function name should be passed."
+        func_name = kwargs["name"]
+        # Remove 'name' to pass other kwargs to script. TODO: Not passing it now.
+        kwargs.pop("name")
+        data, feature_columns, label_columns, _, partition_columns = \
+            self._validate_args_and_get_data(X=X, y=y, groups=None, kwargs=kwargs)
+        data, new_partition_columns = self._get_data_and_data_partition_columns(data,
+                                                                                feature_columns,
+                                                                                label_columns,
+                                                                                partition_columns)
+        # Since kwargs are passed to transform, removing additional unrelated arguments from kwargs.
+        if "data" in kwargs:
+            kwargs.pop("data")
+        if "feature_columns" in kwargs:
+            kwargs.pop("feature_columns")
+        if "group_columns" in kwargs:
+            kwargs.pop("group_columns")
+        if "partition_columns" in kwargs:
+            kwargs.pop("partition_columns")
+        if "label_columns" in kwargs:
+            kwargs.pop("label_columns")
+        file_name = "sklearn_transform.py"
+        self._install_script_file(file_identifier=file_name.split(".")[0], file_name=file_name)
+        script_file_path = f"{file_name}" if self._is_lake_system \
+            else f"./{self._db_name}/{file_name}"
+        data_column_types_str, partition_indices_str, _, new_partition_columns = \
+            self._get_data_col_types_and_partition_col_indices_and_types(data, new_partition_columns)
+        self._validate_unique_partition_values(data, new_partition_columns)
+        py_exc = UtilFuncs._get_python_execution_path()
+        script_command = f"{py_exc} {script_file_path} {func_name} {len(feature_columns)} "\
+            f"{len(label_columns)} {partition_indices_str} {data_column_types_str} "\
+            f"{self._model_file_name_prefix} {self._is_lake_system}"
+        # Returning feature columns also along with transformed columns because we don't know the
+        # mapping of feature columns to the transformed columns.
+        return_types = [(col, data._td_column_names_and_sqlalchemy_types[col.lower()])
+                        for col in (new_partition_columns + feature_columns)]
+        if func_name in ["predict", "decision_function"] and label_columns:
+            return_types += [(col, data._td_column_names_and_sqlalchemy_types[col.lower()])
+                             for col in label_columns]
+        return_types += self._get_return_columns_for_function_(data,
+                                                               feature_columns,
+                                                               label_columns,
+                                                               func_name,
+                                                               kwargs)
+        # Installing model files before running sklearn_transform.py.
+        self._install_initial_model_file()
+        opt = self._run_script(data, script_command, new_partition_columns, return_types)
+        self._transform_execution_time = time.time() - st_time
+        return self._get_returning_df(opt, new_partition_columns, return_types)
+    def fit_predict(self, X=None, y=None, **kwargs):
+        """
+        Please check the description in Docs/OpensourceML/sklearn.py.
+        """
+        st_time = time.time()
+        self._is_default_partition_value_fit = True # False when the user provides partition columns.
+        data, feature_columns, label_columns, _, partition_columns = \
+            self._validate_args_and_get_data(X=X, y=y, groups=None, kwargs=kwargs)
+        if partition_columns:
+            self._is_default_partition_value_fit = False
+        data, new_partition_columns = self._get_data_and_data_partition_columns(data,
+                                                                                feature_columns,
+                                                                                label_columns,
+                                                                                partition_columns)
+        # Return label_columns also if user provides in the function call.
+        return_types = [(col, data._td_column_names_and_sqlalchemy_types[col.lower()])
+                        for col in (new_partition_columns + feature_columns + label_columns)]
+        func_name = inspect.stack()[0][3]
+        if label_columns:
+            return_types += self._get_return_columns_for_function_(data,
+                                                                   feature_columns,
+                                                                   label_columns,
+                                                                   func_name,
+                                                                   {})
+        else:
+            # If there are no label_columns, we will have only one
+            # predicted column.
+            return_types += [(f"{self.class_name.lower()}_{func_name}_1", FLOAT())]
+        file_name = "sklearn_fit_predict.py"
+        self._install_script_file(file_identifier=file_name.split(".")[0], file_name=file_name)
+        data_column_types_str, partition_indices_str, _, new_partition_columns = \
+            self._get_data_col_types_and_partition_col_indices_and_types(data, new_partition_columns)
+        script_file_name = f"{file_name}" if self._is_lake_system \
+            else f"./{self._db_name}/{file_name}"
+        py_exc = UtilFuncs._get_python_execution_path()
+        script_command = f"{py_exc} {script_file_name} {len(feature_columns)} "\
+            f"{len(label_columns)} {partition_indices_str} {data_column_types_str} "\
+            f"{self._model_file_name_prefix} {self._is_lake_system}"
+        # Get unique values in partitioning columns.
+        self._fit_partition_unique_values = data.drop_duplicate(new_partition_columns).get_values()
+        self._install_initial_model_file()
+        opt = self._run_script(data, script_command, new_partition_columns, return_types)
+        self._fit_predict_execution_time = time.time() - st_time
+        if self._is_default_partition_value_fit:
+            # For single model case, partition column is internally generated and no point in
+            # returning it to the user.
+            # Extract columns from return types.
+            returning_cols = [col[0] for col in return_types[len(new_partition_columns):]]
+            return opt.select(returning_cols)
+        return opt
+    def fit_transform(self, X=None, y=None, **kwargs):
+        """
+        Please check the description in Docs/OpensourceML/sklearn.py.
+        """
+        # 'y' is not needed for transform().
+        fit_obj = self.fit(X, y, **kwargs)
+        kwargs["label_columns"] = None
+        return fit_obj.transform(X, None, **kwargs)
+    @_validate_fit_run
+    def _run_neighbors(self, X=None, **kwargs):
+        """
+        Internal function to run functions like kneighbors, radius_neighbors, kneighbors_graph,
+        radius_neighbors_graph which returns multiple columns. This function will return data row
+        along with the generated columns' row data, unlike sklearn's functions which returns just
+        output data.
+        """
+        assert kwargs["name"], "function name should be passed."
+        func_name = kwargs["name"]
+        kwargs.pop("name")
+        if self.module_name != "sklearn.neighbors":
+            raise AttributeError(f"{self.module_name+'.'+self.class_name} does not have {func_name}() method.")
+        data = kwargs.get("data", None)
+        partition_columns = kwargs.get("partition_columns", None)
+        if not X and not partition_columns and not data:
+            # If data is not passed, then run from client only.
+            # TODO: decide whether to run from client or from Vantage.
+            opt = super().__getattr__(func_name)(**kwargs)
+            from scipy.sparse.csr import csr_matrix
+            if isinstance(opt, csr_matrix):
+                return opt.toarray()
+            return opt
+        self._is_default_partition_value_fit = True # False when the user provides partition columns.
+        data, feature_columns, _, _, new_partition_columns = \
+            self._validate_args_and_get_data(X=X, y=None, groups=None, kwargs=kwargs,
+                                             skip_either_or_that=True)
+        # Remove the kwargs data.
+        input_data = kwargs.pop("data", None)
+        partition_cols = kwargs.pop("partition_columns", None)
+        feature_cols = kwargs.pop("feature_columns", None)
+        label_cols = kwargs.pop("label_columns", None)
+        if partition_columns:
+            # kwargs are passed to kneighbors function. So, removing them from kwargs.
+            kwargs.pop("partition_columns")
+            self._is_default_partition_value_fit = False
+        # Generating new partition column name.
+        data, new_partition_columns = self._get_data_and_data_partition_columns(data,
+                                                                                feature_columns,
+                                                                                [],
+                                                                                partition_columns)
+        args_str = self._get_kwargs_str(kwargs)
+        file_name = "sklearn_neighbors.py"
+        self._install_script_file(file_identifier=file_name.split(".")[0], file_name=file_name)
+        script_file_path = f"{file_name}" if self._is_lake_system \
+            else f"./{self._db_name}/{file_name}"
+        # Returning feature columns also along with new columns.
+        return_types = [(col, data._td_column_names_and_sqlalchemy_types[col.lower()])
+                        for col in (new_partition_columns + feature_columns)]
+        # `return_distance` is needed as the result is a tuple of two arrays when it is True.
+        return_distance = kwargs.get("return_distance", True) # Default value is True.
+        # Though new columns return numpy arrays, we are returning them as strings.
+        # TODO: Will update to columns later, if requested later.
+        if func_name in ['kneighbors', 'radius_neighbors']:
+            if return_distance:
+                return_types += [("neigh_dist", VARCHAR())]
+            return_types += [("neigh_ind", VARCHAR())]
+        elif func_name in ['kneighbors_graph', 'radius_neighbors_graph']:
+            return_types += [("A", VARCHAR())]
+        else:
+            return_types += [("output", VARCHAR())]
+        data_column_types_str, partition_indices_str, _, new_partition_columns = \
+            self._get_data_col_types_and_partition_col_indices_and_types(data, new_partition_columns)
+        py_exc = UtilFuncs._get_python_execution_path()
+        script_command = f"{py_exc} {script_file_path} {func_name} {len(feature_columns)} "\
+            f"{partition_indices_str} {data_column_types_str} {self._model_file_name_prefix} {self._is_lake_system} "\
+            f"{args_str}"
+        # Get unique values in partitioning columns.
+        self._fit_partition_unique_values = data.drop_duplicate(new_partition_columns).get_values()
+        self._install_initial_model_file()
+        opt = self._run_script(data, script_command, new_partition_columns, return_types)
+        return self._get_returning_df(opt, new_partition_columns, return_types)
+    def split(self, X=None, y=None, groups=None, **kwargs):
+        """
+        Please check the description in Docs/OpensourceML/sklearn.py.
+        """
+        opt = self._run_model_selection("split", X=X, y=y, groups=groups,
+                                        skip_either_or_that=True, kwargs=kwargs)
+        # Get number of splits in the result DataFrame.
+        n_splits = opt.drop_duplicate("split_id").shape[0]
+        data = kwargs.get("data", None)
+        feature_columns = kwargs.get("feature_columns", [])
+        label_columns = self._get_columns_as_list(kwargs.get("label_columns", []))
+        # If there is not X and y, get feature_columns and label_columns for "data".
+        partition_columns = kwargs.get("partition_columns", [])
+        feature_columns = [col for col in X.columns if col not in partition_columns] \
+            if X and not data and not feature_columns else feature_columns
+        label_columns = y.columns if y and not data and not label_columns else label_columns
+        # Return iterator of the train and test dataframes for each split.
+        for i in range(1, n_splits+1):
+            train_df = opt[(opt.split_id == i) & (opt.data_type == "train")]\
+                .select(partition_columns + feature_columns + label_columns)
+            train_df._index_label = None
+            test_df = opt[(opt.split_id == i) & (opt.data_type == "test")]\
+                .select(partition_columns + feature_columns + label_columns)
+            test_df._index_label = None
+            yield train_df, test_df
+    def get_n_splits(self, X=None, y=None, groups=None, **kwargs):
+        """
+        Please check the description in Docs/OpensourceML/sklearn.py.
+        """
+        return self._run_model_selection("get_n_splits", X=X, y=y, groups=groups,
+                                         skip_either_or_that=True, kwargs=kwargs)
+    def _run_model_selection(self,
+                             func_name,
+                             X=None,
+                             y=None,
+                             groups=None,
+                             skip_either_or_that=False,
+                             kwargs={}):
+        """
+        Internal function to run functions like split, get_n_splits of model selection module.
+        - get_n_splits() returns number of splits as value, not as teradataml DataFrame.
+        - split() returns teradataml DataFrame containing train and test data for each split
+          (add partition information if the argument "partition_cols" is provided).
+        """
+        if self.module_name != "sklearn.model_selection":
+            raise AttributeError(f"{self.module_name+'.'+self.class_name} does not "
+                                 f"have {func_name}() method.")
+        data = kwargs.get("data", None)
+        if not X and not y and not groups and not data:
+            # If data is not passed, then run from client only.
+            # TODO: decide whether to run from client or from Vantage.
+            return super().__getattr__(func_name)()
+        self._is_default_partition_value_fit = True # False when the user provides partition columns.
+        data, feature_columns, label_columns, group_columns, partition_columns = \
+            self._validate_args_and_get_data(X=X, y=y, groups=groups, kwargs=kwargs,
+                                             skip_either_or_that=skip_either_or_that)
+        if partition_columns:
+            self._is_default_partition_value_fit = False
+        data, new_partition_columns = self._get_data_and_data_partition_columns(data,
+                                                                                feature_columns,
+                                                                                label_columns,
+                                                                                partition_columns,
+                                                                                group_columns)
+        file_name = "sklearn_model_selection_split.py"
+        self._install_script_file(file_identifier=file_name.split(".")[0], file_name=file_name)
+        script_file_path = f"{file_name}" if self._is_lake_system \
+            else f"./{self._db_name}/{file_name}"
+        if func_name == "split":
+            # Need to generate data into splits of train and test.
+            #   split_id - the column which will be used to identify the split.
+            #   data_type - the column which will be used to identify whether the row is
+            #               train or test row.
+            return_types = [("split_id", INTEGER()), ("data_type", VARCHAR())]
+            # Returning feature columns and label columns as well.
+            return_types += [(col, data._td_column_names_and_sqlalchemy_types[col.lower()])
+                            for col in (feature_columns + label_columns)]
+        else:
+            # Return Varchar by default.
+            # Returns Varchar even for functions like `get_n_splits` which returns large integer
+            # numbers like `4998813702034726525205100` for `LeavePOut` class (when the argument
+            # `p` is 28 and no of data rows is 100) as Vantage cannot scope it to INTEGER.
+            return_types = [(func_name, VARCHAR())]
+        return_types = [(col, data._td_column_names_and_sqlalchemy_types[col.lower()])
+                        for col in new_partition_columns] + return_types
+        data_column_types_str, partition_indices_str, _, new_partition_columns = \
+            self._get_data_col_types_and_partition_col_indices_and_types(data, new_partition_columns)
+        py_exc = UtilFuncs._get_python_execution_path()
+        script_command = f"{py_exc} {script_file_path} {func_name} {len(feature_columns)} "\
+            f"{len(label_columns)} {len(group_columns)} {partition_indices_str} {data_column_types_str} "\
+            f"{self._model_file_name_prefix} {self._is_lake_system}"
+        # Get unique values in partitioning columns.
+        self._fit_partition_unique_values = data.drop_duplicate(new_partition_columns).get_values()
+        self._install_initial_model_file()
+        opt = self._run_script(data, script_command, new_partition_columns, return_types)
+        if func_name == "get_n_splits" and not partition_columns:
+                # Return number of splits as value, not as dataframe.
+                vals = execute_sql("select {} from {}".format(func_name, opt._table_name))
+                opt = vals.fetchall()[0][0]
+                # Varchar is returned by the script. Convert it to int.
+                return int(opt)
+        return opt
+    def _get_returning_df(self, script_df, partition_column, returns):
+        """
+        Internal function to return the teradataml Dataframe except
+        partition_column.
+        """
+        if self._is_default_partition_value_fit:
+            # For single model case, partition column is internally generated
+            # and no point in returning it to the user.
+            # Extract columns from return types.
+            returning_cols = [col[0] for col in returns[len(partition_column):]]
+            return script_df.select(returning_cols)
+        return script_df
+class _SKLearnFunctionWrapper(_GenericObjectWrapper):
+    def __init__(self, module_name, func_name):
+        super().__init__()
+        self.__module_name = module_name
+        self.__func_name = func_name
+        self.__params = None
+        self.__data_args = OrderedDict()
+        self._model_file_name = _generate_new_name(type="file_function", extension="py")
+    def __call__(self, **kwargs):
+        """
+        Run the function with all the arguments passed from `td_sklearn.<function_name>` function.
+        """
+        __data_columns = []
+        partition_cols = self._get_columns_as_list(kwargs.get("partition_columns", None))
+        if partition_cols:
+            kwargs.pop("partition_columns")
+        # Separate dataframe related arguments and their column names from actual kwargs.
+        for k, v in kwargs.items():
+            if isinstance(v, DataFrame):
+                # All dataframes should be select of parent dataframe.
+                _validate_df_query_type(v, "select", k)
+                # Save all columns in dataframe related arguments.
+                __data_columns.extend(v.columns)
+                self.__data_args[k] = v
+        # Get common parent dataframe from all dataframes.
+        self.__tdml_df =  DataFrameUtils()._get_common_parent_df_from_dataframes(list(self.__data_args.values()))
+        self._validate_existence_of_partition_columns(partition_cols, self.__tdml_df.columns)
+        self.__tdml_df = self.__tdml_df.select(__data_columns + partition_cols)
+        self.__tdml_df, partition_cols = self._get_data_and_data_partition_columns(self.__tdml_df,
+                                                                                   __data_columns,
+                                                                                   [],
+                                                                                   partition_cols
+                                                                                   )
+        # Prepare string of data arguments with name, indices where columns of that argument resides
+        # and types of each of the column.
+        data_args_str = self._prepare_data_args_string(kwargs)
+        self.__params = kwargs
+        # Get indices of partition_columns and types of all columns.
+        data_column_types_str, partition_indices_str, _, partition_cols = \
+            self._get_data_col_types_and_partition_col_indices_and_types(self.__tdml_df, partition_cols)
+        script_file_path = f"{self._model_file_name}" if self._is_lake_system \
+            else f"./{self._db_name}/{self._model_file_name}"
+        py_exc = UtilFuncs._get_python_execution_path()
+        script_command = f"{py_exc} {script_file_path} {partition_indices_str} {data_column_types_str} {data_args_str}"
+        return_types = [(col, self.__tdml_df._td_column_names_and_sqlalchemy_types[col.lower()])
+                        for col in partition_cols] + [(self.__func_name, CLOB())]
+        # Generate new file in .teradataml directory and install it to Vantage.
+        self._prepare_and_install_file()
+        self._model_data = self._run_script(self.__tdml_df, script_command, partition_cols, return_types)
+        self._model_data._index_label = None
+        fit_partition_unique_values = self.__tdml_df.drop_duplicate(partition_cols).get_values()
+        self.extract_sklearn_obj(n_unique_partitions=len(fit_partition_unique_values),
+                                 n_partition_cols=len(partition_cols))
+        # File cleanup after processing.
+        os.remove(self._model_file_local)
+        remove_file(file_identifier=self._model_file_name.split(".")[0], suppress_output=True,
+                    force_remove=True)
+        return self.modelObj
+    def _prepare_data_args_string(self, kwargs):
+        """
+        Get column indices and types of each data related arguments in the format:
+        "{<arg_name>-<comma separated indices>-<comma separated types>}--
+         {<arg_name>-<comma separated indices>-<comma separated types>}"
+        """
+        data_args_str = []
+        for arg_name in list(self.__data_args.keys()):
+            # Remove DataFrame arguments from kwargs, which will be passed to Script.
+            kwargs.pop(arg_name)
+            # Get column indices and their types for each dataframe from parent dataframe.
+            _, partition_indices_str, partition_types_str, _ = \
+                self._get_data_col_types_and_partition_col_indices_and_types(self.__tdml_df,
+                                                                   self.__data_args[arg_name].columns,
+                                                                   idx_delim=",",
+                                                                   types_delim=",")
+            # Format "<arg_name>-<comma separated indices>-<comma separated types>"
+            data_args_str.append(f"{arg_name}-{partition_indices_str}-{partition_types_str}")
+        # Format "{<arg_name>-<comma separated indices>-<comma separated types>}--
+        #    {<arg_name>-<comma separated indices>-<comma separated types>}"
+        return "--".join(data_args_str)
+    def _validate_existence_of_partition_columns(self, partition_columns, all_columns):
+        """
+        Validate if columns in "partition_columns" argument are present in any of the given
+        dataframes.
+        """
+        invalid_part_cols = [c for c in partition_columns if c not in all_columns]
+        if invalid_part_cols:
+            raise ValueError(Messages.get_message(MessageCodes.INVALID_PARTITIONING_COLS,
+                                                  ", ".join(invalid_part_cols),
+                                                  "', '".join(list(self.__data_args.keys())))
+                                                  )
+    def _prepare_and_install_file(self):
+        """
+        Prepare function script file from template file and install it in Vaantage.
+        """
+        with open(os.path.join(self._scripts_path, "sklearn_function.template")) as fp:
+            script_data = fp.read()
+        script_data = script_data.replace("<module_name>",self.__module_name).\
+            replace("<func_name>",self.__func_name).replace("<params>", json.dumps(self.__params))
+        self._model_file_local = os.path.join(self._tdml_tmp_dir, self._model_file_name)
+        with open(self._model_file_local, "w") as fp:
+            fp.write(script_data)
+        self._install_script_file(file_identifier=self._model_file_name.split(".")[0],
+                                  file_name=self._model_file_name,
+                                  file_location=self._tdml_tmp_dir)

teradataml 17.20.0.7__py3-none-any.whl → 20.0.0.1__py3-none-any.whl

Potentially problematic release.

teradataml 17.20.0.7py3-none-any.whl → 20.0.0.1py3-none-any.whl