PyPI - teradataml - Versions diffs - 17.20.0.6__py3-none-any.whl → 20.0.0.0__py3-none-any.whl - Mend

teradataml 17.20.0.6py3-none-any.whl → 20.0.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of teradataml might be problematic. Click here for more details.

Files changed (432) hide show

teradataml/LICENSE-3RD-PARTY.pdf +0 -0
teradataml/LICENSE.pdf +0 -0
teradataml/README.md +238 -1
teradataml/__init__.py +13 -3
teradataml/_version.py +1 -1
teradataml/analytics/Transformations.py +4 -4
teradataml/analytics/__init__.py +0 -2
teradataml/analytics/analytic_function_executor.py +3 -0
teradataml/analytics/json_parser/utils.py +13 -12
teradataml/analytics/sqle/DecisionTreePredict.py +15 -30
teradataml/analytics/sqle/NaiveBayesPredict.py +11 -20
teradataml/analytics/sqle/__init__.py +0 -13
teradataml/analytics/utils.py +1 -0
teradataml/analytics/valib.py +3 -0
teradataml/automl/__init__.py +1628 -0
teradataml/automl/custom_json_utils.py +1270 -0
teradataml/automl/data_preparation.py +993 -0
teradataml/automl/data_transformation.py +727 -0
teradataml/automl/feature_engineering.py +1648 -0
teradataml/automl/feature_exploration.py +547 -0
teradataml/automl/model_evaluation.py +163 -0
teradataml/automl/model_training.py +887 -0
teradataml/catalog/__init__.py +0 -2
teradataml/catalog/byom.py +49 -6
teradataml/catalog/function_argument_mapper.py +0 -2
teradataml/catalog/model_cataloging_utils.py +2 -1021
teradataml/common/aed_utils.py +6 -2
teradataml/common/constants.py +50 -58
teradataml/common/deprecations.py +160 -0
teradataml/common/garbagecollector.py +61 -104
teradataml/common/messagecodes.py +27 -36
teradataml/common/messages.py +11 -15
teradataml/common/utils.py +205 -287
teradataml/common/wrapper_utils.py +1 -110
teradataml/context/context.py +150 -78
teradataml/data/bank_churn.csv +10001 -0
teradataml/data/bmi.csv +501 -0
teradataml/data/docs/sqle/docs_17_10/BincodeFit.py +3 -3
teradataml/data/docs/sqle/docs_17_10/BincodeTransform.py +6 -5
teradataml/data/docs/sqle/docs_17_10/Fit.py +1 -1
teradataml/data/docs/sqle/docs_17_10/OneHotEncodingTransform.py +1 -1
teradataml/data/docs/sqle/docs_17_10/OutlierFilterTransform.py +1 -1
teradataml/data/docs/sqle/docs_17_10/PolynomialFeaturesTransform.py +2 -2
teradataml/data/docs/sqle/docs_17_10/RowNormalizeTransform.py +2 -1
teradataml/data/docs/sqle/docs_17_10/ScaleTransform.py +1 -0
teradataml/data/docs/sqle/docs_17_10/SimpleImputeTransform.py +1 -1
teradataml/data/docs/sqle/docs_17_10/Transform.py +2 -1
teradataml/data/docs/sqle/docs_17_20/BincodeFit.py +3 -3
teradataml/data/docs/sqle/docs_17_20/BincodeTransform.py +6 -5
teradataml/data/docs/sqle/docs_17_20/Fit.py +1 -1
teradataml/data/docs/sqle/docs_17_20/GLM.py +1 -1
teradataml/data/docs/sqle/docs_17_20/GLMPredictPerSegment.py +9 -10
teradataml/data/docs/sqle/docs_17_20/KMeansPredict.py +3 -2
teradataml/data/docs/sqle/docs_17_20/NaiveBayesTextClassifierPredict.py +16 -15
teradataml/data/docs/sqle/docs_17_20/NaiveBayesTextClassifierTrainer.py +2 -2
teradataml/data/docs/sqle/docs_17_20/NonLinearCombineFit.py +2 -2
teradataml/data/docs/sqle/docs_17_20/NonLinearCombineTransform.py +8 -8
teradataml/data/docs/sqle/docs_17_20/OneClassSVMPredict.py +21 -20
teradataml/data/docs/sqle/docs_17_20/OneHotEncodingTransform.py +1 -1
teradataml/data/docs/sqle/docs_17_20/OutlierFilterTransform.py +8 -3
teradataml/data/docs/sqle/docs_17_20/PolynomialFeaturesTransform.py +6 -5
teradataml/data/docs/sqle/docs_17_20/RandomProjectionTransform.py +6 -6
teradataml/data/docs/sqle/docs_17_20/RowNormalizeTransform.py +2 -1
teradataml/data/docs/sqle/docs_17_20/SVM.py +1 -1
teradataml/data/docs/sqle/docs_17_20/SVMPredict.py +16 -16
teradataml/data/docs/sqle/docs_17_20/ScaleTransform.py +1 -0
teradataml/data/docs/sqle/docs_17_20/SimpleImputeTransform.py +3 -2
teradataml/data/docs/sqle/docs_17_20/TDDecisionForestPredict.py +4 -4
teradataml/data/docs/sqle/docs_17_20/TDGLMPredict.py +19 -19
teradataml/data/docs/sqle/docs_17_20/TargetEncodingTransform.py +5 -4
teradataml/data/docs/sqle/docs_17_20/Transform.py +2 -2
teradataml/data/docs/sqle/docs_17_20/XGBoostPredict.py +9 -9
teradataml/data/fish.csv +160 -0
teradataml/data/glass_types.csv +215 -0
teradataml/data/insurance.csv +1 -1
teradataml/data/iris_data.csv +151 -0
teradataml/data/jsons/sqle/17.10/TD_FunctionTransform.json +1 -0
teradataml/data/jsons/sqle/17.10/TD_OneHotEncodingTransform.json +1 -0
teradataml/data/jsons/sqle/17.10/TD_OutlierFilterTransform.json +1 -0
teradataml/data/jsons/sqle/17.10/TD_PolynomialFeaturesTransform.json +1 -0
teradataml/data/jsons/sqle/17.10/TD_RowNormalizeTransform.json +1 -0
teradataml/data/jsons/sqle/17.10/TD_ScaleTransform.json +1 -0
teradataml/data/jsons/sqle/17.10/TD_SimpleImputeTransform.json +1 -0
teradataml/data/load_example_data.py +3 -0
teradataml/data/multi_model_classification.csv +401 -0
teradataml/data/multi_model_regression.csv +401 -0
teradataml/data/openml_example.json +63 -0
teradataml/data/scripts/deploy_script.py +65 -0
teradataml/data/scripts/mapper.R +20 -0
teradataml/data/scripts/sklearn/__init__.py +0 -0
teradataml/data/scripts/sklearn/sklearn_fit.py +175 -0
teradataml/data/scripts/sklearn/sklearn_fit_predict.py +135 -0
teradataml/data/scripts/sklearn/sklearn_function.template +113 -0
teradataml/data/scripts/sklearn/sklearn_model_selection_split.py +158 -0
teradataml/data/scripts/sklearn/sklearn_neighbors.py +152 -0
teradataml/data/scripts/sklearn/sklearn_score.py +128 -0
teradataml/data/scripts/sklearn/sklearn_transform.py +179 -0
teradataml/data/templates/open_source_ml.json +9 -0
teradataml/data/teradataml_example.json +73 -1
teradataml/data/test_classification.csv +101 -0
teradataml/data/test_prediction.csv +101 -0
teradataml/data/test_regression.csv +101 -0
teradataml/data/train_multiclass.csv +101 -0
teradataml/data/train_regression.csv +101 -0
teradataml/data/train_regression_multiple_labels.csv +101 -0
teradataml/data/wine_data.csv +1600 -0
teradataml/dataframe/copy_to.py +79 -13
teradataml/dataframe/data_transfer.py +8 -0
teradataml/dataframe/dataframe.py +910 -311
teradataml/dataframe/dataframe_utils.py +102 -5
teradataml/dataframe/fastload.py +11 -3
teradataml/dataframe/setop.py +15 -2
teradataml/dataframe/sql.py +3735 -77
teradataml/dataframe/sql_function_parameters.py +56 -5
teradataml/dataframe/vantage_function_types.py +45 -1
teradataml/dataframe/window.py +30 -29
teradataml/dbutils/dbutils.py +18 -1
teradataml/geospatial/geodataframe.py +18 -7
teradataml/geospatial/geodataframecolumn.py +5 -0
teradataml/hyperparameter_tuner/optimizer.py +910 -120
teradataml/hyperparameter_tuner/utils.py +131 -37
teradataml/lib/aed_0_1.dll +0 -0
teradataml/lib/libaed_0_1.dylib +0 -0
teradataml/lib/libaed_0_1.so +0 -0
teradataml/libaed_0_1.dylib +0 -0
teradataml/libaed_0_1.so +0 -0
teradataml/opensource/__init__.py +1 -0
teradataml/opensource/sklearn/__init__.py +1 -0
teradataml/opensource/sklearn/_class.py +255 -0
teradataml/opensource/sklearn/_sklearn_wrapper.py +1668 -0
teradataml/opensource/sklearn/_wrapper_utils.py +268 -0
teradataml/opensource/sklearn/constants.py +54 -0
teradataml/options/__init__.py +3 -6
teradataml/options/configure.py +21 -20
teradataml/scriptmgmt/UserEnv.py +61 -5
teradataml/scriptmgmt/lls_utils.py +135 -53
teradataml/table_operators/Apply.py +38 -6
teradataml/table_operators/Script.py +45 -308
teradataml/table_operators/TableOperator.py +182 -591
teradataml/table_operators/__init__.py +0 -1
teradataml/table_operators/table_operator_util.py +32 -40
teradataml/utils/validators.py +127 -3
{teradataml-17.20.0.6.dist-info → teradataml-20.0.0.0.dist-info}/METADATA +243 -3
{teradataml-17.20.0.6.dist-info → teradataml-20.0.0.0.dist-info}/RECORD +147 -391
teradataml/analytics/mle/AdaBoost.py +0 -651
teradataml/analytics/mle/AdaBoostPredict.py +0 -564
teradataml/analytics/mle/Antiselect.py +0 -342
teradataml/analytics/mle/Arima.py +0 -641
teradataml/analytics/mle/ArimaPredict.py +0 -477
teradataml/analytics/mle/Attribution.py +0 -1070
teradataml/analytics/mle/Betweenness.py +0 -658
teradataml/analytics/mle/Burst.py +0 -711
teradataml/analytics/mle/CCM.py +0 -600
teradataml/analytics/mle/CCMPrepare.py +0 -324
teradataml/analytics/mle/CFilter.py +0 -460
teradataml/analytics/mle/ChangePointDetection.py +0 -572
teradataml/analytics/mle/ChangePointDetectionRT.py +0 -477
teradataml/analytics/mle/Closeness.py +0 -737
teradataml/analytics/mle/ConfusionMatrix.py +0 -420
teradataml/analytics/mle/Correlation.py +0 -477
teradataml/analytics/mle/Correlation2.py +0 -573
teradataml/analytics/mle/CoxHazardRatio.py +0 -679
teradataml/analytics/mle/CoxPH.py +0 -556
teradataml/analytics/mle/CoxSurvival.py +0 -478
teradataml/analytics/mle/CumulativeMovAvg.py +0 -363
teradataml/analytics/mle/DTW.py +0 -623
teradataml/analytics/mle/DWT.py +0 -564
teradataml/analytics/mle/DWT2D.py +0 -599
teradataml/analytics/mle/DecisionForest.py +0 -716
teradataml/analytics/mle/DecisionForestEvaluator.py +0 -363
teradataml/analytics/mle/DecisionForestPredict.py +0 -561
teradataml/analytics/mle/DecisionTree.py +0 -830
teradataml/analytics/mle/DecisionTreePredict.py +0 -528
teradataml/analytics/mle/ExponentialMovAvg.py +0 -418
teradataml/analytics/mle/FMeasure.py +0 -402
teradataml/analytics/mle/FPGrowth.py +0 -734
teradataml/analytics/mle/FrequentPaths.py +0 -695
teradataml/analytics/mle/GLM.py +0 -558
teradataml/analytics/mle/GLML1L2.py +0 -547
teradataml/analytics/mle/GLML1L2Predict.py +0 -519
teradataml/analytics/mle/GLMPredict.py +0 -529
teradataml/analytics/mle/HMMDecoder.py +0 -945
teradataml/analytics/mle/HMMEvaluator.py +0 -901
teradataml/analytics/mle/HMMSupervised.py +0 -521
teradataml/analytics/mle/HMMUnsupervised.py +0 -572
teradataml/analytics/mle/Histogram.py +0 -561
teradataml/analytics/mle/IDWT.py +0 -476
teradataml/analytics/mle/IDWT2D.py +0 -493
teradataml/analytics/mle/IdentityMatch.py +0 -763
teradataml/analytics/mle/Interpolator.py +0 -918
teradataml/analytics/mle/KMeans.py +0 -485
teradataml/analytics/mle/KNN.py +0 -627
teradataml/analytics/mle/KNNRecommender.py +0 -488
teradataml/analytics/mle/KNNRecommenderPredict.py +0 -581
teradataml/analytics/mle/LAR.py +0 -439
teradataml/analytics/mle/LARPredict.py +0 -478
teradataml/analytics/mle/LDA.py +0 -548
teradataml/analytics/mle/LDAInference.py +0 -492
teradataml/analytics/mle/LDATopicSummary.py +0 -464
teradataml/analytics/mle/LevenshteinDistance.py +0 -450
teradataml/analytics/mle/LinReg.py +0 -433
teradataml/analytics/mle/LinRegPredict.py +0 -438
teradataml/analytics/mle/MinHash.py +0 -544
teradataml/analytics/mle/Modularity.py +0 -587
teradataml/analytics/mle/NEREvaluator.py +0 -410
teradataml/analytics/mle/NERExtractor.py +0 -595
teradataml/analytics/mle/NERTrainer.py +0 -458
teradataml/analytics/mle/NGrams.py +0 -570
teradataml/analytics/mle/NPath.py +0 -634
teradataml/analytics/mle/NTree.py +0 -549
teradataml/analytics/mle/NaiveBayes.py +0 -462
teradataml/analytics/mle/NaiveBayesPredict.py +0 -513
teradataml/analytics/mle/NaiveBayesTextClassifier.py +0 -607
teradataml/analytics/mle/NaiveBayesTextClassifier2.py +0 -531
teradataml/analytics/mle/NaiveBayesTextClassifierPredict.py +0 -799
teradataml/analytics/mle/NamedEntityFinder.py +0 -529
teradataml/analytics/mle/NamedEntityFinderEvaluator.py +0 -414
teradataml/analytics/mle/NamedEntityFinderTrainer.py +0 -396
teradataml/analytics/mle/POSTagger.py +0 -417
teradataml/analytics/mle/Pack.py +0 -411
teradataml/analytics/mle/PageRank.py +0 -535
teradataml/analytics/mle/PathAnalyzer.py +0 -426
teradataml/analytics/mle/PathGenerator.py +0 -367
teradataml/analytics/mle/PathStart.py +0 -464
teradataml/analytics/mle/PathSummarizer.py +0 -470
teradataml/analytics/mle/Pivot.py +0 -471
teradataml/analytics/mle/ROC.py +0 -425
teradataml/analytics/mle/RandomSample.py +0 -637
teradataml/analytics/mle/RandomWalkSample.py +0 -490
teradataml/analytics/mle/SAX.py +0 -779
teradataml/analytics/mle/SVMDense.py +0 -677
teradataml/analytics/mle/SVMDensePredict.py +0 -536
teradataml/analytics/mle/SVMDenseSummary.py +0 -437
teradataml/analytics/mle/SVMSparse.py +0 -557
teradataml/analytics/mle/SVMSparsePredict.py +0 -553
teradataml/analytics/mle/SVMSparseSummary.py +0 -435
teradataml/analytics/mle/Sampling.py +0 -549
teradataml/analytics/mle/Scale.py +0 -565
teradataml/analytics/mle/ScaleByPartition.py +0 -496
teradataml/analytics/mle/ScaleMap.py +0 -378
teradataml/analytics/mle/ScaleSummary.py +0 -320
teradataml/analytics/mle/SentenceExtractor.py +0 -363
teradataml/analytics/mle/SentimentEvaluator.py +0 -432
teradataml/analytics/mle/SentimentExtractor.py +0 -578
teradataml/analytics/mle/SentimentTrainer.py +0 -405
teradataml/analytics/mle/SeriesSplitter.py +0 -641
teradataml/analytics/mle/Sessionize.py +0 -475
teradataml/analytics/mle/SimpleMovAvg.py +0 -397
teradataml/analytics/mle/StringSimilarity.py +0 -425
teradataml/analytics/mle/TF.py +0 -389
teradataml/analytics/mle/TFIDF.py +0 -504
teradataml/analytics/mle/TextChunker.py +0 -414
teradataml/analytics/mle/TextClassifier.py +0 -399
teradataml/analytics/mle/TextClassifierEvaluator.py +0 -413
teradataml/analytics/mle/TextClassifierTrainer.py +0 -565
teradataml/analytics/mle/TextMorph.py +0 -494
teradataml/analytics/mle/TextParser.py +0 -623
teradataml/analytics/mle/TextTagger.py +0 -530
teradataml/analytics/mle/TextTokenizer.py +0 -502
teradataml/analytics/mle/UnivariateStatistics.py +0 -488
teradataml/analytics/mle/Unpack.py +0 -526
teradataml/analytics/mle/Unpivot.py +0 -438
teradataml/analytics/mle/VarMax.py +0 -776
teradataml/analytics/mle/VectorDistance.py +0 -762
teradataml/analytics/mle/WeightedMovAvg.py +0 -400
teradataml/analytics/mle/XGBoost.py +0 -842
teradataml/analytics/mle/XGBoostPredict.py +0 -627
teradataml/analytics/mle/__init__.py +0 -123
teradataml/analytics/mle/json/adaboost_mle.json +0 -135
teradataml/analytics/mle/json/adaboostpredict_mle.json +0 -85
teradataml/analytics/mle/json/antiselect_mle.json +0 -34
teradataml/analytics/mle/json/antiselect_mle_mle.json +0 -34
teradataml/analytics/mle/json/arima_mle.json +0 -172
teradataml/analytics/mle/json/arimapredict_mle.json +0 -52
teradataml/analytics/mle/json/attribution_mle_mle.json +0 -143
teradataml/analytics/mle/json/betweenness_mle.json +0 -97
teradataml/analytics/mle/json/burst_mle.json +0 -140
teradataml/analytics/mle/json/ccm_mle.json +0 -124
teradataml/analytics/mle/json/ccmprepare_mle.json +0 -14
teradataml/analytics/mle/json/cfilter_mle.json +0 -93
teradataml/analytics/mle/json/changepointdetection_mle.json +0 -92
teradataml/analytics/mle/json/changepointdetectionrt_mle.json +0 -78
teradataml/analytics/mle/json/closeness_mle.json +0 -104
teradataml/analytics/mle/json/confusionmatrix_mle.json +0 -79
teradataml/analytics/mle/json/correlation_mle.json +0 -86
teradataml/analytics/mle/json/correlationreduce_mle.json +0 -49
teradataml/analytics/mle/json/coxhazardratio_mle.json +0 -89
teradataml/analytics/mle/json/coxph_mle.json +0 -98
teradataml/analytics/mle/json/coxsurvival_mle.json +0 -79
teradataml/analytics/mle/json/cumulativemovavg_mle.json +0 -34
teradataml/analytics/mle/json/decisionforest_mle.json +0 -167
teradataml/analytics/mle/json/decisionforestevaluator_mle.json +0 -33
teradataml/analytics/mle/json/decisionforestpredict_mle_mle.json +0 -74
teradataml/analytics/mle/json/decisiontree_mle.json +0 -194
teradataml/analytics/mle/json/decisiontreepredict_mle_mle.json +0 -86
teradataml/analytics/mle/json/dtw_mle.json +0 -97
teradataml/analytics/mle/json/dwt2d_mle.json +0 -116
teradataml/analytics/mle/json/dwt_mle.json +0 -101
teradataml/analytics/mle/json/exponentialmovavg_mle.json +0 -55
teradataml/analytics/mle/json/fmeasure_mle.json +0 -58
teradataml/analytics/mle/json/fpgrowth_mle.json +0 -159
teradataml/analytics/mle/json/frequentpaths_mle.json +0 -129
teradataml/analytics/mle/json/glm_mle.json +0 -111
teradataml/analytics/mle/json/glml1l2_mle.json +0 -106
teradataml/analytics/mle/json/glml1l2predict_mle.json +0 -57
teradataml/analytics/mle/json/glmpredict_mle_mle.json +0 -74
teradataml/analytics/mle/json/histogram_mle.json +0 -100
teradataml/analytics/mle/json/hmmdecoder_mle.json +0 -192
teradataml/analytics/mle/json/hmmevaluator_mle.json +0 -206
teradataml/analytics/mle/json/hmmsupervised_mle.json +0 -91
teradataml/analytics/mle/json/hmmunsupervised_mle.json +0 -114
teradataml/analytics/mle/json/identitymatch_mle.json +0 -88
teradataml/analytics/mle/json/idwt2d_mle.json +0 -73
teradataml/analytics/mle/json/idwt_mle.json +0 -66
teradataml/analytics/mle/json/interpolator_mle.json +0 -151
teradataml/analytics/mle/json/kmeans_mle.json +0 -97
teradataml/analytics/mle/json/knn_mle.json +0 -141
teradataml/analytics/mle/json/knnrecommender_mle.json +0 -111
teradataml/analytics/mle/json/knnrecommenderpredict_mle.json +0 -75
teradataml/analytics/mle/json/lar_mle.json +0 -78
teradataml/analytics/mle/json/larpredict_mle.json +0 -69
teradataml/analytics/mle/json/lda_mle.json +0 -130
teradataml/analytics/mle/json/ldainference_mle.json +0 -78
teradataml/analytics/mle/json/ldatopicsummary_mle.json +0 -64
teradataml/analytics/mle/json/levenshteindistance_mle.json +0 -92
teradataml/analytics/mle/json/linreg_mle.json +0 -42
teradataml/analytics/mle/json/linregpredict_mle.json +0 -56
teradataml/analytics/mle/json/minhash_mle.json +0 -113
teradataml/analytics/mle/json/modularity_mle.json +0 -91
teradataml/analytics/mle/json/naivebayespredict_mle_mle.json +0 -85
teradataml/analytics/mle/json/naivebayesreduce_mle.json +0 -52
teradataml/analytics/mle/json/naivebayestextclassifierpredict_mle_mle.json +0 -147
teradataml/analytics/mle/json/naivebayestextclassifiertrainer2_mle.json +0 -108
teradataml/analytics/mle/json/naivebayestextclassifiertrainer_mle.json +0 -102
teradataml/analytics/mle/json/namedentityfinder_mle.json +0 -84
teradataml/analytics/mle/json/namedentityfinderevaluatorreduce_mle.json +0 -43
teradataml/analytics/mle/json/namedentityfindertrainer_mle.json +0 -64
teradataml/analytics/mle/json/nerevaluator_mle.json +0 -54
teradataml/analytics/mle/json/nerextractor_mle.json +0 -87
teradataml/analytics/mle/json/nertrainer_mle.json +0 -89
teradataml/analytics/mle/json/ngrams_mle.json +0 -137
teradataml/analytics/mle/json/ngramsplitter_mle_mle.json +0 -137
teradataml/analytics/mle/json/npath@coprocessor_mle.json +0 -73
teradataml/analytics/mle/json/ntree@coprocessor_mle.json +0 -123
teradataml/analytics/mle/json/pack_mle.json +0 -58
teradataml/analytics/mle/json/pack_mle_mle.json +0 -58
teradataml/analytics/mle/json/pagerank_mle.json +0 -81
teradataml/analytics/mle/json/pathanalyzer_mle.json +0 -63
teradataml/analytics/mle/json/pathgenerator_mle.json +0 -40
teradataml/analytics/mle/json/pathstart_mle.json +0 -62
teradataml/analytics/mle/json/pathsummarizer_mle.json +0 -72
teradataml/analytics/mle/json/pivoting_mle.json +0 -71
teradataml/analytics/mle/json/postagger_mle.json +0 -51
teradataml/analytics/mle/json/randomsample_mle.json +0 -131
teradataml/analytics/mle/json/randomwalksample_mle.json +0 -85
teradataml/analytics/mle/json/roc_mle.json +0 -73
teradataml/analytics/mle/json/sampling_mle.json +0 -75
teradataml/analytics/mle/json/sax_mle.json +0 -154
teradataml/analytics/mle/json/scale_mle.json +0 -93
teradataml/analytics/mle/json/scalebypartition_mle.json +0 -89
teradataml/analytics/mle/json/scalemap_mle.json +0 -44
teradataml/analytics/mle/json/scalesummary_mle.json +0 -14
teradataml/analytics/mle/json/sentenceextractor_mle.json +0 -41
teradataml/analytics/mle/json/sentimentevaluator_mle.json +0 -43
teradataml/analytics/mle/json/sentimentextractor_mle.json +0 -100
teradataml/analytics/mle/json/sentimenttrainer_mle.json +0 -68
teradataml/analytics/mle/json/seriessplitter_mle.json +0 -133
teradataml/analytics/mle/json/sessionize_mle_mle.json +0 -62
teradataml/analytics/mle/json/simplemovavg_mle.json +0 -48
teradataml/analytics/mle/json/stringsimilarity_mle.json +0 -50
teradataml/analytics/mle/json/stringsimilarity_mle_mle.json +0 -50
teradataml/analytics/mle/json/svmdense_mle.json +0 -165
teradataml/analytics/mle/json/svmdensepredict_mle.json +0 -95
teradataml/analytics/mle/json/svmdensesummary_mle.json +0 -58
teradataml/analytics/mle/json/svmsparse_mle.json +0 -148
teradataml/analytics/mle/json/svmsparsepredict_mle_mle.json +0 -103
teradataml/analytics/mle/json/svmsparsesummary_mle.json +0 -57
teradataml/analytics/mle/json/textchunker_mle.json +0 -40
teradataml/analytics/mle/json/textclassifier_mle.json +0 -51
teradataml/analytics/mle/json/textclassifierevaluator_mle.json +0 -43
teradataml/analytics/mle/json/textclassifiertrainer_mle.json +0 -103
teradataml/analytics/mle/json/textmorph_mle.json +0 -63
teradataml/analytics/mle/json/textparser_mle.json +0 -166
teradataml/analytics/mle/json/texttagger_mle.json +0 -81
teradataml/analytics/mle/json/texttokenizer_mle.json +0 -91
teradataml/analytics/mle/json/tf_mle.json +0 -33
teradataml/analytics/mle/json/tfidf_mle.json +0 -34
teradataml/analytics/mle/json/univariatestatistics_mle.json +0 -81
teradataml/analytics/mle/json/unpack_mle.json +0 -91
teradataml/analytics/mle/json/unpack_mle_mle.json +0 -91
teradataml/analytics/mle/json/unpivoting_mle.json +0 -63
teradataml/analytics/mle/json/varmax_mle.json +0 -176
teradataml/analytics/mle/json/vectordistance_mle.json +0 -179
teradataml/analytics/mle/json/weightedmovavg_mle.json +0 -48
teradataml/analytics/mle/json/xgboost_mle.json +0 -178
teradataml/analytics/mle/json/xgboostpredict_mle.json +0 -104
teradataml/analytics/sqle/Antiselect.py +0 -321
teradataml/analytics/sqle/Attribution.py +0 -603
teradataml/analytics/sqle/DecisionForestPredict.py +0 -408
teradataml/analytics/sqle/GLMPredict.py +0 -430
teradataml/analytics/sqle/MovingAverage.py +0 -543
teradataml/analytics/sqle/NGramSplitter.py +0 -548
teradataml/analytics/sqle/NPath.py +0 -632
teradataml/analytics/sqle/NaiveBayesTextClassifierPredict.py +0 -515
teradataml/analytics/sqle/Pack.py +0 -388
teradataml/analytics/sqle/SVMSparsePredict.py +0 -464
teradataml/analytics/sqle/Sessionize.py +0 -390
teradataml/analytics/sqle/StringSimilarity.py +0 -400
teradataml/analytics/sqle/Unpack.py +0 -503
teradataml/analytics/sqle/json/antiselect_sqle.json +0 -21
teradataml/analytics/sqle/json/attribution_sqle.json +0 -92
teradataml/analytics/sqle/json/decisionforestpredict_sqle.json +0 -48
teradataml/analytics/sqle/json/glmpredict_sqle.json +0 -48
teradataml/analytics/sqle/json/h2opredict_sqle.json +0 -63
teradataml/analytics/sqle/json/movingaverage_sqle.json +0 -58
teradataml/analytics/sqle/json/naivebayestextclassifierpredict_sqle.json +0 -76
teradataml/analytics/sqle/json/ngramsplitter_sqle.json +0 -126
teradataml/analytics/sqle/json/npath_sqle.json +0 -67
teradataml/analytics/sqle/json/pack_sqle.json +0 -47
teradataml/analytics/sqle/json/pmmlpredict_sqle.json +0 -55
teradataml/analytics/sqle/json/sessionize_sqle.json +0 -43
teradataml/analytics/sqle/json/stringsimilarity_sqle.json +0 -39
teradataml/analytics/sqle/json/svmsparsepredict_sqle.json +0 -74
teradataml/analytics/sqle/json/unpack_sqle.json +0 -80
teradataml/catalog/model_cataloging.py +0 -980
teradataml/config/mlengine_alias_definitions_v1.0 +0 -118
teradataml/config/mlengine_alias_definitions_v1.1 +0 -127
teradataml/config/mlengine_alias_definitions_v1.3 +0 -129
teradataml/table_operators/sandbox_container_util.py +0 -643
{teradataml-17.20.0.6.dist-info → teradataml-20.0.0.0.dist-info}/WHEEL +0 -0
{teradataml-17.20.0.6.dist-info → teradataml-20.0.0.0.dist-info}/top_level.txt +0 -0
{teradataml-17.20.0.6.dist-info → teradataml-20.0.0.0.dist-info}/zip-safe +0 -0

teradataml/automl/data_transformation.py ADDED Viewed

@@ -0,0 +1,727 @@
+# ##################################################################
+#
+# Copyright 2024 Teradata. All rights reserved.
+# TERADATA CONFIDENTIAL AND TRADE SECRET
+#
+# Primary Owner: Sweta Shaw
+# Email Id: Sweta.Shaw@Teradata.com
+#
+# Secondary Owner: Akhil Bisht
+# Email Id: AKHIL.BISHT@Teradata.com
+#
+# Version: 1.1
+# Function Version: 1.0
+# ##################################################################
+# Python libraries
+import pandas as pd
+# Teradata libraries
+from teradataml.dataframe.dataframe import DataFrame
+from teradataml.dataframe.copy_to import copy_to_sql
+from teradataml import Antiselect
+from teradataml import BincodeTransform
+from teradataml import ConvertTo
+from teradataml import FillRowId
+from teradataml import NonLinearCombineTransform
+from teradataml import OneHotEncodingTransform
+from teradataml import OrdinalEncodingTransform
+from teradataml import RoundColumns
+from teradataml import ScaleTransform
+from teradataml import SimpleImputeTransform
+from teradataml import TargetEncodingTransform
+from teradataml import Transform, UtilFuncs, TeradataConstants
+# AutoML Internal libraries
+from teradataml.automl.feature_exploration import _FeatureExplore
+from teradataml.automl.feature_engineering import _FeatureEngineering
+class _DataTransformation(_FeatureExplore, _FeatureEngineering):
+    def __init__(self,
+                 data,
+                 data_transformation_params,
+                 auto = True,
+                 verbose = 0,
+                 target_column_ind = False,
+                 table_name_mapping = {}):
+        """
+        DESCRIPTION:
+            Function initializes the data, data transformation object and running mode
+            for data transformation.
+        PARAMETERS:
+            data:
+                Required Argument.
+                Specifies the input teradataml Dataframe for data transformation phase.
+                Types: teradataml Dataframe
+            data_transformation_params:
+                Required Arugment.
+                Specifies the parameters for performing data transformation.
+                Types: dict
+            auto:
+                Optional Arugment.
+                Specifies whether to run AutoML in custom mode or auto mode.
+                When set to False, runs in custom mode. Otherwise, by default runs in auto mode.
+                Default Value: True
+                Types: bool
+            verbose:
+                Optional Argument.
+                Specifies the detailed execution steps based on verbose level.
+                Default Value: 0
+                Permitted Values:
+                    * 0: prints no details about data transformation.
+                    * 1: prints the execution steps of data transformation.
+                    * 2: prints the intermediate data between the each step of data transformation.
+                Types: int
+            target_column_ind:
+                Optional Arugment.
+                Specifies whether target column is present in given dataset.
+                Default Value: False
+                Types: bool
+        """
+        self.data = data
+        self.data_transformation_params = data_transformation_params
+        self.auto = auto
+        self.verbose = verbose
+        self.target_column_ind = target_column_ind
+        self.table_name_mapping = table_name_mapping
+    def data_transformation(self):
+        """
+        DESCRIPTION:
+            Function to perform following tasks:
+                1. Performs transformation carried out in feature engineering phase on the test data.
+                2. Performs transformation carried out in data preparation phase on the test data.
+        RETURNS:
+            Table name mapping for the transformed data.
+        """
+        # Initializing Feature Exploration
+        _FeatureExplore.__init__(self,
+                                 data = self.data,
+                                 target_column = None,
+                                 verbose = self.verbose)
+        # Initializing Feature Engineering
+        _FeatureEngineering.__init__(self,
+                                     data = self.data,
+                                     target_column = None,
+                                     model_list = None,
+                                     verbose = self.verbose)
+        self._display_msg(msg="Data Transformation started ...", show_data=True)
+        # Extracting target column details and type whether it is classification or not
+        self.data_target_column = self.data_transformation_params.get("data_target_column")
+        self.classification_type = self.data_transformation_params.get("classification_type", False)
+        # Performing transformation carried out in feature engineering phase
+        self.feature_engineering_transformation()
+        # Performing transformation carried out in data preparation phase
+        self.data_preparation_transformation()
+        self._display_msg(msg="Data Transformation completed.", show_data=True)
+        return self.table_name_mapping
+    def feature_engineering_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs transformation carried out in feature engineering phase
+            on test data using parameters from data_transformation_params.
+        """
+        self._display_msg(msg="Performing transformation carried out in feature engineering phase ...",
+                          show_data=True)
+        # Performing default transformation for both auto and custom mode
+        self._preprocess_transformation()
+        self._futile_column_handling_transformation()
+        # Handling target column transformation
+        if self.target_column_ind and self.classification_type:
+            self._handle_target_column_transformation()
+        self._date_column_handling_transformation()
+        # Performing transformation according to run mode
+        if self.auto:
+            self._missing_value_handling_transformation()
+            self._categorical_encoding_transformation()
+        else:
+            self._custom_missing_value_handling_transformation()
+            self._custom_bincode_column_transformation()
+            self._custom_string_column_transformation()
+            self._custom_categorical_encoding_transformation()
+            self._custom_mathematical_transformation()
+            self._custom_non_linear_transformation()
+            self._custom_anti_select_column_transformation()
+    def data_preparation_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs transformation carried out in data preparation phase
+            on test data using parameters from data_transformation_params.
+        """
+        self._display_msg(msg="Performing transformation carried out in data preparation phase ...",
+                          show_data=True)
+        # Handling features transformed from feature engineering phase
+        self._handle_generated_features_transformation()
+        # Performing transformation including feature selection using lasso, rfe and pca
+        # followed by scaling
+        self._feature_selection_lasso_transformation()
+        self._feature_selection_rfe_transformation()
+        self._feature_selection_pca_transformation()
+    def _preprocess_transformation(self):
+        """
+        DESCRIPTION:
+            Function drops irrelevent columns and adds id column.
+        """
+        # Extracting irrelevent column list
+        columns_to_be_removed = self.data_transformation_params.get("drop_irrelevent_columns", None)
+        if columns_to_be_removed:
+            self.data = self.data.drop(columns_to_be_removed, axis=1)
+            self._display_msg(msg="\nUpdated dataset after dropping irrelevent columns :",
+                              data=self.data)
+        # Adding id column
+        self.data = FillRowId(data=self.data, row_id_column='id').result
+    def _futile_column_handling_transformation(self):
+        """
+        DESCRIPTION:
+            Function drops futile columns from dataset.
+        """
+        # Extracting futile column list
+        futile_cols = self.data_transformation_params.get("futile_columns", None)
+        if futile_cols:
+            self.data = self.data.drop(futile_cols, axis=1)
+            self._display_msg(msg="\nUpdated dataset after dropping futile columns :",
+                              data=self.data)
+    def _date_column_handling_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs transformation on date columns and generates new columns.
+        """
+        # Extracting date columns
+        date_columns = self.data_transformation_params.get("date_columns",None)
+        if date_columns:
+            # Dropping rows with null values in date columns
+            self.data = self.data.dropna(subset=date_columns)
+            # Extracting unique date columns for dropping
+            drop_unique_date_columns = self.data_transformation_params.get("drop_unique_date_columns",None)
+            if drop_unique_date_columns:
+                self.data = self.data.drop(drop_unique_date_columns, axis=1)
+            # Extracting date components parameters for new columns generation
+            extract_date_comp_param = self.data_transformation_params.get("extract_date_comp_param",None)
+            extract_date_comp_col = self.data_transformation_params.get("extract_date_comp_col", None)
+            if extract_date_comp_param:
+                self.data=self.data.assign(**extract_date_comp_param)
+                self.data = self.data.drop(extract_date_comp_col, axis=1)
+            # Extracting irrelevant date component columns for dropping
+            drop_extract_date_columns = self.data_transformation_params.get("drop_extract_date_columns", None)
+            if drop_extract_date_columns:
+                self.data = self.data.drop(drop_extract_date_columns, axis=1)
+            # Extracting date component fit objects for bincode transformation
+            day_component_fit_object = self.data_transformation_params.get("day_component_fit_object", None)
+            month_component_fit_object = self.data_transformation_params.get("month_component_fit_object", None)
+            year_diff_component_fit_object = self.data_transformation_params.get("year_diff_component_fit_object", None)
+            # Performing bincode transformation on day, month and year components
+            for fit_object in [day_component_fit_object, month_component_fit_object, year_diff_component_fit_object]:
+                if fit_object:
+                    for col, bin_code_fit in fit_object.items():
+                        accumulate_columns = self._extract_list(self.data.columns, [col])
+                        transform_params = {
+                            "data": self.data,
+                            "object": bin_code_fit,
+                            "accumulate": accumulate_columns,
+                            "persist": True
+                        }
+                        self.data = BincodeTransform(**transform_params).result
+            self._display_msg(msg="\nUpdated dataset after transforming date columns :",
+                              data=self.data)
+    def _missing_value_handling_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs missing value handling by dropping columns and imputing columns.
+        """
+        # Extracting missing value containing columns to be dropped
+        drop_cols = self.data_transformation_params.get("drop_missing_columns", None)
+        if drop_cols:
+            self.data = self.data.drop(drop_cols, axis=1)
+            self._display_msg(msg="\nUpdated dataset after dropping missing value containing columns : ",
+                              data=self.data)
+        # Extracting imputation columns and fit object for missing value imputation
+        imputation_cols = self.data_transformation_params.get("imputation_columns", None)
+        if imputation_cols:
+            sm_fit_obj = self.data_transformation_params.get("imputation_fit_object")
+            # imputing column using fit object
+            self.data = SimpleImputeTransform(data=self.data,
+                                            object=sm_fit_obj,
+                                            volatile=True).result
+            self._display_msg(msg="\nUpdated dataset after imputing missing value containing columns :",
+                              data=self.data)
+        # Handling rest null, its temporary solution. It subjects to change based on input.
+        dropped_data = self.data.dropna()
+        dropped_count = self.data.shape[0] - dropped_data.shape[0]
+        if dropped_count > 0:
+            self.data = dropped_data
+            self._display_msg(msg="\nFound additional {} rows that contain missing values :".format(dropped_count),
+                              data=self.data)
+            self._display_msg(msg="\nUpdated dataset after dropping additional missing value containing rows :",
+                              data=self.data)
+    def _custom_missing_value_handling_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs missing value handling by dropping columns and imputing
+            columns based on user input.
+        """
+        # Extracting custom missing value containing columns to be dropped
+        drop_col_list = self.data_transformation_params.get("custom_drop_missing_columns", None)
+        if drop_col_list:
+            self.data = self.data.drop(drop_col_list, axis=1)
+            self._display_msg(msg="\nUpdated dataset after dropping customized missing value containing columns :",
+                              data=self.data)
+        # Extracting custom imputation columns and fit object for missing value imputation
+        custom_imp_ind = self.data_transformation_params.get("custom_imputation_ind", False)
+        if custom_imp_ind:
+            sm_fit_obj = self.data_transformation_params.get("custom_imputation_fit_object")
+            # imputing column using fit object
+            self.data = SimpleImputeTransform(data=self.data,
+                                            object=sm_fit_obj,
+                                            volatile=True).result
+            self._display_msg(msg="\nUpdated dataset after imputing customized missing value containing columns :",
+                              data=self.data)
+        # Handling rest with default missing value handling
+        self._missing_value_handling_transformation()
+    def _custom_bincode_column_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs bincode transformation on columns based on user input.
+        """
+        # Extracting custom bincode columns and fit object for bincode transformation
+        custom_bincode_ind = self.data_transformation_params.get("custom_bincode_ind", False)
+        if custom_bincode_ind:
+            # Handling bincode transformation for Equal-Width
+            custom_eql_bincode_col = self.data_transformation_params.get("custom_eql_bincode_col", None)
+            custom_eql_bincode_fit_object = self.data_transformation_params.get("custom_eql_bincode_fit_object", None)
+            if custom_eql_bincode_col:
+                # Extracting accumulate columns
+                accumulate_columns = self._extract_list(self.data.columns, custom_eql_bincode_col)
+                # Adding transform parameters for performing binning with Equal-Width.
+                eql_transform_params={
+                    "data" : self.data,
+                    "object" : custom_eql_bincode_fit_object,
+                    "accumulate" : accumulate_columns,
+                    "persist" : True,
+                }
+                self.data = BincodeTransform(**eql_transform_params).result
+                self._display_msg(msg="\nUpdated dataset after performing customized equal width bin-code transformation :",
+                                  data=self.data)
+            # Hnadling bincode transformation for Variable-Width
+            custom_var_bincode_col = self.data_transformation_params.get("custom_var_bincode_col", None)
+            custom_var_bincode_fit_object = self.data_transformation_params.get("custom_var_bincode_fit_object", None)
+            if custom_var_bincode_col:
+                # Extracting accumulate columns
+                accumulate_columns = self._extract_list(self.data.columns, custom_var_bincode_col)
+                # Adding transform parameters for performing binning with Variable-Width.
+                var_transform_params = {
+                    "data" : self.data,
+                    "object" : custom_var_bincode_fit_object,
+                    "object_order_column" : "TD_MinValue_BINFIT",
+                    "accumulate" : accumulate_columns,
+                    "persist" : True
+                }
+                self.data = BincodeTransform(**var_transform_params).result
+                self._display_msg(msg="\nUpdated dataset after performing customized variable width bin-code transformation :",
+                                  data=self.data)
+    def _custom_string_column_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs string column transformation on categorical columns based on user input.
+        """
+        # Extracting custom string manipulation columns and fit object for performing string manipulation
+        custom_string_manipulation_ind = self.data_transformation_params.get("custom_string_manipulation_ind", False)
+        if custom_string_manipulation_ind:
+            custom_string_manipulation_param = self.data_transformation_params.get('custom_string_manipulation_param', None)
+            # Performing string manipulation for each column
+            for target_col,transform_val in custom_string_manipulation_param.items():
+                self.data = self._str_method_mapping(target_col, transform_val)
+            self._display_msg(msg="\nUpdated dataset after performing customized string manipulation :",
+                              data=self.data)
+    def _categorical_encoding_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs default encoding transformation i.e, one-hot on categorical columns.
+        """
+        # Extracting one hot encoding parameters for performing encoding
+        one_hot_encoding_ind = self.data_transformation_params.get("one_hot_encoding_ind", False)
+        one_hot_encoding_fit_obj = self.data_transformation_params.get("one_hot_encoding_fit_obj", None)
+        one_hot_encoding_drop_list = self.data_transformation_params.get("one_hot_encoding_drop_list", None)
+        if one_hot_encoding_ind:
+            # Adding transform parameters for performing encoding
+            for fit_obj in one_hot_encoding_fit_obj.values():
+                transform_params = {
+                        "data" : self.data,
+                        "object" : fit_obj,
+                        "is_input_dense" : True,
+                        "persist" : True
+                    }
+                # Performing one hot encoding transformation
+                self.data = OneHotEncodingTransform(**transform_params).result
+            # Dropping old columns after encoding
+            self.data = self.data.drop(one_hot_encoding_drop_list, axis=1)
+            self._display_msg(msg="\nUpdated dataset after performing categorical encoding :",
+                            data=self.data)
+    def _custom_categorical_encoding_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs custom encoding transformation on categorical columns based on user input.
+        """
+        # Extracting custom encoding parameters for performing encoding
+        custom_categorical_encoding_ind = self.data_transformation_params.get("custom_categorical_encoding_ind", False)
+        if custom_categorical_encoding_ind:
+            # Extracting parameters for ordinal encoding
+            custom_ord_encoding_fit_obj = self.data_transformation_params.get("custom_ord_encoding_fit_obj", None)
+            custom_ord_encoding_col = self.data_transformation_params.get("custom_ord_encoding_col", None)
+            if custom_ord_encoding_col:
+                # Extracting accumulate columns
+                accumulate_columns = self._extract_list(self.data.columns, custom_ord_encoding_col)
+                # Adding transform parameters for performing encoding
+                transform_params = {
+                    "data" : self.data,
+                    "object" : custom_ord_encoding_fit_obj,
+                    "accumulate" : accumulate_columns,
+                    "persist" : True
+                }
+                # Performing ordinal encoding transformation
+                self.data = OrdinalEncodingTransform(**transform_params).result
+            # Extracting parameters for target encoding
+            custom_target_encoding_ind = self.data_transformation_params.get("custom_target_encoding_ind", False)
+            custom_target_encoding_fit_obj = self.data_transformation_params.get("custom_target_encoding_fit_obj", None)
+            if custom_target_encoding_ind:
+                for col, tar_fit_obj in custom_target_encoding_fit_obj.items():
+                    # Extracting accumulate columns
+                    accumulate_columns = self._extract_list(self.data.columns, [col])
+                    # Adding transform parameters for performing encoding
+                    transform_params = {
+                        "data" : self.data,
+                        "object" : tar_fit_obj,
+                        "accumulate" : accumulate_columns,
+                        "persist" : True
+                    }
+                    # Performing ordinal encoding transformation
+                    self.data = TargetEncodingTransform(**transform_params).result
+            self._display_msg(msg="\nUpdated dataset after performing customized categorical encoding :",
+                              data=self.data)
+        # Handling rest with default categorical encoding transformation
+        self._categorical_encoding_transformation()
+    def _custom_mathematical_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs custom mathematical transformation on numerical columns based on user input.
+        """
+        # Extracting custom mathematical transformation parameters for performing transformation
+        custom_mathematical_transformation_ind = self.data_transformation_params.get("custom_mathematical_transformation_ind", False)
+        if custom_mathematical_transformation_ind:
+            # Extracting parameters for performing numapply transformation
+            custom_numapply_transformation_param = self.data_transformation_params.get("custom_numapply_transformation_param", None)
+            # Checking if numapply transformation param is present
+            if custom_numapply_transformation_param:
+                # Performing transformation for each column
+                for col, transform_val in custom_numapply_transformation_param.items():
+                    self.data = self._numapply_transformation(col,transform_val)
+            # Extracting parameters for performing numerical transformation
+            custom_numerical_transformation_fit_object = self.data_transformation_params.get("custom_numerical_transformation_fit_object", None)
+            # Checking if numerical transformation fit object is present
+            if custom_numerical_transformation_fit_object:
+                # Extracting id columns for performing transformation
+                custom_numerical_transformation_id_columns = self.data_transformation_params.get("custom_numerical_transformation_id_columns", None)
+                # Checking for target column presence and handling id columns accordingly
+                if not self.target_column_ind and \
+                    self.data_target_column in custom_numerical_transformation_id_columns:
+                    custom_numerical_transformation_id_columns = self._extract_list(
+                                                                custom_numerical_transformation_id_columns,
+                                                                [self.data_target_column])
+                # Adding transform parameters for transformation
+                transform_params={
+                    "data" : self.data,
+                    "object" : custom_numerical_transformation_fit_object,
+                    "id_columns" : custom_numerical_transformation_id_columns,
+                    "persist" :True
+                }
+                # Peforming transformation on target columns
+                self.data = Transform(**transform_params).result
+            self._display_msg(msg="\nUpdated dataset after performing customized mathematical transformation :",
+                              data=self.data)
+    def _custom_non_linear_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs custom non-linear transformation on numerical columns based on user input.
+        """
+        # Extracting custom non-linear transformation parameters for performing transformation
+        custom_non_linear_transformation_ind = self.data_transformation_params.get("custom_non_linear_transformation_ind", False)
+        if custom_non_linear_transformation_ind:
+            # Extracting fit object for non-linear transformation
+            fit_obj_list = self.data_transformation_params['custom_non_linear_transformation_fit_object']
+            for comb, fit_obj in fit_obj_list.items():
+                # Adding transform params for transformation
+                transform_params = {
+                    "data" : self.data,
+                    "object" : fit_obj,
+                    "accumulate" : self.data.columns,
+                    "persist" : True
+                }
+                # Performing transformation
+                self.data = NonLinearCombineTransform(**transform_params).result
+            self._display_msg(msg="\nUpdated dataset after performing customized non-linear transformation :",
+                              data=self.data)
+    def _custom_anti_select_column_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs custom anti-select transformation on columns based on user input.
+        """
+        # Extracting custom anti-select transformation parameters for performing transformation
+        custom_anti_select_columns_ind = self.data_transformation_params.get("custom_anti_select_columns_ind", False)
+        if custom_anti_select_columns_ind:
+            # Extracting anti-select column list
+            anti_select_list = self.data_transformation_params.get("custom_anti_select_columns",None)
+            if anti_select_list:
+                fit_params = {
+                    "data" : self.data,
+                    "exclude" : anti_select_list
+                }
+                # Performing transformation for given user input
+                self.data = Antiselect(**fit_params).result
+                self._display_msg(msg="\nUpdated dataset after performing customized anti-selection :",
+                                  data=self.data)
+    def _handle_generated_features_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs rounding up transformation on generated features
+            from feature engineering phase.
+        """
+        # Extracting list of columns to be rounded
+        round_columns = self.data_transformation_params.get("round_columns", None)
+        if round_columns:
+            # Checking for target column presence and handling list accordingly
+            if not self.target_column_ind and self.data_target_column in round_columns:
+                round_columns = self._extract_list(round_columns, [self.data_target_column])
+            # Extracting accumulate columns
+            accumulate_columns = self._extract_list(self.data.columns,round_columns)
+            # Performing rounding up on target column upto 4 precision digit
+            fit_params = {
+                "data" : self.data,
+                "target_columns" : round_columns,
+                "precision_digit" : 4,
+                "accumulate" : accumulate_columns,
+                "persist" : True}
+            self.data = RoundColumns(**fit_params).result
+    def _handle_target_column_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs encoding and datatype transformation on target column
+            for classification problem.
+        """
+        # Fetching target column encoding indicator and fit object
+        target_col_encode_ind = self.data_transformation_params.get("target_col_encode_ind", False)
+        if target_col_encode_ind:
+            # Extracting ordinal encoding fit object for target column
+            target_col_ord_encoding_fit_obj = self.data_transformation_params.get("target_col_ord_encoding_fit_obj", None)
+            if target_col_ord_encoding_fit_obj:
+                # Extracting accumulate columns
+                accumulate_columns = self._extract_list(self.data.columns, [self.data_target_column])
+                # Adding transform parameters for performing encoding
+                transform_params = {
+                    "data" : self.data,
+                    "object" : target_col_ord_encoding_fit_obj,
+                    "accumulate" : accumulate_columns,
+                    "persist" : True
+                }
+                # Performing ordinal encoding transformation
+                self.data = OrdinalEncodingTransform(**transform_params).result
+        # Converting target column to integer datatype
+        params = {
+            "data" : self.data,
+            "target_columns" : [self.data_target_column],
+            "target_datatype" : ["integer"],
+            "accumulate" : self._extract_list(self.data.columns, [self.data_target_column])
+        }
+        self.data = ConvertTo(**params).result
+        self._display_msg(msg="\nUpdated dataset after performing target column transformation :",
+                          data=self.data)
+    def _extract_and_display_features(self, feature_type, feature_list):
+        """
+        DESCRIPTION:
+            Function performs extraction of features using feature_list and target column indicator.
+        PARAMETERS:
+            feature_type:
+                Required Argument.
+                Specifies the type of feature selection.
+                Types: str
+            feature_list:
+                Required Argument.
+                Specifies the list of features to be selected.
+                Types: list
+        RETURNS:
+            Teradataml dataframe with selected features.
+        """
+        # Checking for target column presence and handling list accordingly
+        if not self.target_column_ind and self.data_target_column in feature_list:
+            feature_list = self._extract_list(feature_list, [self.data_target_column])
+        # Creating dataframe with selected features
+        feature_df = self.data[feature_list]
+        # Displaying feature dataframe
+        self._display_msg(msg=f"\nUpdated dataset after performing {feature_type} feature selection:",
+                        data=feature_df)
+        # Returning feature dataframe
+        return feature_df
+    def _feature_selection_lasso_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs feature selection using lasso followed by scaling.
+        """
+        # Extracting features selected by lasso in data preparation phase
+        lasso_features = self.data_transformation_params.get("lasso_features", None)
+        lasso_df = self._extract_and_display_features("Lasso", lasso_features)
+        # Performing feature scaling
+        # Extracting fit object and columns for scaling
+        lasso_scale_fit_obj = self.data_transformation_params.get("lasso_scale_fit_obj", None)
+        lasso_scale_col = self.data_transformation_params.get("lasso_scale_col", None)
+        # Extracting accumulate columns
+        accumulate_cols = self._extract_list(lasso_df.columns, lasso_scale_col)
+        # Scaling dataset
+        lasso_df = ScaleTransform(data=lasso_df,
+                    object=lasso_scale_fit_obj,
+                    accumulate=accumulate_cols).result
+        # Displaying scaled dataset
+        self._display_msg(msg="\nUpdated dataset after performing scaling on Lasso selected features :",
+                          data=lasso_df)
+        # Uploading lasso dataset to table for further use
+        table_name = UtilFuncs._generate_temp_table_name(prefix="lasso_new_test",
+                                                         table_type = TeradataConstants.TERADATA_TABLE)
+        self.table_name_mapping["lasso_new_test"] = table_name
+        copy_to_sql(df = lasso_df, table_name= table_name, if_exists="replace")
+    def _feature_selection_rfe_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs feature selection using rfe followed by scaling.
+        """
+        # Extracting features selected by rfe in data preparation phase
+        rfe_features = self.data_transformation_params.get("rfe_features", None)
+        rfe_df = self._extract_and_display_features("RFE", rfe_features)
+        # Renaming rfe columns
+        rfe_rename_column = self.data_transformation_params.get("rfe_rename_column", None)
+        if rfe_rename_column:
+            new_col_name = {f'r_{col}': rfe_df[col] for col in rfe_rename_column}
+            rfe_df = rfe_df.assign(drop_columns=False, **new_col_name)
+            rfe_df = rfe_df.drop(rfe_rename_column, axis=1)
+        # Performing feature scaling
+        # Extracting fit object and columns for scaling
+        rfe_scale_fit_obj = self.data_transformation_params.get("rfe_scale_fit_obj", None)
+        rfe_scale_col = self.data_transformation_params.get("rfe_scale_col", None)
+        # Extracting accumulate columns
+        accumulate_cols = self._extract_list(rfe_df.columns, rfe_scale_col)
+        # Scaling on rfe dataset
+        rfe_df = ScaleTransform(data=rfe_df,
+                    object=rfe_scale_fit_obj,
+                    accumulate=accumulate_cols).result
+        # Displaying scaled dataset
+        self._display_msg(msg="\nUpdated dataset after performing scaling on RFE selected features :",
+                          data=rfe_df)
+        # Uploading rfe dataset to table for further use
+        table_name = UtilFuncs._generate_temp_table_name(prefix="rfe_new_test",
+                                                         table_type = TeradataConstants.TERADATA_TABLE)
+        self.table_name_mapping["rfe_new_test"] = table_name
+        copy_to_sql(df = rfe_df, table_name= table_name, if_exists="replace")
+    def _feature_selection_pca_transformation(self):
+        """
+        DESCRIPTION:
+            Function performs feature scaling followed by feature selection using pca.
+        """
+        # Extracting fit object and column details for perfroming feature scaling
+        pca_scale_fit_obj = self.data_transformation_params.get("pca_scale_fit_obj", None)
+        pca_scale_col = self.data_transformation_params.get("pca_scale_col", None)
+        # Extracting accumulate columns
+        accumulate_cols = self._extract_list(self.data.columns, pca_scale_col)
+        # Scaling on pca dataset
+        pca_scaled_df = ScaleTransform(data=self.data,
+                    object=pca_scale_fit_obj,
+                    accumulate=accumulate_cols).result
+        # Displaying scaled dataset
+        self._display_msg(msg="\nUpdated dataset after performing scaling for PCA feature selection :",
+                          data=pca_scaled_df)
+        # Convert to pandas dataframe for applying pca
+        pca_scaled_pd = pca_scaled_df.to_pandas()
+        # Extracting pca fit instance for applying pca
+        pca_fit_instance = self.data_transformation_params.get("pca_fit_instance", None)
+        # drop id column and target column if present
+        drop_col = ['id']
+        if self.target_column_ind:
+            drop_col.append(self.data_target_column)
+        pca_df = pca_scaled_pd.drop(columns=drop_col, axis=1)
+        # Applying pca on scaled dataset
+        pca_df = pca_fit_instance.transform(pca_df)
+        # Converting to pandas dataframe
+        pca_df  = pd.DataFrame(pca_df)
+        # Renaming pca columns
+        pca_new_column = self.data_transformation_params.get("pca_new_column", None)
+        pca_df.rename(columns=pca_new_column, inplace=True)
+        # Adding id column to pca dataframe
+        pca_df = pd.concat([pca_scaled_pd.reset_index(drop=True)['id'], pca_df.reset_index(drop=True)], axis=1)
+        # Adding target column to pca dataframe if present
+        if self.target_column_ind:
+            pca_df[self.data_target_column] = pca_scaled_pd[self.data_target_column].reset_index(drop=True)
+        # Displaying pca dataframe
+        self._display_msg(msg="\nUpdated dataset after performing PCA feature selection :",
+                          data=pca_df)
+        # Uploading pca dataset to table for further use
+        table_name = UtilFuncs._generate_temp_table_name(prefix="pca_new_test",
+                                                         table_type = TeradataConstants.TERADATA_TABLE)
+        self.table_name_mapping["pca_new_test"] = table_name
+        copy_to_sql(df = pca_df, table_name=table_name, if_exists="replace")

teradataml 17.20.0.6__py3-none-any.whl → 20.0.0.0__py3-none-any.whl

Potentially problematic release.

teradataml 17.20.0.6py3-none-any.whl → 20.0.0.0py3-none-any.whl