PyPI - teradataml - Versions diffs - 20.0.0.4__py3-none-any.whl → 20.0.0.6__py3-none-any.whl - Mend

teradataml 20.0.0.4py3-none-any.whl → 20.0.0.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of teradataml might be problematic. Click here for more details.

Files changed (131) hide show

teradataml/LICENSE-3RD-PARTY.pdf +0 -0
teradataml/README.md +182 -13
teradataml/__init__.py +2 -1
teradataml/_version.py +2 -2
teradataml/analytics/analytic_function_executor.py +8 -13
teradataml/analytics/json_parser/analytic_functions_argument.py +4 -0
teradataml/analytics/sqle/__init__.py +16 -1
teradataml/analytics/utils.py +60 -1
teradataml/automl/__init__.py +290 -106
teradataml/automl/autodataprep/__init__.py +471 -0
teradataml/automl/data_preparation.py +29 -10
teradataml/automl/data_transformation.py +11 -0
teradataml/automl/feature_engineering.py +64 -4
teradataml/automl/feature_exploration.py +639 -25
teradataml/automl/model_training.py +1 -1
teradataml/clients/auth_client.py +12 -8
teradataml/clients/keycloak_client.py +165 -0
teradataml/common/constants.py +71 -26
teradataml/common/exceptions.py +32 -0
teradataml/common/messagecodes.py +28 -0
teradataml/common/messages.py +13 -4
teradataml/common/sqlbundle.py +3 -2
teradataml/common/utils.py +345 -45
teradataml/context/context.py +259 -93
teradataml/data/apriori_example.json +22 -0
teradataml/data/docs/sqle/docs_17_20/Apriori.py +138 -0
teradataml/data/docs/sqle/docs_17_20/NERExtractor.py +121 -0
teradataml/data/docs/sqle/docs_17_20/NGramSplitter.py +3 -3
teradataml/data/docs/sqle/docs_17_20/SMOTE.py +212 -0
teradataml/data/docs/sqle/docs_17_20/TextMorph.py +119 -0
teradataml/data/docs/sqle/docs_17_20/TextParser.py +54 -3
teradataml/data/docs/uaf/docs_17_20/ACF.py +1 -1
teradataml/data/docs/uaf/docs_17_20/ArimaEstimate.py +2 -2
teradataml/data/docs/uaf/docs_17_20/ArimaXEstimate.py +2 -2
teradataml/data/docs/uaf/docs_17_20/DFFT.py +1 -1
teradataml/data/docs/uaf/docs_17_20/DFFT2.py +1 -1
teradataml/data/docs/uaf/docs_17_20/DFFT2Conv.py +1 -1
teradataml/data/docs/uaf/docs_17_20/DFFTConv.py +1 -1
teradataml/data/docs/uaf/docs_17_20/FilterFactory1d.py +4 -4
teradataml/data/docs/uaf/docs_17_20/GenseriesSinusoids.py +2 -2
teradataml/data/docs/uaf/docs_17_20/GoldfeldQuandt.py +2 -2
teradataml/data/docs/uaf/docs_17_20/HoltWintersForecaster.py +6 -6
teradataml/data/docs/uaf/docs_17_20/LineSpec.py +1 -1
teradataml/data/docs/uaf/docs_17_20/LinearRegr.py +1 -1
teradataml/data/docs/uaf/docs_17_20/Matrix2Image.py +4 -4
teradataml/data/docs/uaf/docs_17_20/MultivarRegr.py +1 -1
teradataml/data/docs/uaf/docs_17_20/PACF.py +1 -1
teradataml/data/docs/uaf/docs_17_20/PowerSpec.py +2 -2
teradataml/data/docs/uaf/docs_17_20/PowerTransform.py +3 -3
teradataml/data/docs/uaf/docs_17_20/Resample.py +5 -5
teradataml/data/docs/uaf/docs_17_20/SAX.py +3 -3
teradataml/data/docs/uaf/docs_17_20/SignifPeriodicities.py +1 -1
teradataml/data/docs/uaf/docs_17_20/SimpleExp.py +1 -1
teradataml/data/docs/uaf/docs_17_20/Smoothma.py +3 -3
teradataml/data/docs/uaf/docs_17_20/UNDIFF.py +1 -1
teradataml/data/jsons/byom/onnxembeddings.json +1 -0
teradataml/data/jsons/sqle/17.20/NGramSplitter.json +6 -6
teradataml/data/jsons/sqle/17.20/TD_Apriori.json +181 -0
teradataml/data/jsons/sqle/17.20/TD_NERExtractor.json +145 -0
teradataml/data/jsons/sqle/17.20/TD_SMOTE.json +267 -0
teradataml/data/jsons/sqle/17.20/TD_TextMorph.json +134 -0
teradataml/data/jsons/sqle/17.20/TD_TextParser.json +114 -9
teradataml/data/jsons/sqle/20.00/AI_AnalyzeSentiment.json +328 -0
teradataml/data/jsons/sqle/20.00/AI_AskLLM.json +420 -0
teradataml/data/jsons/sqle/20.00/AI_DetectLanguage.json +343 -0
teradataml/data/jsons/sqle/20.00/AI_ExtractKeyPhrases.json +328 -0
teradataml/data/jsons/sqle/20.00/AI_MaskPII.json +328 -0
teradataml/data/jsons/sqle/20.00/AI_RecognizeEntities.json +328 -0
teradataml/data/jsons/sqle/20.00/AI_RecognizePIIEntities.json +328 -0
teradataml/data/jsons/sqle/20.00/AI_TextClassifier.json +359 -0
teradataml/data/jsons/sqle/20.00/AI_TextEmbeddings.json +360 -0
teradataml/data/jsons/sqle/20.00/AI_TextSummarize.json +343 -0
teradataml/data/jsons/sqle/20.00/AI_TextTranslate.json +343 -0
teradataml/data/jsons/sqle/20.00/TD_SMOTE.json +2 -2
teradataml/data/jsons/sqle/20.00/TD_VectorDistance.json +1 -1
teradataml/data/ner_dict.csv +8 -0
teradataml/data/ner_input_eng.csv +7 -0
teradataml/data/ner_rule.csv +5 -0
teradataml/data/pattern_matching_data.csv +11 -0
teradataml/data/pos_input.csv +40 -0
teradataml/data/sdk/modelops/modelops_spec.json +101737 -0
teradataml/data/tdnerextractor_example.json +14 -0
teradataml/data/teradataml_example.json +21 -1
teradataml/data/textmorph_example.json +5 -0
teradataml/data/to_num_data.csv +4 -0
teradataml/data/tochar_data.csv +5 -0
teradataml/data/trans_dense.csv +16 -0
teradataml/data/trans_sparse.csv +55 -0
teradataml/data/url_data.csv +10 -9
teradataml/dataframe/copy_to.py +38 -27
teradataml/dataframe/data_transfer.py +61 -45
teradataml/dataframe/dataframe.py +1110 -132
teradataml/dataframe/dataframe_utils.py +73 -27
teradataml/dataframe/functions.py +1070 -9
teradataml/dataframe/sql.py +750 -959
teradataml/dbutils/dbutils.py +33 -13
teradataml/dbutils/filemgr.py +14 -10
teradataml/hyperparameter_tuner/utils.py +4 -2
teradataml/lib/aed_0_1.dll +0 -0
teradataml/opensource/_base.py +12 -157
teradataml/options/configure.py +24 -9
teradataml/scriptmgmt/UserEnv.py +317 -39
teradataml/scriptmgmt/lls_utils.py +456 -135
teradataml/sdk/README.md +79 -0
teradataml/sdk/__init__.py +4 -0
teradataml/sdk/_auth_modes.py +422 -0
teradataml/sdk/_func_params.py +487 -0
teradataml/sdk/_json_parser.py +453 -0
teradataml/sdk/_openapi_spec_constants.py +249 -0
teradataml/sdk/_utils.py +236 -0
teradataml/sdk/api_client.py +897 -0
teradataml/sdk/constants.py +62 -0
teradataml/sdk/modelops/__init__.py +98 -0
teradataml/sdk/modelops/_client.py +406 -0
teradataml/sdk/modelops/_constants.py +304 -0
teradataml/sdk/modelops/models.py +2308 -0
teradataml/sdk/spinner.py +107 -0
teradataml/store/__init__.py +1 -1
teradataml/table_operators/Apply.py +16 -1
teradataml/table_operators/Script.py +20 -1
teradataml/table_operators/query_generator.py +4 -21
teradataml/table_operators/table_operator_util.py +58 -9
teradataml/utils/dtypes.py +4 -2
teradataml/utils/internal_buffer.py +22 -2
teradataml/utils/utils.py +0 -1
teradataml/utils/validators.py +318 -58
{teradataml-20.0.0.4.dist-info → teradataml-20.0.0.6.dist-info}/METADATA +188 -14
{teradataml-20.0.0.4.dist-info → teradataml-20.0.0.6.dist-info}/RECORD +131 -84
{teradataml-20.0.0.4.dist-info → teradataml-20.0.0.6.dist-info}/WHEEL +0 -0
{teradataml-20.0.0.4.dist-info → teradataml-20.0.0.6.dist-info}/top_level.txt +0 -0
{teradataml-20.0.0.4.dist-info → teradataml-20.0.0.6.dist-info}/zip-safe +0 -0

teradataml/automl/feature_engineering.py CHANGED Viewed

@@ -137,6 +137,9 @@ class _FeatureEngineering:
         self.persist = kwargs.get('persist', False)
         self.volatile = kwargs.get('volatile', False) or (configure.temp_object_type == TeradataConstants.TERADATA_VOLATILE_TABLE and self.persist is False)
+        self.data_mapping = {}
+        self.progress_prefix = kwargs.get('progress_prefix', None)
+        self.aml_phases = kwargs.get('automl_phases', None)
     # Method for doing feature engineering on data -> adding id, removing futile col, imputation, encoding(one hot)
     def feature_engineering(self,
@@ -162,7 +165,7 @@ class _FeatureEngineering:
              second element represents list of columns which are not participating in outlier tranformation.
         """
         # Assigning number of base jobs for progress bar.
-        base_jobs = 13 if auto else 17
+        base_jobs = 12 if auto else 17
         # Updating model list based on distinct value of target column for classification type
         if self.is_classification_type():
@@ -172,10 +175,14 @@ class _FeatureEngineering:
         # Updating number of jobs for progress bar based on number of models.
         jobs = base_jobs + len(self.model_list)
-        self.progress_bar = _ProgressBar(jobs=jobs, verbose=2, prefix='Automl Running:')
+        self.progress_bar = _ProgressBar(jobs=jobs,
+                                         verbose=2,
+                                         prefix=self.progress_prefix)
         self._display_heading(phase=1,
-                              progress_bar=self.progress_bar)
+                              progress_bar=self.progress_bar,
+                              automl_phases=self.aml_phases)
         self._display_msg(msg='Feature Engineering started ...',
                           progress_bar=self.progress_bar)
@@ -239,7 +246,7 @@ class _FeatureEngineering:
             self._non_linear_transformation()
             self.progress_bar.update()
-        return self.data, self.excluded_cols, self.target_label, self.data_transform_dict
+        return self.data, self.excluded_cols, self.target_label, self.data_transform_dict, self.data_mapping
     def _extract_list(self,
                       list1,
@@ -369,6 +376,9 @@ class _FeatureEngineering:
             # Extracting Futile columns
             f_cols = [row[0] for row in gfc_out.result.itertuples()]
+            self.data_mapping['categorical_summary'] = obj.result._table_name
+            self.data_mapping['futile_columns'] = gfc_out.result._table_name
             if len(f_cols) == 0:
                 self._display_msg(inline_msg="Analysis indicates all categorical columns are significant. No action Needed.",
@@ -378,6 +388,15 @@ class _FeatureEngineering:
                 self.data = self.data.drop(f_cols, axis=1)
                 # Storing futile column list in data transform dictionary
                 self.data_transform_dict['futile_columns'] = f_cols
+                if self.persist:
+                    table_name = UtilFuncs._generate_temp_table_name(table_type=TeradataConstants.TERADATA_TABLE,
+                                                                     gc_on_quit=False)
+                    self.data.to_sql(table_name)
+                else:
+                    self.data.materialize()
+                self.data_mapping['data_without_futile_columns'] = self.data._table_name
                 self._display_msg(msg='Removing Futile columns:',
                                   col_lst=f_cols,
                                   progress_bar=self.progress_bar)
@@ -553,6 +572,13 @@ class _FeatureEngineering:
             # Storing date column list in data transform dictionary
             self.data_transform_dict['date_columns'] = self.date_column_list
             self._handle_date_columns_helper()
+            if self.persist:
+                table_name = UtilFuncs._generate_temp_table_name(table_type=TeradataConstants.TERADATA_TABLE,
+                                                                 gc_on_quit=False)
+                self.data.to_sql(table_name)
+            else:
+                self.data.materialize()
+            self.data_mapping['data_after_date_handling'] = self.data._table_name
         end_time = time.time()
         self._display_msg(msg="Total time to handle date features: {:.2f} sec\n".format(end_time-start_time),
@@ -766,6 +792,9 @@ class _FeatureEngineering:
                                        persist=self.persist)
             self.data = sm.result
+            self.data_mapping['fit_simpleimpute_output'] = fit_obj.output_data._table_name
+            self.data_mapping['fit_simpleimpute_result'] = fit_obj.output._table_name
+            self.data_mapping['data_without_missing_values'] = self.data._table_name
             self._display_msg(msg="Sample of dataset after Imputation:",
                               data=self.data,
                               progress_bar=self.progress_bar)
@@ -878,6 +907,11 @@ class _FeatureEngineering:
                             transform_param["persist"] = False
                         # Updating dataset with transform result
                         self.data = SimpleImputeTransform(**transform_param).result
+                        self.data_mapping['fit_simpleimpute_output'] = fit_obj.output_data._table_name
+                        self.data_mapping['fit_simpleimpute_result'] = fit_obj.output._table_name
+                        self.data_mapping['data_without_missing_values'] = self.data._table_name
                         if not volatile and not persist:
                             # Adding transformed data containing table to garbage collector
                             GarbageCollector._add_to_garbagecollector(self.data._table_name)
@@ -984,6 +1018,10 @@ class _FeatureEngineering:
                     if not volatile and not persist:
                         # Adding transformed data containing table to garbage collector
                         GarbageCollector._add_to_garbagecollector(self.data._table_name)
+                    self.data_mapping['fit_eql_width'] = eql_bin_code_fit.output._table_name
+                    self.data_mapping['eql_width_bincoded_data'] = self.data._table_name
                     self._display_msg(msg="\nUpdated dataset sample after performing Equal-Width binning :-",
                                       data=self.data,
                                       progress_bar=self.progress_bar)
@@ -1032,6 +1070,8 @@ class _FeatureEngineering:
                         var_transform_params["volatile"] = True
                         var_transform_params["persist"] = False
                     self.data = BincodeTransform(**var_transform_params).result
+                    self.data_mapping['fit_var_width'] = var_bin_code_fit.output._table_name
+                    self.data_mapping['var_width_bincoded_data'] = self.data._table_name
                     if not volatile and not persist:
                         # Adding transformed data containing table to garbage collector
                         GarbageCollector._add_to_garbagecollector(self.data._table_name)
@@ -1153,6 +1193,7 @@ class _FeatureEngineering:
         if not volatile and not persist:
             # Adding transformed data containing table to garbage collector
             GarbageCollector._add_to_garbagecollector(transform_output._table_name)
+        self.data_mapping['string_manipulated_data'] = transform_output._table_name
         return transform_output
     def _one_hot_encoding(self,
@@ -1222,6 +1263,9 @@ class _FeatureEngineering:
             # Adding transformed data containing table to garbage collector
             GarbageCollector._add_to_garbagecollector(transform_output._table_name)
         self.data = transform_output.drop(drop_lst, axis=1)
+        self.data.materialize()
+        self.data_mapping['one_hot_encoded_data'] = transform_output._table_name
+        self.data_mapping['fit_ohe_result'] = fit_obj.result._table_name
     def _ordinal_encoding(self,
                           ordinal_columns):
@@ -1279,6 +1323,10 @@ class _FeatureEngineering:
             # Adding transformed data containing table to garbage collector
             GarbageCollector._add_to_garbagecollector(self.data._table_name)
+        self.data_mapping['fit_ordinal_output'] = ord_fit_obj.output_data._table_name
+        self.data_mapping['fit_ordinal_result'] = ord_fit_obj.result._table_name
+        self.data_mapping['ordinal_encoded_data'] = self.data._table_name
         if len(ordinal_columns) == 1 and ordinal_columns[0] == self.target_column:
             self.target_label = ord_fit_obj
@@ -1325,6 +1373,7 @@ class _FeatureEngineering:
                 "encoder_method" : encoder_method,
                 "target_columns" : col,
                 "response_column" : response_column,
+                "default_values": -1,
                 "volatile" : volatile,
                 "persist" : persist
                 }
@@ -1358,6 +1407,9 @@ class _FeatureEngineering:
             if not volatile and not persist:
                 # Adding transformed data containing table to garbage collector
                 GarbageCollector._add_to_garbagecollector(self.data._table_name)
+            self.data_mapping[f'fit_{col}_target_output'] = tar_fit_obj.output_data._table_name
+            self.data_mapping[f'fit_{col}_target_result'] = tar_fit_obj.result._table_name
+            self.data_mapping[f'{col}_target_encoded_data'] = self.data._table_name
     def _encoding_categorical_columns(self):
         """
@@ -1590,6 +1642,9 @@ class _FeatureEngineering:
         if not volatile and not persist:
             # Adding transformed data containing table to garbage collector
             GarbageCollector._add_to_garbagecollector(self.data._table_name)
+        self.data_mapping['fit_numerical_result'] = num_fit_obj.result._table_name
+        self.data_mapping['numerical_transformed_data'] = self.data._table_name
         self._display_msg(msg="Updated dataset sample after applying numerical transformation:",
                           data=self.data,
                           progress_bar=self.progress_bar)
@@ -1630,6 +1685,7 @@ class _FeatureEngineering:
                     if apply_method in (["sininv","sigmoid"]):
                         # Applying numapply transformation
                         self.data = self._numapply_transformation(col,transform_val)
+                        self.data_mapping[f'{apply_method}_transformed_data'] = self.data._table_name
                         self._display_msg(msg="Updated dataset sample after applying numapply transformation:",
                                           data=self.data,
                                           progress_bar=self.progress_bar)
@@ -1734,6 +1790,10 @@ class _FeatureEngineering:
                             transform_params["persist"] = False
                         self.data = NonLinearCombineTransform(**transform_params).result
+                        self.data_mapping[f'fit_nonlinear_{comb}_output'] = fit_obj.output_data._table_name
+                        self.data_mapping[f'fit_nonlinear_{comb}_result'] = fit_obj.result._table_name
+                        self.data_mapping['non_linear_transformed_data'] = self.data._table_name
                         if not volatile and not persist:
                             # Adding transformed data containing table to garbage collector
                             GarbageCollector._add_to_garbagecollector(self.data._table_name)

teradataml 20.0.0.4__py3-none-any.whl → 20.0.0.6__py3-none-any.whl

Potentially problematic release.

teradataml 20.0.0.4py3-none-any.whl → 20.0.0.6py3-none-any.whl