PyPI - oracle-ads - Versions diffs - 2.13.9rc0__py3-none-any.whl → 2.13.10rc0__py3-none-any.whl - Mend

oracle-ads 2.13.9rc0py3-none-any.whl → 2.13.10rc0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (858) hide show

ads/aqua/__init__.py +40 -0
ads/aqua/app.py +507 -0
ads/aqua/cli.py +96 -0
ads/aqua/client/__init__.py +3 -0
ads/aqua/client/client.py +836 -0
ads/aqua/client/openai_client.py +305 -0
ads/aqua/common/__init__.py +5 -0
ads/aqua/common/decorator.py +125 -0
ads/aqua/common/entities.py +274 -0
ads/aqua/common/enums.py +134 -0
ads/aqua/common/errors.py +109 -0
ads/aqua/common/utils.py +1295 -0
ads/aqua/config/__init__.py +4 -0
ads/aqua/config/container_config.py +247 -0
ads/aqua/config/evaluation/__init__.py +4 -0
ads/aqua/config/evaluation/evaluation_service_config.py +147 -0
ads/aqua/config/utils/__init__.py +4 -0
ads/aqua/config/utils/serializer.py +339 -0
ads/aqua/constants.py +116 -0
ads/aqua/data.py +14 -0
ads/aqua/dummy_data/icon.txt +1 -0
ads/aqua/dummy_data/oci_model_deployments.json +56 -0
ads/aqua/dummy_data/oci_models.json +1 -0
ads/aqua/dummy_data/readme.md +26 -0
ads/aqua/evaluation/__init__.py +8 -0
ads/aqua/evaluation/constants.py +53 -0
ads/aqua/evaluation/entities.py +186 -0
ads/aqua/evaluation/errors.py +70 -0
ads/aqua/evaluation/evaluation.py +1814 -0
ads/aqua/extension/__init__.py +42 -0
ads/aqua/extension/aqua_ws_msg_handler.py +76 -0
ads/aqua/extension/base_handler.py +90 -0
ads/aqua/extension/common_handler.py +121 -0
ads/aqua/extension/common_ws_msg_handler.py +36 -0
ads/aqua/extension/deployment_handler.py +381 -0
ads/aqua/extension/deployment_ws_msg_handler.py +54 -0
ads/aqua/extension/errors.py +30 -0
ads/aqua/extension/evaluation_handler.py +129 -0
ads/aqua/extension/evaluation_ws_msg_handler.py +61 -0
ads/aqua/extension/finetune_handler.py +96 -0
ads/aqua/extension/model_handler.py +390 -0
ads/aqua/extension/models/__init__.py +0 -0
ads/aqua/extension/models/ws_models.py +145 -0
ads/aqua/extension/models_ws_msg_handler.py +50 -0
ads/aqua/extension/ui_handler.py +300 -0
ads/aqua/extension/ui_websocket_handler.py +130 -0
ads/aqua/extension/utils.py +133 -0
ads/aqua/finetuning/__init__.py +7 -0
ads/aqua/finetuning/constants.py +23 -0
ads/aqua/finetuning/entities.py +181 -0
ads/aqua/finetuning/finetuning.py +749 -0
ads/aqua/model/__init__.py +8 -0
ads/aqua/model/constants.py +60 -0
ads/aqua/model/entities.py +385 -0
ads/aqua/model/enums.py +32 -0
ads/aqua/model/model.py +2134 -0
ads/aqua/model/utils.py +52 -0
ads/aqua/modeldeployment/__init__.py +6 -0
ads/aqua/modeldeployment/constants.py +10 -0
ads/aqua/modeldeployment/deployment.py +1315 -0
ads/aqua/modeldeployment/entities.py +653 -0
ads/aqua/modeldeployment/utils.py +543 -0
ads/aqua/resources/gpu_shapes_index.json +94 -0
ads/aqua/server/__init__.py +4 -0
ads/aqua/server/__main__.py +24 -0
ads/aqua/server/app.py +47 -0
ads/aqua/server/aqua_spec.yml +1291 -0
ads/aqua/training/__init__.py +4 -0
ads/aqua/training/exceptions.py +476 -0
ads/aqua/ui.py +519 -0
ads/automl/__init__.py +9 -0
ads/automl/driver.py +330 -0
ads/automl/provider.py +975 -0
ads/bds/__init__.py +5 -0
ads/bds/auth.py +127 -0
ads/bds/big_data_service.py +255 -0
ads/catalog/__init__.py +19 -0
ads/catalog/model.py +1576 -0
ads/catalog/notebook.py +461 -0
ads/catalog/project.py +468 -0
ads/catalog/summary.py +178 -0
ads/common/__init__.py +11 -0
ads/common/analyzer.py +65 -0
ads/common/artifact/.model-ignore +63 -0
ads/common/artifact/__init__.py +10 -0
ads/common/auth.py +1122 -0
ads/common/card_identifier.py +83 -0
ads/common/config.py +647 -0
ads/common/data.py +165 -0
ads/common/decorator/__init__.py +9 -0
ads/common/decorator/argument_to_case.py +88 -0
ads/common/decorator/deprecate.py +69 -0
ads/common/decorator/require_nonempty_arg.py +65 -0
ads/common/decorator/runtime_dependency.py +178 -0
ads/common/decorator/threaded.py +97 -0
ads/common/decorator/utils.py +35 -0
ads/common/dsc_file_system.py +303 -0
ads/common/error.py +14 -0
ads/common/extended_enum.py +81 -0
ads/common/function/__init__.py +5 -0
ads/common/function/fn_util.py +142 -0
ads/common/function/func_conf.yaml +25 -0
ads/common/ipython.py +76 -0
ads/common/model.py +679 -0
ads/common/model_artifact.py +1759 -0
ads/common/model_artifact_schema.json +107 -0
ads/common/model_export_util.py +664 -0
ads/common/model_metadata.py +24 -0
ads/common/object_storage_details.py +296 -0
ads/common/oci_client.py +179 -0
ads/common/oci_datascience.py +46 -0
ads/common/oci_logging.py +1144 -0
ads/common/oci_mixin.py +957 -0
ads/common/oci_resource.py +136 -0
ads/common/serializer.py +559 -0
ads/common/utils.py +1852 -0
ads/common/word_lists.py +1491 -0
ads/common/work_request.py +189 -0
ads/config.py +1 -0
ads/data_labeling/__init__.py +13 -0
ads/data_labeling/boundingbox.py +253 -0
ads/data_labeling/constants.py +47 -0
ads/data_labeling/data_labeling_service.py +244 -0
ads/data_labeling/interface/__init__.py +5 -0
ads/data_labeling/interface/loader.py +16 -0
ads/data_labeling/interface/parser.py +16 -0
ads/data_labeling/interface/reader.py +23 -0
ads/data_labeling/loader/__init__.py +5 -0
ads/data_labeling/loader/file_loader.py +241 -0
ads/data_labeling/metadata.py +110 -0
ads/data_labeling/mixin/__init__.py +5 -0
ads/data_labeling/mixin/data_labeling.py +232 -0
ads/data_labeling/ner.py +129 -0
ads/data_labeling/parser/__init__.py +5 -0
ads/data_labeling/parser/dls_record_parser.py +388 -0
ads/data_labeling/parser/export_metadata_parser.py +94 -0
ads/data_labeling/parser/export_record_parser.py +473 -0
ads/data_labeling/reader/__init__.py +5 -0
ads/data_labeling/reader/dataset_reader.py +574 -0
ads/data_labeling/reader/dls_record_reader.py +121 -0
ads/data_labeling/reader/export_record_reader.py +62 -0
ads/data_labeling/reader/jsonl_reader.py +75 -0
ads/data_labeling/reader/metadata_reader.py +203 -0
ads/data_labeling/reader/record_reader.py +263 -0
ads/data_labeling/record.py +52 -0
ads/data_labeling/visualizer/__init__.py +5 -0
ads/data_labeling/visualizer/image_visualizer.py +525 -0
ads/data_labeling/visualizer/text_visualizer.py +357 -0
ads/database/__init__.py +5 -0
ads/database/connection.py +338 -0
ads/dataset/__init__.py +10 -0
ads/dataset/capabilities.md +51 -0
ads/dataset/classification_dataset.py +339 -0
ads/dataset/correlation.py +226 -0
ads/dataset/correlation_plot.py +563 -0
ads/dataset/dask_series.py +173 -0
ads/dataset/dataframe_transformer.py +110 -0
ads/dataset/dataset.py +1979 -0
ads/dataset/dataset_browser.py +360 -0
ads/dataset/dataset_with_target.py +995 -0
ads/dataset/exception.py +25 -0
ads/dataset/factory.py +987 -0
ads/dataset/feature_engineering_transformer.py +35 -0
ads/dataset/feature_selection.py +107 -0
ads/dataset/forecasting_dataset.py +26 -0
ads/dataset/helper.py +1450 -0
ads/dataset/label_encoder.py +99 -0
ads/dataset/mixin/__init__.py +5 -0
ads/dataset/mixin/dataset_accessor.py +134 -0
ads/dataset/pipeline.py +58 -0
ads/dataset/plot.py +710 -0
ads/dataset/progress.py +86 -0
ads/dataset/recommendation.py +297 -0
ads/dataset/recommendation_transformer.py +502 -0
ads/dataset/regression_dataset.py +14 -0
ads/dataset/sampled_dataset.py +1050 -0
ads/dataset/target.py +98 -0
ads/dataset/timeseries.py +18 -0
ads/dbmixin/__init__.py +5 -0
ads/dbmixin/db_pandas_accessor.py +153 -0
ads/environment/__init__.py +9 -0
ads/environment/ml_runtime.py +66 -0
ads/evaluations/README.md +14 -0
ads/evaluations/__init__.py +109 -0
ads/evaluations/evaluation_plot.py +983 -0
ads/evaluations/evaluator.py +1334 -0
ads/evaluations/statistical_metrics.py +543 -0
ads/experiments/__init__.py +9 -0
ads/experiments/capabilities.md +0 -0
ads/explanations/__init__.py +21 -0
ads/explanations/base_explainer.py +142 -0
ads/explanations/capabilities.md +83 -0
ads/explanations/explainer.py +190 -0
ads/explanations/mlx_global_explainer.py +1050 -0
ads/explanations/mlx_interface.py +386 -0
ads/explanations/mlx_local_explainer.py +287 -0
ads/explanations/mlx_whatif_explainer.py +201 -0
ads/feature_engineering/__init__.py +20 -0
ads/feature_engineering/accessor/__init__.py +5 -0
ads/feature_engineering/accessor/dataframe_accessor.py +535 -0
ads/feature_engineering/accessor/mixin/__init__.py +5 -0
ads/feature_engineering/accessor/mixin/correlation.py +166 -0
ads/feature_engineering/accessor/mixin/eda_mixin.py +266 -0
ads/feature_engineering/accessor/mixin/eda_mixin_series.py +85 -0
ads/feature_engineering/accessor/mixin/feature_types_mixin.py +211 -0
ads/feature_engineering/accessor/mixin/utils.py +65 -0
ads/feature_engineering/accessor/series_accessor.py +431 -0
ads/feature_engineering/adsimage/__init__.py +5 -0
ads/feature_engineering/adsimage/image.py +192 -0
ads/feature_engineering/adsimage/image_reader.py +170 -0
ads/feature_engineering/adsimage/interface/__init__.py +5 -0
ads/feature_engineering/adsimage/interface/reader.py +19 -0
ads/feature_engineering/adsstring/__init__.py +7 -0
ads/feature_engineering/adsstring/oci_language/__init__.py +8 -0
ads/feature_engineering/adsstring/string/__init__.py +8 -0
ads/feature_engineering/data_schema.json +57 -0
ads/feature_engineering/dataset/__init__.py +5 -0
ads/feature_engineering/dataset/zip_code_data.py +42062 -0
ads/feature_engineering/exceptions.py +40 -0
ads/feature_engineering/feature_type/__init__.py +133 -0
ads/feature_engineering/feature_type/address.py +184 -0
ads/feature_engineering/feature_type/adsstring/__init__.py +5 -0
ads/feature_engineering/feature_type/adsstring/common_regex_mixin.py +164 -0
ads/feature_engineering/feature_type/adsstring/oci_language.py +93 -0
ads/feature_engineering/feature_type/adsstring/parsers/__init__.py +5 -0
ads/feature_engineering/feature_type/adsstring/parsers/base.py +47 -0
ads/feature_engineering/feature_type/adsstring/parsers/nltk_parser.py +96 -0
ads/feature_engineering/feature_type/adsstring/parsers/spacy_parser.py +221 -0
ads/feature_engineering/feature_type/adsstring/string.py +258 -0
ads/feature_engineering/feature_type/base.py +58 -0
ads/feature_engineering/feature_type/boolean.py +183 -0
ads/feature_engineering/feature_type/category.py +146 -0
ads/feature_engineering/feature_type/constant.py +137 -0
ads/feature_engineering/feature_type/continuous.py +151 -0
ads/feature_engineering/feature_type/creditcard.py +314 -0
ads/feature_engineering/feature_type/datetime.py +190 -0
ads/feature_engineering/feature_type/discrete.py +134 -0
ads/feature_engineering/feature_type/document.py +43 -0
ads/feature_engineering/feature_type/gis.py +251 -0
ads/feature_engineering/feature_type/handler/__init__.py +5 -0
ads/feature_engineering/feature_type/handler/feature_validator.py +524 -0
ads/feature_engineering/feature_type/handler/feature_warning.py +319 -0
ads/feature_engineering/feature_type/handler/warnings.py +128 -0
ads/feature_engineering/feature_type/integer.py +142 -0
ads/feature_engineering/feature_type/ip_address.py +144 -0
ads/feature_engineering/feature_type/ip_address_v4.py +138 -0
ads/feature_engineering/feature_type/ip_address_v6.py +138 -0
ads/feature_engineering/feature_type/lat_long.py +256 -0
ads/feature_engineering/feature_type/object.py +43 -0
ads/feature_engineering/feature_type/ordinal.py +132 -0
ads/feature_engineering/feature_type/phone_number.py +135 -0
ads/feature_engineering/feature_type/string.py +171 -0
ads/feature_engineering/feature_type/text.py +93 -0
ads/feature_engineering/feature_type/unknown.py +43 -0
ads/feature_engineering/feature_type/zip_code.py +164 -0
ads/feature_engineering/feature_type_manager.py +406 -0
ads/feature_engineering/schema.py +795 -0
ads/feature_engineering/utils.py +245 -0
ads/feature_store/.readthedocs.yaml +19 -0
ads/feature_store/README.md +65 -0
ads/feature_store/__init__.py +9 -0
ads/feature_store/common/__init__.py +0 -0
ads/feature_store/common/enums.py +339 -0
ads/feature_store/common/exceptions.py +18 -0
ads/feature_store/common/spark_session_singleton.py +125 -0
ads/feature_store/common/utils/__init__.py +0 -0
ads/feature_store/common/utils/base64_encoder_decoder.py +72 -0
ads/feature_store/common/utils/feature_schema_mapper.py +283 -0
ads/feature_store/common/utils/transformation_utils.py +82 -0
ads/feature_store/common/utils/utility.py +403 -0
ads/feature_store/data_validation/__init__.py +0 -0
ads/feature_store/data_validation/great_expectation.py +129 -0
ads/feature_store/dataset.py +1230 -0
ads/feature_store/dataset_job.py +530 -0
ads/feature_store/docs/Dockerfile +7 -0
ads/feature_store/docs/Makefile +44 -0
ads/feature_store/docs/conf.py +28 -0
ads/feature_store/docs/requirements.txt +14 -0
ads/feature_store/docs/source/ads.feature_store.query.rst +20 -0
ads/feature_store/docs/source/cicd.rst +137 -0
ads/feature_store/docs/source/conf.py +86 -0
ads/feature_store/docs/source/data_versioning.rst +33 -0
ads/feature_store/docs/source/dataset.rst +388 -0
ads/feature_store/docs/source/dataset_job.rst +27 -0
ads/feature_store/docs/source/demo.rst +70 -0
ads/feature_store/docs/source/entity.rst +78 -0
ads/feature_store/docs/source/feature_group.rst +624 -0
ads/feature_store/docs/source/feature_group_job.rst +29 -0
ads/feature_store/docs/source/feature_store.rst +122 -0
ads/feature_store/docs/source/feature_store_class.rst +123 -0
ads/feature_store/docs/source/feature_validation.rst +66 -0
ads/feature_store/docs/source/figures/cicd.png +0 -0
ads/feature_store/docs/source/figures/data_validation.png +0 -0
ads/feature_store/docs/source/figures/data_versioning.png +0 -0
ads/feature_store/docs/source/figures/dataset.gif +0 -0
ads/feature_store/docs/source/figures/dataset.png +0 -0
ads/feature_store/docs/source/figures/dataset_lineage.png +0 -0
ads/feature_store/docs/source/figures/dataset_statistics.png +0 -0
ads/feature_store/docs/source/figures/dataset_statistics_viz.png +0 -0
ads/feature_store/docs/source/figures/dataset_validation_results.png +0 -0
ads/feature_store/docs/source/figures/dataset_validation_summary.png +0 -0
ads/feature_store/docs/source/figures/drift_monitoring.png +0 -0
ads/feature_store/docs/source/figures/entity.png +0 -0
ads/feature_store/docs/source/figures/feature_group.png +0 -0
ads/feature_store/docs/source/figures/feature_group_lineage.png +0 -0
ads/feature_store/docs/source/figures/feature_group_statistics_viz.png +0 -0
ads/feature_store/docs/source/figures/feature_store_deployment.png +0 -0
ads/feature_store/docs/source/figures/feature_store_overview.png +0 -0
ads/feature_store/docs/source/figures/featuregroup.gif +0 -0
ads/feature_store/docs/source/figures/lineage_d1.png +0 -0
ads/feature_store/docs/source/figures/lineage_d2.png +0 -0
ads/feature_store/docs/source/figures/lineage_fg.png +0 -0
ads/feature_store/docs/source/figures/logo-dark-mode.png +0 -0
ads/feature_store/docs/source/figures/logo-light-mode.png +0 -0
ads/feature_store/docs/source/figures/overview.png +0 -0
ads/feature_store/docs/source/figures/resource_manager.png +0 -0
ads/feature_store/docs/source/figures/resource_manager_feature_store_stack.png +0 -0
ads/feature_store/docs/source/figures/resource_manager_home.png +0 -0
ads/feature_store/docs/source/figures/stats_1.png +0 -0
ads/feature_store/docs/source/figures/stats_2.png +0 -0
ads/feature_store/docs/source/figures/stats_d.png +0 -0
ads/feature_store/docs/source/figures/stats_fg.png +0 -0
ads/feature_store/docs/source/figures/transformation.png +0 -0
ads/feature_store/docs/source/figures/transformations.gif +0 -0
ads/feature_store/docs/source/figures/validation.png +0 -0
ads/feature_store/docs/source/figures/validation_fg.png +0 -0
ads/feature_store/docs/source/figures/validation_results.png +0 -0
ads/feature_store/docs/source/figures/validation_summary.png +0 -0
ads/feature_store/docs/source/index.rst +81 -0
ads/feature_store/docs/source/module.rst +8 -0
ads/feature_store/docs/source/notebook.rst +94 -0
ads/feature_store/docs/source/overview.rst +47 -0
ads/feature_store/docs/source/quickstart.rst +176 -0
ads/feature_store/docs/source/release_notes.rst +194 -0
ads/feature_store/docs/source/setup_feature_store.rst +81 -0
ads/feature_store/docs/source/statistics.rst +58 -0
ads/feature_store/docs/source/transformation.rst +199 -0
ads/feature_store/docs/source/ui.rst +65 -0
ads/feature_store/docs/source/user_guides.setup.feature_store_operator.rst +66 -0
ads/feature_store/docs/source/user_guides.setup.helm_chart.rst +192 -0
ads/feature_store/docs/source/user_guides.setup.terraform.rst +338 -0
ads/feature_store/entity.py +718 -0
ads/feature_store/execution_strategy/__init__.py +0 -0
ads/feature_store/execution_strategy/delta_lake/__init__.py +0 -0
ads/feature_store/execution_strategy/delta_lake/delta_lake_service.py +375 -0
ads/feature_store/execution_strategy/engine/__init__.py +0 -0
ads/feature_store/execution_strategy/engine/spark_engine.py +316 -0
ads/feature_store/execution_strategy/execution_strategy.py +113 -0
ads/feature_store/execution_strategy/execution_strategy_provider.py +47 -0
ads/feature_store/execution_strategy/spark/__init__.py +0 -0
ads/feature_store/execution_strategy/spark/spark_execution.py +618 -0
ads/feature_store/feature.py +192 -0
ads/feature_store/feature_group.py +1494 -0
ads/feature_store/feature_group_expectation.py +346 -0
ads/feature_store/feature_group_job.py +602 -0
ads/feature_store/feature_lineage/__init__.py +0 -0
ads/feature_store/feature_lineage/graphviz_service.py +180 -0
ads/feature_store/feature_option_details.py +50 -0
ads/feature_store/feature_statistics/__init__.py +0 -0
ads/feature_store/feature_statistics/statistics_service.py +99 -0
ads/feature_store/feature_store.py +699 -0
ads/feature_store/feature_store_registrar.py +518 -0
ads/feature_store/input_feature_detail.py +149 -0
ads/feature_store/mixin/__init__.py +4 -0
ads/feature_store/mixin/oci_feature_store.py +145 -0
ads/feature_store/model_details.py +73 -0
ads/feature_store/query/__init__.py +0 -0
ads/feature_store/query/filter.py +266 -0
ads/feature_store/query/generator/__init__.py +0 -0
ads/feature_store/query/generator/query_generator.py +298 -0
ads/feature_store/query/join.py +161 -0
ads/feature_store/query/query.py +403 -0
ads/feature_store/query/validator/__init__.py +0 -0
ads/feature_store/query/validator/query_validator.py +57 -0
ads/feature_store/response/__init__.py +0 -0
ads/feature_store/response/response_builder.py +68 -0
ads/feature_store/service/__init__.py +0 -0
ads/feature_store/service/oci_dataset.py +139 -0
ads/feature_store/service/oci_dataset_job.py +199 -0
ads/feature_store/service/oci_entity.py +125 -0
ads/feature_store/service/oci_feature_group.py +164 -0
ads/feature_store/service/oci_feature_group_job.py +214 -0
ads/feature_store/service/oci_feature_store.py +182 -0
ads/feature_store/service/oci_lineage.py +87 -0
ads/feature_store/service/oci_transformation.py +104 -0
ads/feature_store/statistics/__init__.py +0 -0
ads/feature_store/statistics/abs_feature_value.py +49 -0
ads/feature_store/statistics/charts/__init__.py +0 -0
ads/feature_store/statistics/charts/abstract_feature_plot.py +37 -0
ads/feature_store/statistics/charts/box_plot.py +148 -0
ads/feature_store/statistics/charts/frequency_distribution.py +65 -0
ads/feature_store/statistics/charts/probability_distribution.py +68 -0
ads/feature_store/statistics/charts/top_k_frequent_elements.py +98 -0
ads/feature_store/statistics/feature_stat.py +126 -0
ads/feature_store/statistics/generic_feature_value.py +33 -0
ads/feature_store/statistics/statistics.py +41 -0
ads/feature_store/statistics_config.py +101 -0
ads/feature_store/templates/feature_store_template.yaml +45 -0
ads/feature_store/transformation.py +499 -0
ads/feature_store/validation_output.py +57 -0
ads/hpo/__init__.py +9 -0
ads/hpo/_imports.py +91 -0
ads/hpo/ads_search_space.py +439 -0
ads/hpo/distributions.py +325 -0
ads/hpo/objective.py +280 -0
ads/hpo/search_cv.py +1657 -0
ads/hpo/stopping_criterion.py +75 -0
ads/hpo/tuner_artifact.py +413 -0
ads/hpo/utils.py +91 -0
ads/hpo/validation.py +140 -0
ads/hpo/visualization/__init__.py +5 -0
ads/hpo/visualization/_contour.py +23 -0
ads/hpo/visualization/_edf.py +20 -0
ads/hpo/visualization/_intermediate_values.py +21 -0
ads/hpo/visualization/_optimization_history.py +25 -0
ads/hpo/visualization/_parallel_coordinate.py +169 -0
ads/hpo/visualization/_param_importances.py +26 -0
ads/jobs/__init__.py +53 -0
ads/jobs/ads_job.py +663 -0
ads/jobs/builders/__init__.py +5 -0
ads/jobs/builders/base.py +156 -0
ads/jobs/builders/infrastructure/__init__.py +6 -0
ads/jobs/builders/infrastructure/base.py +165 -0
ads/jobs/builders/infrastructure/dataflow.py +1252 -0
ads/jobs/builders/infrastructure/dsc_job.py +1894 -0
ads/jobs/builders/infrastructure/dsc_job_runtime.py +1233 -0
ads/jobs/builders/infrastructure/utils.py +65 -0
ads/jobs/builders/runtimes/__init__.py +5 -0
ads/jobs/builders/runtimes/artifact.py +338 -0
ads/jobs/builders/runtimes/base.py +325 -0
ads/jobs/builders/runtimes/container_runtime.py +242 -0
ads/jobs/builders/runtimes/python_runtime.py +1016 -0
ads/jobs/builders/runtimes/pytorch_runtime.py +204 -0
ads/jobs/cli.py +104 -0
ads/jobs/env_var_parser.py +131 -0
ads/jobs/extension.py +160 -0
ads/jobs/schema/__init__.py +5 -0
ads/jobs/schema/infrastructure_schema.json +116 -0
ads/jobs/schema/job_schema.json +42 -0
ads/jobs/schema/runtime_schema.json +183 -0
ads/jobs/schema/validator.py +141 -0
ads/jobs/serializer.py +296 -0
ads/jobs/templates/__init__.py +5 -0
ads/jobs/templates/container.py +6 -0
ads/jobs/templates/driver_notebook.py +177 -0
ads/jobs/templates/driver_oci.py +500 -0
ads/jobs/templates/driver_python.py +48 -0
ads/jobs/templates/driver_pytorch.py +852 -0
ads/jobs/templates/driver_utils.py +615 -0
ads/jobs/templates/hostname_from_env.c +55 -0
ads/jobs/templates/oci_metrics.py +181 -0
ads/jobs/utils.py +104 -0
ads/llm/__init__.py +28 -0
ads/llm/autogen/__init__.py +2 -0
ads/llm/autogen/constants.py +15 -0
ads/llm/autogen/reports/__init__.py +2 -0
ads/llm/autogen/reports/base.py +67 -0
ads/llm/autogen/reports/data.py +103 -0
ads/llm/autogen/reports/session.py +526 -0
ads/llm/autogen/reports/templates/chat_box.html +13 -0
ads/llm/autogen/reports/templates/chat_box_lt.html +5 -0
ads/llm/autogen/reports/templates/chat_box_rt.html +6 -0
ads/llm/autogen/reports/utils.py +56 -0
ads/llm/autogen/v02/__init__.py +4 -0
ads/llm/autogen/v02/client.py +295 -0
ads/llm/autogen/v02/log_handlers/__init__.py +2 -0
ads/llm/autogen/v02/log_handlers/oci_file_handler.py +83 -0
ads/llm/autogen/v02/loggers/__init__.py +6 -0
ads/llm/autogen/v02/loggers/metric_logger.py +320 -0
ads/llm/autogen/v02/loggers/session_logger.py +580 -0
ads/llm/autogen/v02/loggers/utils.py +86 -0
ads/llm/autogen/v02/runtime_logging.py +163 -0
ads/llm/chain.py +268 -0
ads/llm/chat_template.py +31 -0
ads/llm/deploy.py +63 -0
ads/llm/guardrails/__init__.py +5 -0
ads/llm/guardrails/base.py +442 -0
ads/llm/guardrails/huggingface.py +44 -0
ads/llm/langchain/__init__.py +5 -0
ads/llm/langchain/plugins/__init__.py +5 -0
ads/llm/langchain/plugins/chat_models/__init__.py +5 -0
ads/llm/langchain/plugins/chat_models/oci_data_science.py +1027 -0
ads/llm/langchain/plugins/embeddings/__init__.py +4 -0
ads/llm/langchain/plugins/embeddings/oci_data_science_model_deployment_endpoint.py +184 -0
ads/llm/langchain/plugins/llms/__init__.py +5 -0
ads/llm/langchain/plugins/llms/oci_data_science_model_deployment_endpoint.py +979 -0
ads/llm/requirements.txt +3 -0
ads/llm/serialize.py +219 -0
ads/llm/serializers/__init__.py +0 -0
ads/llm/serializers/retrieval_qa.py +153 -0
ads/llm/serializers/runnable_parallel.py +27 -0
ads/llm/templates/score_chain.jinja2 +155 -0
ads/llm/templates/tool_chat_template_hermes.jinja +130 -0
ads/llm/templates/tool_chat_template_mistral_parallel.jinja +94 -0
ads/model/__init__.py +52 -0
ads/model/artifact.py +573 -0
ads/model/artifact_downloader.py +254 -0
ads/model/artifact_uploader.py +267 -0
ads/model/base_properties.py +238 -0
ads/model/common/.model-ignore +66 -0
ads/model/common/__init__.py +5 -0
ads/model/common/utils.py +142 -0
ads/model/datascience_model.py +2635 -0
ads/model/deployment/__init__.py +20 -0
ads/model/deployment/common/__init__.py +5 -0
ads/model/deployment/common/utils.py +308 -0
ads/model/deployment/model_deployer.py +466 -0
ads/model/deployment/model_deployment.py +1846 -0
ads/model/deployment/model_deployment_infrastructure.py +671 -0
ads/model/deployment/model_deployment_properties.py +493 -0
ads/model/deployment/model_deployment_runtime.py +838 -0
ads/model/extractor/__init__.py +5 -0
ads/model/extractor/automl_extractor.py +74 -0
ads/model/extractor/embedding_onnx_extractor.py +80 -0
ads/model/extractor/huggingface_extractor.py +88 -0
ads/model/extractor/keras_extractor.py +84 -0
ads/model/extractor/lightgbm_extractor.py +93 -0
ads/model/extractor/model_info_extractor.py +114 -0
ads/model/extractor/model_info_extractor_factory.py +105 -0
ads/model/extractor/pytorch_extractor.py +87 -0
ads/model/extractor/sklearn_extractor.py +112 -0
ads/model/extractor/spark_extractor.py +89 -0
ads/model/extractor/tensorflow_extractor.py +85 -0
ads/model/extractor/xgboost_extractor.py +94 -0
ads/model/framework/__init__.py +5 -0
ads/model/framework/automl_model.py +178 -0
ads/model/framework/embedding_onnx_model.py +438 -0
ads/model/framework/huggingface_model.py +399 -0
ads/model/framework/lightgbm_model.py +266 -0
ads/model/framework/pytorch_model.py +266 -0
ads/model/framework/sklearn_model.py +250 -0
ads/model/framework/spark_model.py +326 -0
ads/model/framework/tensorflow_model.py +254 -0
ads/model/framework/xgboost_model.py +258 -0
ads/model/generic_model.py +3518 -0
ads/model/model_artifact_boilerplate/README.md +381 -0
ads/model/model_artifact_boilerplate/__init__.py +5 -0
ads/model/model_artifact_boilerplate/artifact_introspection_test/__init__.py +5 -0
ads/model/model_artifact_boilerplate/artifact_introspection_test/model_artifact_validate.py +427 -0
ads/model/model_artifact_boilerplate/artifact_introspection_test/requirements.txt +2 -0
ads/model/model_artifact_boilerplate/runtime.yaml +7 -0
ads/model/model_artifact_boilerplate/score.py +61 -0
ads/model/model_file_description_schema.json +68 -0
ads/model/model_introspect.py +331 -0
ads/model/model_metadata.py +1810 -0
ads/model/model_metadata_mixin.py +460 -0
ads/model/model_properties.py +63 -0
ads/model/model_version_set.py +739 -0
ads/model/runtime/__init__.py +5 -0
ads/model/runtime/env_info.py +306 -0
ads/model/runtime/model_deployment_details.py +37 -0
ads/model/runtime/model_provenance_details.py +58 -0
ads/model/runtime/runtime_info.py +81 -0
ads/model/runtime/schemas/inference_env_info_schema.yaml +16 -0
ads/model/runtime/schemas/model_provenance_schema.yaml +36 -0
ads/model/runtime/schemas/training_env_info_schema.yaml +16 -0
ads/model/runtime/utils.py +201 -0
ads/model/serde/__init__.py +5 -0
ads/model/serde/common.py +40 -0
ads/model/serde/model_input.py +547 -0
ads/model/serde/model_serializer.py +1184 -0
ads/model/service/__init__.py +5 -0
ads/model/service/oci_datascience_model.py +1076 -0
ads/model/service/oci_datascience_model_deployment.py +500 -0
ads/model/service/oci_datascience_model_version_set.py +176 -0
ads/model/transformer/__init__.py +5 -0
ads/model/transformer/onnx_transformer.py +324 -0
ads/mysqldb/__init__.py +5 -0
ads/mysqldb/mysql_db.py +227 -0
ads/opctl/__init__.py +18 -0
ads/opctl/anomaly_detection.py +11 -0
ads/opctl/backend/__init__.py +5 -0
ads/opctl/backend/ads_dataflow.py +353 -0
ads/opctl/backend/ads_ml_job.py +710 -0
ads/opctl/backend/ads_ml_pipeline.py +164 -0
ads/opctl/backend/ads_model_deployment.py +209 -0
ads/opctl/backend/base.py +146 -0
ads/opctl/backend/local.py +1053 -0
ads/opctl/backend/marketplace/__init__.py +9 -0
ads/opctl/backend/marketplace/helm_helper.py +173 -0
ads/opctl/backend/marketplace/local_marketplace.py +271 -0
ads/opctl/backend/marketplace/marketplace_backend_runner.py +71 -0
ads/opctl/backend/marketplace/marketplace_operator_interface.py +44 -0
ads/opctl/backend/marketplace/marketplace_operator_runner.py +24 -0
ads/opctl/backend/marketplace/marketplace_utils.py +212 -0
ads/opctl/backend/marketplace/models/__init__.py +5 -0
ads/opctl/backend/marketplace/models/bearer_token.py +94 -0
ads/opctl/backend/marketplace/models/marketplace_type.py +70 -0
ads/opctl/backend/marketplace/models/ocir_details.py +56 -0
ads/opctl/backend/marketplace/prerequisite_checker.py +238 -0
ads/opctl/cli.py +707 -0
ads/opctl/cmds.py +869 -0
ads/opctl/conda/__init__.py +5 -0
ads/opctl/conda/cli.py +193 -0
ads/opctl/conda/cmds.py +749 -0
ads/opctl/conda/config.yaml +34 -0
ads/opctl/conda/manifest_template.yaml +13 -0
ads/opctl/conda/multipart_uploader.py +188 -0
ads/opctl/conda/pack.py +89 -0
ads/opctl/config/__init__.py +5 -0
ads/opctl/config/base.py +57 -0
ads/opctl/config/diagnostics/__init__.py +5 -0
ads/opctl/config/diagnostics/distributed/default_requirements_config.yaml +62 -0
ads/opctl/config/merger.py +255 -0
ads/opctl/config/resolver.py +297 -0
ads/opctl/config/utils.py +79 -0
ads/opctl/config/validator.py +17 -0
ads/opctl/config/versioner.py +68 -0
ads/opctl/config/yaml_parsers/__init__.py +7 -0
ads/opctl/config/yaml_parsers/base.py +58 -0
ads/opctl/config/yaml_parsers/distributed/__init__.py +7 -0
ads/opctl/config/yaml_parsers/distributed/yaml_parser.py +201 -0
ads/opctl/constants.py +66 -0
ads/opctl/decorator/__init__.py +5 -0
ads/opctl/decorator/common.py +129 -0
ads/opctl/diagnostics/__init__.py +5 -0
ads/opctl/diagnostics/__main__.py +25 -0
ads/opctl/diagnostics/check_distributed_job_requirements.py +212 -0
ads/opctl/diagnostics/check_requirements.py +144 -0
ads/opctl/diagnostics/requirement_exception.py +9 -0
ads/opctl/distributed/README.md +109 -0
ads/opctl/distributed/__init__.py +5 -0
ads/opctl/distributed/certificates.py +32 -0
ads/opctl/distributed/cli.py +207 -0
ads/opctl/distributed/cmds.py +731 -0
ads/opctl/distributed/common/__init__.py +5 -0
ads/opctl/distributed/common/abstract_cluster_provider.py +449 -0
ads/opctl/distributed/common/abstract_framework_spec_builder.py +88 -0
ads/opctl/distributed/common/cluster_config_helper.py +103 -0
ads/opctl/distributed/common/cluster_provider_factory.py +21 -0
ads/opctl/distributed/common/cluster_runner.py +54 -0
ads/opctl/distributed/common/framework_factory.py +29 -0
ads/opctl/docker/Dockerfile.job +103 -0
ads/opctl/docker/Dockerfile.job.arm +107 -0
ads/opctl/docker/Dockerfile.job.gpu +175 -0
ads/opctl/docker/base-env.yaml +13 -0
ads/opctl/docker/cuda.repo +6 -0
ads/opctl/docker/operator/.dockerignore +0 -0
ads/opctl/docker/operator/Dockerfile +41 -0
ads/opctl/docker/operator/Dockerfile.gpu +85 -0
ads/opctl/docker/operator/cuda.repo +6 -0
ads/opctl/docker/operator/environment.yaml +8 -0
ads/opctl/forecast.py +11 -0
ads/opctl/index.yaml +3 -0
ads/opctl/model/__init__.py +5 -0
ads/opctl/model/cli.py +65 -0
ads/opctl/model/cmds.py +73 -0
ads/opctl/operator/README.md +4 -0
ads/opctl/operator/__init__.py +31 -0
ads/opctl/operator/cli.py +344 -0
ads/opctl/operator/cmd.py +596 -0
ads/opctl/operator/common/__init__.py +5 -0
ads/opctl/operator/common/backend_factory.py +460 -0
ads/opctl/operator/common/const.py +27 -0
ads/opctl/operator/common/data/synthetic.csv +16001 -0
ads/opctl/operator/common/dictionary_merger.py +148 -0
ads/opctl/operator/common/errors.py +42 -0
ads/opctl/operator/common/operator_config.py +99 -0
ads/opctl/operator/common/operator_loader.py +811 -0
ads/opctl/operator/common/operator_schema.yaml +130 -0
ads/opctl/operator/common/operator_yaml_generator.py +152 -0
ads/opctl/operator/common/utils.py +208 -0
ads/opctl/operator/lowcode/__init__.py +5 -0
ads/opctl/operator/lowcode/anomaly/MLoperator +16 -0
ads/opctl/operator/lowcode/anomaly/README.md +207 -0
ads/opctl/operator/lowcode/anomaly/__init__.py +5 -0
ads/opctl/operator/lowcode/anomaly/__main__.py +103 -0
ads/opctl/operator/lowcode/anomaly/cmd.py +35 -0
ads/opctl/operator/lowcode/anomaly/const.py +167 -0
ads/opctl/operator/lowcode/anomaly/environment.yaml +10 -0
ads/opctl/operator/lowcode/anomaly/model/__init__.py +5 -0
ads/opctl/operator/lowcode/anomaly/model/anomaly_dataset.py +146 -0
ads/opctl/operator/lowcode/anomaly/model/anomaly_merlion.py +162 -0
ads/opctl/operator/lowcode/anomaly/model/automlx.py +99 -0
ads/opctl/operator/lowcode/anomaly/model/autots.py +115 -0
ads/opctl/operator/lowcode/anomaly/model/base_model.py +404 -0
ads/opctl/operator/lowcode/anomaly/model/factory.py +110 -0
ads/opctl/operator/lowcode/anomaly/model/isolationforest.py +78 -0
ads/opctl/operator/lowcode/anomaly/model/oneclasssvm.py +78 -0
ads/opctl/operator/lowcode/anomaly/model/randomcutforest.py +120 -0
ads/opctl/operator/lowcode/anomaly/model/tods.py +119 -0
ads/opctl/operator/lowcode/anomaly/operator_config.py +127 -0
ads/opctl/operator/lowcode/anomaly/schema.yaml +401 -0
ads/opctl/operator/lowcode/anomaly/utils.py +88 -0
ads/opctl/operator/lowcode/common/__init__.py +5 -0
ads/opctl/operator/lowcode/common/const.py +10 -0
ads/opctl/operator/lowcode/common/data.py +116 -0
ads/opctl/operator/lowcode/common/errors.py +47 -0
ads/opctl/operator/lowcode/common/transformations.py +296 -0
ads/opctl/operator/lowcode/common/utils.py +384 -0
ads/opctl/operator/lowcode/feature_store_marketplace/MLoperator +13 -0
ads/opctl/operator/lowcode/feature_store_marketplace/README.md +30 -0
ads/opctl/operator/lowcode/feature_store_marketplace/__init__.py +5 -0
ads/opctl/operator/lowcode/feature_store_marketplace/__main__.py +116 -0
ads/opctl/operator/lowcode/feature_store_marketplace/cmd.py +85 -0
ads/opctl/operator/lowcode/feature_store_marketplace/const.py +15 -0
ads/opctl/operator/lowcode/feature_store_marketplace/environment.yaml +0 -0
ads/opctl/operator/lowcode/feature_store_marketplace/models/__init__.py +4 -0
ads/opctl/operator/lowcode/feature_store_marketplace/models/apigw_config.py +32 -0
ads/opctl/operator/lowcode/feature_store_marketplace/models/db_config.py +43 -0
ads/opctl/operator/lowcode/feature_store_marketplace/models/mysql_config.py +120 -0
ads/opctl/operator/lowcode/feature_store_marketplace/models/serializable_yaml_model.py +34 -0
ads/opctl/operator/lowcode/feature_store_marketplace/operator_utils.py +386 -0
ads/opctl/operator/lowcode/feature_store_marketplace/schema.yaml +160 -0
ads/opctl/operator/lowcode/forecast/MLoperator +25 -0
ads/opctl/operator/lowcode/forecast/README.md +209 -0
ads/opctl/operator/lowcode/forecast/__init__.py +5 -0
ads/opctl/operator/lowcode/forecast/__main__.py +89 -0
ads/opctl/operator/lowcode/forecast/cmd.py +40 -0
ads/opctl/operator/lowcode/forecast/const.py +92 -0
ads/opctl/operator/lowcode/forecast/environment.yaml +20 -0
ads/opctl/operator/lowcode/forecast/errors.py +26 -0
ads/opctl/operator/lowcode/forecast/model/__init__.py +5 -0
ads/opctl/operator/lowcode/forecast/model/arima.py +279 -0
ads/opctl/operator/lowcode/forecast/model/automlx.py +553 -0
ads/opctl/operator/lowcode/forecast/model/autots.py +312 -0
ads/opctl/operator/lowcode/forecast/model/base_model.py +875 -0
ads/opctl/operator/lowcode/forecast/model/factory.py +106 -0
ads/opctl/operator/lowcode/forecast/model/forecast_datasets.py +492 -0
ads/opctl/operator/lowcode/forecast/model/ml_forecast.py +243 -0
ads/opctl/operator/lowcode/forecast/model/neuralprophet.py +482 -0
ads/opctl/operator/lowcode/forecast/model/prophet.py +450 -0
ads/opctl/operator/lowcode/forecast/model_evaluator.py +244 -0
ads/opctl/operator/lowcode/forecast/operator_config.py +234 -0
ads/opctl/operator/lowcode/forecast/schema.yaml +506 -0
ads/opctl/operator/lowcode/forecast/utils.py +397 -0
ads/opctl/operator/lowcode/forecast/whatifserve/__init__.py +7 -0
ads/opctl/operator/lowcode/forecast/whatifserve/deployment_manager.py +285 -0
ads/opctl/operator/lowcode/forecast/whatifserve/score.py +246 -0
ads/opctl/operator/lowcode/pii/MLoperator +17 -0
ads/opctl/operator/lowcode/pii/README.md +208 -0
ads/opctl/operator/lowcode/pii/__init__.py +5 -0
ads/opctl/operator/lowcode/pii/__main__.py +78 -0
ads/opctl/operator/lowcode/pii/cmd.py +39 -0
ads/opctl/operator/lowcode/pii/constant.py +84 -0
ads/opctl/operator/lowcode/pii/environment.yaml +17 -0
ads/opctl/operator/lowcode/pii/errors.py +27 -0
ads/opctl/operator/lowcode/pii/model/__init__.py +5 -0
ads/opctl/operator/lowcode/pii/model/factory.py +82 -0
ads/opctl/operator/lowcode/pii/model/guardrails.py +167 -0
ads/opctl/operator/lowcode/pii/model/pii.py +145 -0
ads/opctl/operator/lowcode/pii/model/processor/__init__.py +34 -0
ads/opctl/operator/lowcode/pii/model/processor/email_replacer.py +34 -0
ads/opctl/operator/lowcode/pii/model/processor/mbi_replacer.py +35 -0
ads/opctl/operator/lowcode/pii/model/processor/name_replacer.py +225 -0
ads/opctl/operator/lowcode/pii/model/processor/number_replacer.py +73 -0
ads/opctl/operator/lowcode/pii/model/processor/remover.py +26 -0
ads/opctl/operator/lowcode/pii/model/report.py +487 -0
ads/opctl/operator/lowcode/pii/operator_config.py +95 -0
ads/opctl/operator/lowcode/pii/schema.yaml +108 -0
ads/opctl/operator/lowcode/pii/utils.py +43 -0
ads/opctl/operator/lowcode/recommender/MLoperator +16 -0
ads/opctl/operator/lowcode/recommender/README.md +206 -0
ads/opctl/operator/lowcode/recommender/__init__.py +5 -0
ads/opctl/operator/lowcode/recommender/__main__.py +82 -0
ads/opctl/operator/lowcode/recommender/cmd.py +33 -0
ads/opctl/operator/lowcode/recommender/constant.py +30 -0
ads/opctl/operator/lowcode/recommender/environment.yaml +11 -0
ads/opctl/operator/lowcode/recommender/model/base_model.py +212 -0
ads/opctl/operator/lowcode/recommender/model/factory.py +56 -0
ads/opctl/operator/lowcode/recommender/model/recommender_dataset.py +25 -0
ads/opctl/operator/lowcode/recommender/model/svd.py +106 -0
ads/opctl/operator/lowcode/recommender/operator_config.py +81 -0
ads/opctl/operator/lowcode/recommender/schema.yaml +265 -0
ads/opctl/operator/lowcode/recommender/utils.py +13 -0
ads/opctl/operator/runtime/__init__.py +5 -0
ads/opctl/operator/runtime/const.py +17 -0
ads/opctl/operator/runtime/container_runtime_schema.yaml +50 -0
ads/opctl/operator/runtime/marketplace_runtime.py +50 -0
ads/opctl/operator/runtime/python_marketplace_runtime_schema.yaml +21 -0
ads/opctl/operator/runtime/python_runtime_schema.yaml +21 -0
ads/opctl/operator/runtime/runtime.py +115 -0
ads/opctl/schema.yaml.yml +36 -0
ads/opctl/script.py +40 -0
ads/opctl/spark/__init__.py +5 -0
ads/opctl/spark/cli.py +43 -0
ads/opctl/spark/cmds.py +147 -0
ads/opctl/templates/diagnostic_report_template.jinja2 +102 -0
ads/opctl/utils.py +344 -0
ads/oracledb/__init__.py +5 -0
ads/oracledb/oracle_db.py +346 -0
ads/pipeline/__init__.py +39 -0
ads/pipeline/ads_pipeline.py +2279 -0
ads/pipeline/ads_pipeline_run.py +772 -0
ads/pipeline/ads_pipeline_step.py +605 -0
ads/pipeline/builders/__init__.py +5 -0
ads/pipeline/builders/infrastructure/__init__.py +5 -0
ads/pipeline/builders/infrastructure/custom_script.py +32 -0
ads/pipeline/cli.py +119 -0
ads/pipeline/extension.py +291 -0
ads/pipeline/schema/__init__.py +5 -0
ads/pipeline/schema/cs_step_schema.json +35 -0
ads/pipeline/schema/ml_step_schema.json +31 -0
ads/pipeline/schema/pipeline_schema.json +71 -0
ads/pipeline/visualizer/__init__.py +5 -0
ads/pipeline/visualizer/base.py +570 -0
ads/pipeline/visualizer/graph_renderer.py +272 -0
ads/pipeline/visualizer/text_renderer.py +84 -0
ads/secrets/__init__.py +11 -0
ads/secrets/adb.py +386 -0
ads/secrets/auth_token.py +86 -0
ads/secrets/big_data_service.py +365 -0
ads/secrets/mysqldb.py +149 -0
ads/secrets/oracledb.py +160 -0
ads/secrets/secrets.py +407 -0
ads/telemetry/__init__.py +7 -0
ads/telemetry/base.py +69 -0
ads/telemetry/client.py +122 -0
ads/telemetry/telemetry.py +257 -0
ads/templates/dataflow_pyspark.jinja2 +13 -0
ads/templates/dataflow_sparksql.jinja2 +22 -0
ads/templates/func.jinja2 +20 -0
ads/templates/schemas/openapi.json +1740 -0
ads/templates/score-pkl.jinja2 +173 -0
ads/templates/score.jinja2 +322 -0
ads/templates/score_embedding_onnx.jinja2 +202 -0
ads/templates/score_generic.jinja2 +165 -0
ads/templates/score_huggingface_pipeline.jinja2 +217 -0
ads/templates/score_lightgbm.jinja2 +185 -0
ads/templates/score_onnx.jinja2 +407 -0
ads/templates/score_onnx_new.jinja2 +473 -0
ads/templates/score_oracle_automl.jinja2 +185 -0
ads/templates/score_pyspark.jinja2 +154 -0
ads/templates/score_pytorch.jinja2 +219 -0
ads/templates/score_scikit-learn.jinja2 +184 -0
ads/templates/score_tensorflow.jinja2 +184 -0
ads/templates/score_xgboost.jinja2 +178 -0
ads/text_dataset/__init__.py +5 -0
ads/text_dataset/backends.py +211 -0
ads/text_dataset/dataset.py +445 -0
ads/text_dataset/extractor.py +207 -0
ads/text_dataset/options.py +53 -0
ads/text_dataset/udfs.py +22 -0
ads/text_dataset/utils.py +49 -0
ads/type_discovery/__init__.py +9 -0
ads/type_discovery/abstract_detector.py +21 -0
ads/type_discovery/constant_detector.py +41 -0
ads/type_discovery/continuous_detector.py +54 -0
ads/type_discovery/credit_card_detector.py +99 -0
ads/type_discovery/datetime_detector.py +92 -0
ads/type_discovery/discrete_detector.py +118 -0
ads/type_discovery/document_detector.py +146 -0
ads/type_discovery/ip_detector.py +68 -0
ads/type_discovery/latlon_detector.py +90 -0
ads/type_discovery/phone_number_detector.py +63 -0
ads/type_discovery/type_discovery_driver.py +87 -0
ads/type_discovery/typed_feature.py +594 -0
ads/type_discovery/unknown_detector.py +41 -0
ads/type_discovery/zipcode_detector.py +48 -0
ads/vault/__init__.py +7 -0
ads/vault/vault.py +237 -0
{oracle_ads-2.13.9rc0.dist-info → oracle_ads-2.13.10rc0.dist-info}/METADATA +150 -149
oracle_ads-2.13.10rc0.dist-info/RECORD +858 -0
{oracle_ads-2.13.9rc0.dist-info → oracle_ads-2.13.10rc0.dist-info}/WHEEL +1 -2
{oracle_ads-2.13.9rc0.dist-info → oracle_ads-2.13.10rc0.dist-info}/entry_points.txt +2 -1
oracle_ads-2.13.9rc0.dist-info/RECORD +0 -9
oracle_ads-2.13.9rc0.dist-info/top_level.txt +0 -1
{oracle_ads-2.13.9rc0.dist-info → oracle_ads-2.13.10rc0.dist-info}/licenses/LICENSE.txt +0 -0

ads/opctl/operator/lowcode/forecast/model/base_model.py ADDED Viewed

@@ -0,0 +1,875 @@
+#!/usr/bin/env python
+# Copyright (c) 2023, 2025 Oracle and/or its affiliates.
+# Licensed under the Universal Permissive License v 1.0 as shown at https://oss.oracle.com/licenses/upl/
+import logging
+import os
+import tempfile
+import time
+import traceback
+from abc import ABC, abstractmethod
+from typing import Tuple
+import numpy as np
+import pandas as pd
+import report_creator as rc
+from ads.common.decorator.runtime_dependency import runtime_dependency
+from ads.common.object_storage_details import ObjectStorageDetails
+from ads.opctl import logger
+from ads.opctl.operator.lowcode.common.const import DataColumns
+from ads.opctl.operator.lowcode.common.utils import (
+    datetime_to_seconds,
+    disable_print,
+    enable_print,
+    human_time_friendly,
+    load_pkl,
+    merged_category_column_name,
+    seconds_to_datetime,
+    write_data,
+    write_file,
+    write_json,
+    write_pkl,
+)
+from ads.opctl.operator.lowcode.forecast.utils import (
+    _build_metrics_df,
+    _build_metrics_per_horizon,
+    _label_encode_dataframe,
+    default_signer,
+    evaluate_train_metrics,
+    get_auto_select_plot,
+    get_forecast_plots,
+)
+from ..const import (
+    AUTO_SELECT,
+    BACKTEST_REPORT_NAME,
+    SUMMARY_METRICS_HORIZON_LIMIT,
+    ForecastOutputColumns,
+    SpeedAccuracyMode,
+    SupportedMetrics,
+    SupportedModels,
+)
+from ..operator_config import ForecastOperatorConfig, ForecastOperatorSpec
+from .forecast_datasets import ForecastDatasets, ForecastResults
+logging.getLogger("report_creator").setLevel(logging.WARNING)
+class ForecastOperatorBaseModel(ABC):
+    """The base class for the forecast operator models."""
+    def __init__(self, config: ForecastOperatorConfig, datasets: ForecastDatasets):
+        """Instantiates the ForecastOperatorBaseModel instance.
+        Properties
+        ----------
+        config: ForecastOperatorConfig
+            The forecast operator configuration.
+        """
+        self.config: ForecastOperatorConfig = config
+        self.spec: ForecastOperatorSpec = config.spec
+        self.datasets: ForecastDatasets = datasets
+        self.target_cat_col = self.spec.target_category_columns
+        self.full_data_dict = datasets.get_data_by_series()
+        self.test_eval_metrics = None
+        self.original_target_column = self.spec.target_column
+        self.dt_column_name = self.spec.datetime_column.name
+        self.model_parameters = {}
+        self.loaded_models = None
+        # these fields are populated in the _build_model() method
+        self.models = None
+        # "outputs" is a list of outputs generated by the models. These should only be generated when the framework requires the original output for plotting
+        self.outputs = None
+        self.forecast_output = None
+        self.errors_dict = {}
+        self.le = {}
+        self.formatted_global_explanation = None
+        self.formatted_local_explanation = None
+        self.forecast_col_name = "yhat"
+        self.perform_tuning = (self.spec.tuning is not None) and (
+            self.spec.tuning.n_trials is not None
+        )
+    def generate_report(self):
+        """Generates the forecasting report."""
+        import warnings
+        from sklearn.exceptions import ConvergenceWarning
+        with warnings.catch_warnings():
+            warnings.simplefilter(action="ignore", category=FutureWarning)
+            warnings.simplefilter(action="ignore", category=UserWarning)
+            warnings.simplefilter(action="ignore", category=RuntimeWarning)
+            warnings.simplefilter(action="ignore", category=ConvergenceWarning)
+            # load models if given
+            if self.spec.previous_output_dir is not None:
+                self._load_model()
+            start_time = time.time()
+            result_df = self._build_model()
+            elapsed_time = time.time() - start_time
+            logger.info("Building the models completed in %s seconds", elapsed_time)
+            # Generate metrics
+            summary_metrics = None
+            test_data = self.datasets.test_data
+            self.eval_metrics = None
+            if self.spec.generate_report or self.spec.generate_metrics:
+                self.eval_metrics = self.generate_train_metrics()
+                if not self.target_cat_col:
+                    self.eval_metrics.rename(
+                        {"Series 1": self.original_target_column}, axis=1, inplace=True
+                    )
+                if self.datasets.test_data is not None:
+                    try:
+                        (self.test_eval_metrics, summary_metrics) = (
+                            self._test_evaluate_metrics(
+                                elapsed_time=elapsed_time,
+                            )
+                        )
+                        if not self.target_cat_col:
+                            self.test_eval_metrics.rename(
+                                {"Series 1": self.original_target_column},
+                                axis=1,
+                                inplace=True,
+                            )
+                    except Exception:
+                        logger.warning("Unable to generate Test Metrics.")
+                        logger.debug(f"Full Traceback: {traceback.format_exc()}")
+            report_sections = []
+            if self.spec.generate_report:
+                # build the report
+                (
+                    model_description,
+                    other_sections,
+                ) = self._generate_report()
+                header_section = rc.Block(
+                    rc.Heading(self.spec.report_title, level=1),
+                    rc.Text(
+                        f"You selected the {self.spec.model} model.\nBased on your dataset, you could have also selected any of the models: {SupportedModels.keys()}."
+                    ),
+                    model_description,
+                    rc.Group(
+                        rc.Metric(
+                            heading="Analysis was completed in ",
+                            value=human_time_friendly(elapsed_time),
+                        ),
+                        rc.Metric(
+                            heading="Starting time index",
+                            value=self.datasets.get_earliest_timestamp().strftime(
+                                "%B %d, %Y"
+                            ),
+                        ),
+                        rc.Metric(
+                            heading="Ending time index",
+                            value=self.datasets.get_latest_timestamp().strftime(
+                                "%B %d, %Y"
+                            ),
+                        ),
+                        rc.Metric(
+                            heading="Num series",
+                            value=len(self.datasets.list_series_ids()),
+                        ),
+                    ),
+                )
+                first_5_rows_blocks = [
+                    rc.DataTable(
+                        df.head(5),
+                        label=s_id if self.target_cat_col else None,
+                        index=True,
+                    )
+                    for s_id, df in self.full_data_dict.items()
+                ]
+                last_5_rows_blocks = [
+                    rc.DataTable(
+                        df.tail(5),
+                        label=s_id if self.target_cat_col else None,
+                        index=True,
+                    )
+                    for s_id, df in self.full_data_dict.items()
+                ]
+                data_summary_blocks = [
+                    rc.DataTable(
+                        df.describe(),
+                        label=s_id if self.target_cat_col else None,
+                        index=True,
+                    )
+                    for s_id, df in self.full_data_dict.items()
+                ]
+                series_name = merged_category_column_name(
+                    self.spec.target_category_columns
+                )
+                # series_subtext = rc.Text(f"Indexed by {series_name}")
+                first_10_title = rc.Heading("First 5 Rows of Data", level=3)
+                last_10_title = rc.Heading("Last 5 Rows of Data", level=3)
+                summary_title = rc.Heading("Data Summary Statistics", level=3)
+                data_summary_sec = rc.Block(
+                    rc.Block(
+                        first_10_title,
+                        # series_subtext,
+                        rc.Select(blocks=first_5_rows_blocks)
+                        if self.target_cat_col
+                        else first_5_rows_blocks[0],
+                    ),
+                    rc.Block(
+                        last_10_title,
+                        # series_subtext,
+                        rc.Select(blocks=last_5_rows_blocks)
+                        if self.target_cat_col
+                        else last_5_rows_blocks[0],
+                    ),
+                    rc.Block(
+                        summary_title,
+                        # series_subtext,
+                        rc.Select(blocks=data_summary_blocks)
+                        if self.target_cat_col
+                        else data_summary_blocks[0],
+                    ),
+                    rc.Separator(),
+                )
+                summary = rc.Block(
+                    header_section,
+                    data_summary_sec,
+                )
+                test_metrics_sections = []
+                if (
+                    self.test_eval_metrics is not None
+                    and not self.test_eval_metrics.empty
+                ):
+                    sec7_text = rc.Heading("Test Data Evaluation Metrics", level=2)
+                    sec7 = rc.DataTable(self.test_eval_metrics, index=True)
+                    test_metrics_sections = test_metrics_sections + [sec7_text, sec7]
+                if summary_metrics is not None and not summary_metrics.empty:
+                    sec8_text = rc.Heading("Test Data Summary Metrics", level=2)
+                    sec8 = rc.DataTable(summary_metrics, index=True)
+                    test_metrics_sections = test_metrics_sections + [sec8_text, sec8]
+                train_metrics_sections = []
+                if self.eval_metrics is not None and not self.eval_metrics.empty:
+                    sec9_text = rc.Heading("Training Data Metrics", level=2)
+                    sec9 = rc.DataTable(self.eval_metrics, index=True)
+                    train_metrics_sections = [sec9_text, sec9]
+                backtest_sections = []
+                output_dir = self.spec.output_directory.url
+                file_path = f"{output_dir}/{BACKTEST_REPORT_NAME}"
+                if self.spec.model == AUTO_SELECT:
+                    backtest_sections.append(
+                        rc.Heading(
+                            "Auto-Select Backtesting and Performance Metrics", level=2
+                        )
+                    )
+                    if not os.path.exists(file_path):
+                        failure_msg = rc.Text(
+                            "auto-select could not be executed. Please check the "
+                            "logs for more details."
+                        )
+                        backtest_sections.append(failure_msg)
+                    else:
+                        backtest_stats = pd.read_csv(file_path)
+                        model_metric_map = backtest_stats.drop(
+                            columns=["metric", "backtest"]
+                        )
+                        average_dict = {
+                            k: round(v, 4)
+                            for k, v in model_metric_map.mean().to_dict().items()
+                        }
+                        best_model = min(average_dict, key=average_dict.get)
+                        summary_text = rc.Text(
+                            f"Overall, the average {self.spec.metric} scores for the models are {average_dict}, with"
+                            f" {best_model} being identified as the top-performing model during backtesting."
+                        )
+                        backtest_table = rc.DataTable(backtest_stats, index=True)
+                        liner_plot = get_auto_select_plot(backtest_stats)
+                        backtest_sections.extend(
+                            [backtest_table, summary_text, liner_plot]
+                        )
+                forecast_plots = []
+                if len(self.forecast_output.list_series_ids()) > 0:
+                    forecast_text = rc.Heading(
+                        "Forecasted Data Overlaying Historical", level=2
+                    )
+                    forecast_sec = get_forecast_plots(
+                        self.forecast_output,
+                        horizon=self.spec.horizon,
+                        test_data=test_data,
+                        ci_interval_width=self.spec.confidence_interval_width,
+                        target_category_column=self.target_cat_col,
+                    )
+                    if (
+                        series_name is not None
+                        and len(self.datasets.list_series_ids()) > 1
+                    ):
+                        forecast_plots = [
+                            forecast_text,
+                            forecast_sec,
+                        ]  # series_subtext,
+                    else:
+                        forecast_plots = [forecast_text, forecast_sec]
+                yaml_appendix_title = rc.Heading("Reference: YAML File", level=2)
+                config_dict = self.config.to_dict()
+                # pop the data incase it isn't json serializable
+                config_dict["spec"]["historical_data"].pop("data")
+                if config_dict["spec"].get("additional_data"):
+                    config_dict["spec"]["additional_data"].pop("data")
+                if config_dict["spec"].get("test_data"):
+                    config_dict["spec"]["test_data"].pop("data")
+                yaml_appendix = rc.Yaml(config_dict)
+                report_sections = (
+                    [summary]
+                    + backtest_sections
+                    + forecast_plots
+                    + other_sections
+                    + test_metrics_sections
+                    + train_metrics_sections
+                    + [yaml_appendix_title, yaml_appendix]
+                )
+            # save the report and result CSV
+            return self._save_report(
+                report_sections=report_sections,
+                result_df=result_df,
+                metrics_df=self.eval_metrics,
+                test_metrics_df=self.test_eval_metrics,
+                test_data=test_data,
+            )
+    def _test_evaluate_metrics(self, elapsed_time=0):
+        total_metrics = pd.DataFrame()
+        summary_metrics = pd.DataFrame()
+        data = self.datasets.test_data
+        # Generate y_pred and y_true for each series
+        for s_id in self.forecast_output.list_series_ids():
+            try:
+                y_true = data.get_data_for_series(s_id)[data.target_name].values[
+                    -self.spec.horizon :
+                ]
+            except KeyError as ke:
+                logger.warning(
+                    f"Error Generating Metrics: Unable to find {s_id} in the test data. Error: {ke.args}"
+                )
+            y_pred = self.forecast_output.get_forecast(s_id)["forecast_value"].values[
+                -self.spec.horizon :
+            ]
+            drop_na_mask = ~np.isnan(y_true) & ~np.isnan(y_pred)
+            if not drop_na_mask.all():  # There is a missing value
+                if drop_na_mask.any():  # All values are missing
+                    logger.debug(
+                        f"No values in the test data for series: {s_id}. This will affect the test metrics."
+                    )
+                    continue
+                logger.debug(
+                    f"Missing values in the test data for series: {s_id}. This will affect the test metrics."
+                )
+                y_true = y_true[drop_na_mask]
+                y_pred = y_pred[drop_na_mask]
+            metrics_df = _build_metrics_df(
+                y_true=y_true,
+                y_pred=y_pred,
+                series_id=s_id,
+            )
+            total_metrics = pd.concat([total_metrics, metrics_df], axis=1)
+        if total_metrics.empty:
+            return total_metrics, summary_metrics
+        summary_metrics = pd.DataFrame(
+            {
+                SupportedMetrics.MEAN_SMAPE: np.mean(
+                    total_metrics.loc[SupportedMetrics.SMAPE]
+                ),
+                SupportedMetrics.MEDIAN_SMAPE: np.median(
+                    total_metrics.loc[SupportedMetrics.SMAPE]
+                ),
+                SupportedMetrics.MEAN_MAPE: np.mean(
+                    total_metrics.loc[SupportedMetrics.MAPE]
+                ),
+                SupportedMetrics.MEDIAN_MAPE: np.median(
+                    total_metrics.loc[SupportedMetrics.MAPE]
+                ),
+                SupportedMetrics.MEAN_RMSE: np.mean(
+                    total_metrics.loc[SupportedMetrics.RMSE]
+                ),
+                SupportedMetrics.MEDIAN_RMSE: np.median(
+                    total_metrics.loc[SupportedMetrics.RMSE]
+                ),
+                SupportedMetrics.MEAN_R2: np.mean(
+                    total_metrics.loc[SupportedMetrics.R2]
+                ),
+                SupportedMetrics.MEDIAN_R2: np.median(
+                    total_metrics.loc[SupportedMetrics.R2]
+                ),
+                SupportedMetrics.MEAN_EXPLAINED_VARIANCE: np.mean(
+                    total_metrics.loc[SupportedMetrics.EXPLAINED_VARIANCE]
+                ),
+                SupportedMetrics.MEDIAN_EXPLAINED_VARIANCE: np.median(
+                    total_metrics.loc[SupportedMetrics.EXPLAINED_VARIANCE]
+                ),
+                SupportedMetrics.ELAPSED_TIME: elapsed_time,
+            },
+            index=["All Targets"],
+        )
+        """Calculates Mean sMAPE, Median sMAPE, Mean MAPE, Median MAPE, Mean wMAPE, Median wMAPE values for each horizon
+        if horizon <= 10."""
+        if self.spec.horizon <= SUMMARY_METRICS_HORIZON_LIMIT:
+            metrics_per_horizon = _build_metrics_per_horizon(
+                test_data=data,
+                output=self.forecast_output,
+            )
+            if not metrics_per_horizon.empty:
+                summary_metrics = pd.concat([summary_metrics, metrics_per_horizon])
+                new_column_order = [
+                    SupportedMetrics.MEAN_SMAPE,
+                    SupportedMetrics.MEDIAN_SMAPE,
+                    SupportedMetrics.MEAN_MAPE,
+                    SupportedMetrics.MEDIAN_MAPE,
+                    SupportedMetrics.MEAN_WMAPE,
+                    SupportedMetrics.MEDIAN_WMAPE,
+                    SupportedMetrics.MEAN_RMSE,
+                    SupportedMetrics.MEDIAN_RMSE,
+                    SupportedMetrics.MEAN_R2,
+                    SupportedMetrics.MEDIAN_R2,
+                    SupportedMetrics.MEAN_EXPLAINED_VARIANCE,
+                    SupportedMetrics.MEDIAN_EXPLAINED_VARIANCE,
+                    SupportedMetrics.ELAPSED_TIME,
+                ]
+                summary_metrics = summary_metrics[new_column_order]
+        return total_metrics, summary_metrics
+    def _save_report(
+        self,
+        report_sections: Tuple,
+        result_df: pd.DataFrame,
+        metrics_df: pd.DataFrame,
+        test_metrics_df: pd.DataFrame,
+        test_data: pd.DataFrame,
+    ):
+        """Saves resulting reports to the given folder."""
+        unique_output_dir = self.spec.output_directory.url
+        results = ForecastResults()
+        storage_options = (
+            default_signer()
+            if ObjectStorageDetails.is_oci_path(unique_output_dir)
+            else {}
+        )
+        # report-creator html report
+        if self.spec.generate_report:
+            with tempfile.TemporaryDirectory() as temp_dir:
+                report_local_path = os.path.join(temp_dir, "___report.html")
+                disable_print()
+                with rc.ReportCreator("My Report") as report:
+                    report.save(rc.Block(*report_sections), report_local_path)
+                enable_print()
+                report_path = os.path.join(unique_output_dir, self.spec.report_filename)
+                write_file(
+                    local_filename=report_local_path,
+                    remote_filename=report_path,
+                    storage_options=storage_options,
+                )
+        # forecast csv report
+        # todo: add test data into forecast.csv
+        # if self.spec.test_data is not None:
+        #     test_data_dict = test_data.get_dict_by_series()
+        #     for series_id, test_data_values in test_data_dict.items():
+        #         result_df[DataColumns.Series] = test_data_values[]
+        result_df = (
+            result_df
+            if self.target_cat_col
+            else result_df.drop(DataColumns.Series, axis=1)
+        )
+        if self.spec.generate_forecast_file:
+            write_data(
+                data=result_df,
+                filename=os.path.join(unique_output_dir, self.spec.forecast_filename),
+                format="csv",
+                storage_options=storage_options,
+            )
+        results.set_forecast(result_df)
+        # metrics csv report
+        if self.spec.generate_metrics:
+            metrics_col_name = (
+                self.original_target_column
+                if self.datasets.has_artificial_series()
+                else "Series 1"
+            )
+            if metrics_df is not None:
+                metrics_df_formatted = metrics_df.reset_index().rename(
+                    {"index": "metrics", "Series 1": metrics_col_name}, axis=1
+                )
+                if self.spec.generate_metrics_file:
+                    write_data(
+                        data=metrics_df_formatted,
+                        filename=os.path.join(
+                            unique_output_dir, self.spec.metrics_filename
+                        ),
+                        format="csv",
+                        storage_options=storage_options,
+                        index=False,
+                    )
+                results.set_metrics(metrics_df_formatted)
+            else:
+                logger.warning(
+                    f"Attempted to generate the {self.spec.metrics_filename} file with the training metrics, however the training metrics could not be properly generated."
+                )
+            # test_metrics csv report
+            if self.datasets.test_data is not None:
+                if test_metrics_df is not None:
+                    test_metrics_df_formatted = test_metrics_df.reset_index().rename(
+                        {"index": "metrics", "Series 1": metrics_col_name}, axis=1
+                    )
+                    if self.spec.generate_metrics_file:
+                        write_data(
+                            data=test_metrics_df_formatted,
+                            filename=os.path.join(
+                                unique_output_dir, self.spec.test_metrics_filename
+                            ),
+                            format="csv",
+                            storage_options=storage_options,
+                            index=False,
+                        )
+                    results.set_test_metrics(test_metrics_df_formatted)
+                else:
+                    logger.warning(
+                        f"Attempted to generate the {self.spec.test_metrics_filename} file with the test metrics, however the test metrics could not be properly generated."
+                    )
+        # explanations csv reports
+        if self.spec.generate_explanations:
+            try:
+                if not self.formatted_global_explanation.empty:
+                    # Round to 4 decimal places before writing
+                    global_expl_rounded = self.formatted_global_explanation.copy()
+                    global_expl_rounded = global_expl_rounded.apply(
+                        lambda col: np.round(col, 4)
+                        if np.issubdtype(col.dtype, np.number)
+                        else col
+                    )
+                    if self.spec.generate_explanation_files:
+                        write_data(
+                            data=global_expl_rounded,
+                            filename=os.path.join(
+                                unique_output_dir, self.spec.global_explanation_filename
+                            ),
+                            format="csv",
+                            storage_options=storage_options,
+                            index=True,
+                        )
+                    results.set_global_explanations(global_expl_rounded)
+                else:
+                    logger.warning(
+                        f"Attempted to generate global explanations for the {self.spec.global_explanation_filename} file, but an issue occured in formatting the explanations."
+                    )
+                if not self.formatted_local_explanation.empty:
+                    # Round to 4 decimal places before writing
+                    local_expl_rounded = self.formatted_local_explanation.copy()
+                    local_expl_rounded = local_expl_rounded.apply(
+                        lambda col: np.round(col, 4)
+                        if np.issubdtype(col.dtype, np.number)
+                        else col
+                    )
+                    if self.spec.generate_explanation_files:
+                        write_data(
+                            data=local_expl_rounded,
+                            filename=os.path.join(
+                                unique_output_dir, self.spec.local_explanation_filename
+                            ),
+                            format="csv",
+                            storage_options=storage_options,
+                            index=True,
+                        )
+                    results.set_local_explanations(local_expl_rounded)
+                else:
+                    logger.warning(
+                        f"Attempted to generate local explanations for the {self.spec.local_explanation_filename} file, but an issue occured in formatting the explanations."
+                    )
+            except AttributeError as e:
+                logger.warning(
+                    "Unable to generate explanations for this model type or for this dataset."
+                )
+                logger.debug(f"Got error: {e.args}")
+        if self.spec.generate_model_parameters:
+            # model params
+            write_data(
+                data=pd.DataFrame.from_dict(self.model_parameters),
+                filename=os.path.join(unique_output_dir, "model_params.json"),
+                format="json",
+                storage_options=storage_options,
+                index=True,
+                indent=4,
+            )
+            results.set_model_parameters(self.model_parameters)
+        # model pickle
+        if self.spec.generate_model_pickle:
+            self._save_model(unique_output_dir, storage_options)
+            results.set_models(self.models)
+        logger.info(
+            f"The outputs have been successfully "
+            f"generated and placed into the directory: {unique_output_dir}."
+        )
+        print(
+            f"The outputs have been successfully generated and placed into the directory: {unique_output_dir}."
+        )
+        if self.errors_dict:
+            write_json(
+                json_dict=self.errors_dict,
+                filename=os.path.join(
+                    unique_output_dir, self.spec.errors_dict_filename
+                ),
+                storage_options=storage_options,
+            )
+            results.set_errors_dict(self.errors_dict)
+        else:
+            logger.info("All modeling completed successfully.")
+        return results
+    def preprocess(self, df, series_id):
+        """The method that needs to be implemented on the particular model level."""
+        data = df.rename(
+            {self.dt_column_name: "ds", self.original_target_column: "y"}, axis=1
+        )
+        self.le[series_id], df_encoded = _label_encode_dataframe(
+            data, no_encode={"ds", "y"}
+        )
+        return df_encoded
+    @abstractmethod
+    def _generate_report(self):
+        """
+        Generates the report for the particular model.
+        The method that needs to be implemented on the particular model level.
+        """
+    @abstractmethod
+    def _build_model(self) -> pd.DataFrame:
+        """
+        Build the model.
+        The method that needs to be implemented on the particular model level.
+        """
+    def drop_horizon(self, df: pd.DataFrame) -> pd.DataFrame:
+        return df.iloc[: -self.spec.horizon]
+    def get_horizon(self, df: pd.DataFrame) -> pd.DataFrame:
+        return df.iloc[-self.spec.horizon :]
+    def generate_train_metrics(self) -> pd.DataFrame:
+        """
+        Generate Training Metrics when fitted data is not available.
+        The method that needs to be implemented on the particular model level.
+        """
+        return evaluate_train_metrics(self.forecast_output)
+    def _load_model(self):
+        try:
+            self.loaded_models = load_pkl(self.spec.previous_output_dir + "/model.pkl")
+        except Exception as e:
+            logger.info(f"model.pkl is not present. Error: {e}")
+    def _save_model(self, output_dir, storage_options):
+        write_pkl(
+            obj=self.models,
+            filename="model.pkl",
+            output_dir=output_dir,
+            storage_options=storage_options,
+        )
+    def _validate_automlx_explanation_mode(self):
+        if (
+            self.spec.model != SupportedModels.AutoMLX
+            and self.spec.explanations_accuracy_mode == SpeedAccuracyMode.AUTOMLX
+        ):
+            raise ValueError(
+                "AUTOMLX explanation accuracy mode is only supported for AutoMLX models. "
+                "Please select mode other than AUTOMLX from the available explanations_accuracy_mode options"
+            )
+    @runtime_dependency(
+        module="shap",
+        err_msg=(
+            "Please run `python3 -m pip install shap` to install the required dependencies for model explanation."
+        ),
+    )
+    def explain_model(self):
+        """
+        Generates an explanation for the model by using the SHAP (Shapley Additive exPlanations) library.
+        This function calculates the SHAP values for each feature in the dataset and stores the results in the `global_explanation` dictionary.
+        Returns
+        -------
+            dict: A dictionary containing the global explanation for each feature in the dataset.
+                    The keys are the feature names and the values are the average absolute SHAP values.
+        """
+        from shap import PermutationExplainer
+        datetime_col_name = self.datasets._datetime_column_name
+        exp_start_time = time.time()
+        global_ex_time = 0
+        local_ex_time = 0
+        logger.info(
+            f"Calculating explanations using {self.spec.explanations_accuracy_mode} mode"
+        )
+        ratio = SpeedAccuracyMode.ratio[self.spec.explanations_accuracy_mode]
+        # validate the automlx mode is use for automlx model
+        self._validate_automlx_explanation_mode()
+        for s_id, data_i in self.datasets.get_data_by_series(
+            include_horizon=False
+        ).items():
+            if s_id in self.models:
+                try:
+                    explain_predict_fn = self.get_explain_predict_fn(series_id=s_id)
+                    data_trimmed = data_i.tail(
+                        max(int(len(data_i) * ratio), 5)
+                    ).reset_index(drop=True)
+                    data_trimmed[datetime_col_name] = data_trimmed[
+                        datetime_col_name
+                    ].apply(lambda x: x.timestamp())
+                    # Explainer fails when boolean columns are passed
+                    _, data_trimmed_encoded = _label_encode_dataframe(
+                        data_trimmed,
+                        no_encode={datetime_col_name, self.original_target_column},
+                    )
+                    kernel_explnr = PermutationExplainer(
+                        model=explain_predict_fn, masker=data_trimmed_encoded
+                    )
+                    kernel_explnr_vals = kernel_explnr.shap_values(data_trimmed_encoded)
+                    exp_end_time = time.time()
+                    global_ex_time = global_ex_time + exp_end_time - exp_start_time
+                    self.local_explainer(
+                        kernel_explnr,
+                        series_id=s_id,
+                        datetime_col_name=datetime_col_name,
+                    )
+                    local_ex_time = local_ex_time + time.time() - exp_end_time
+                    if not len(kernel_explnr_vals):
+                        logger.warning(
+                            "No explanations generated. Ensure that additional data has been provided."
+                        )
+                    else:
+                        self.global_explanation[s_id] = dict(
+                            zip(
+                                data_trimmed.columns[1:],
+                                np.average(
+                                    np.absolute(kernel_explnr_vals[:, 1:]), axis=0
+                                ),
+                            )
+                        )
+                except Exception as e:
+                    if s_id in self.errors_dict:
+                        self.errors_dict[s_id]["explainer_error"] = str(e)
+                        self.errors_dict[s_id]["explainer_error_trace"] = (
+                            traceback.format_exc()
+                        )
+                    else:
+                        self.errors_dict[s_id] = {
+                            "model_name": self.spec.model,
+                            "explainer_error": str(e),
+                            "explainer_error_trace": traceback.format_exc(),
+                        }
+            else:
+                logger.warning(
+                    f"Skipping explanations for {s_id}, as forecast was not generated."
+                )
+        logger.info(
+            "Global explanations generation completed in %s seconds", global_ex_time
+        )
+        logger.info(
+            "Local explanations generation completed in %s seconds", local_ex_time
+        )
+    def local_explainer(self, kernel_explainer, series_id, datetime_col_name) -> None:
+        """
+        Generate local explanations using a kernel explainer.
+        Parameters
+        ----------
+            kernel_explainer: The kernel explainer object to use for generating explanations.
+        """
+        data = self.datasets.get_horizon_at_series(s_id=series_id)
+        # columns that were dropped in train_model in arima, should be dropped here as well
+        data[datetime_col_name] = datetime_to_seconds(data[datetime_col_name])
+        data = data.reset_index(drop=True)
+        # Explainer fails when boolean columns are passed
+        _, data = _label_encode_dataframe(
+            data, no_encode={datetime_col_name, self.original_target_column}
+        )
+        # Generate local SHAP values using the kernel explainer
+        local_kernel_explnr_vals = kernel_explainer.shap_values(data)
+        # Convert the SHAP values into a DataFrame
+        local_kernel_explnr_df = pd.DataFrame(
+            local_kernel_explnr_vals, columns=data.columns
+        )
+        # Add date column to local explanation DataFrame
+        local_kernel_explnr_df[ForecastOutputColumns.DATE] = (
+            self.datasets.get_horizon_at_series(
+                s_id=series_id
+            )[self.spec.datetime_column.name].reset_index(drop=True)
+        )
+        self.local_explanation[series_id] = local_kernel_explnr_df
+    def get_explain_predict_fn(self, series_id, fcst_col_name="yhat"):
+        def _custom_predict(
+            data,
+            model=self.models[series_id]["model"],
+            dt_column_name=self.datasets._datetime_column_name,
+        ):
+            """
+            data: ForecastDatasets.get_data_at_series(s_id)
+            """
+            data[dt_column_name] = seconds_to_datetime(
+                data[dt_column_name], dt_format=self.spec.datetime_column.format
+            )
+            data = self.preprocess(df=data, series_id=series_id)
+            data[self.original_target_column] = None
+            fcst = model.predict(data)[fcst_col_name]
+            return fcst
+        return _custom_predict

oracle-ads 2.13.9rc0__py3-none-any.whl → 2.13.10rc0__py3-none-any.whl

oracle-ads 2.13.9rc0py3-none-any.whl → 2.13.10rc0py3-none-any.whl