RubyGems - aws-sdk-sagemaker - Versions diffs - 1.339.0 → 1.341.0 - Mend

aws-sdk-sagemaker 1.339.0 → 1.341.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +10 -0
data/VERSION +1 -1
data/lib/aws-sdk-sagemaker/client.rb +321 -9
data/lib/aws-sdk-sagemaker/client_api.rb +192 -0
data/lib/aws-sdk-sagemaker/types.rb +717 -11
data/lib/aws-sdk-sagemaker.rb +1 -1
data/sig/client.rbs +96 -9
data/sig/types.rbs +149 -7
metadata +3 -3

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: f99f676fe2b17eb076e8761bee93ce0bfaee796c41dc984e1eab0803c1947f2e
-  data.tar.gz: 6b3644ed5504af87e03d6b11d457c9cfa1bcf428b917150a2bad9a661968f654
+  metadata.gz: 26865b73cdcf61e9575a07d832b43aa93e24edce14672d0fec79742958394014
+  data.tar.gz: 0d0613bf3801d91d0d176695ccf4422a7e531ec6054f80a735069034eb79a2a1
 SHA512:
-  metadata.gz: c26fc869f314ef2b25b1b2e0c58c9926c7b20b740a5f46064e31618cd4af601938f5df74199fce53c2c2d5494059acbec30b71727ae6534400013bbee5516433
-  data.tar.gz: 2bbffdc253a295bf9b9aa9fb1ae956ba268bb2d6d27abce4574ad0a4e0d1861c6ce0d84f655bbb45ed6959be27b34820b399c908c96e87de3b5d4c7dff93ed6b
+  metadata.gz: 06ee60e1d183dab830facd89ff879c1df147cc673f511e681cf0ecc2f45211585f034dbeb9893534cf8d1f4486554e59a8375d1acf5b8cd4398f8944245ad875
+  data.tar.gz: 913fb03b0fea5374c8eb21cfc8d4668e1705b493f94b9fb1ab30646ef2bc0bce18bc9deddbf5c0a20034dc466cb34b532de52eaeda6e822999d525659eda3585

data/CHANGELOG.md CHANGED Viewed

@@ -1,6 +1,16 @@
 Unreleased Changes
 ------------------
+1.341.0 (2025-11-21)
+------------------
+* Feature - Enhanced SageMaker HyperPod instance groups with support for MinInstanceCount, CapacityRequirements (Spot/On-Demand), and KubernetesConfig (labels and taints). Also Added speculative decoding and MaxInstanceCount for model optimization jobs.
+1.340.0 (2025-11-20)
+------------------
+* Feature - Added training plan support for inference endpoints. Added HyperPod task governance with accelerator partition-based quota allocation. Added BatchRebootClusterNodes and BatchReplaceClusterNodes APIs. Updated ListClusterNodes to include privateDnsHostName.
 1.339.0 (2025-11-19)
 ------------------

data/VERSION CHANGED Viewed

	@@ -1 +1 @@
1	- 1.~~339~~.0
1	+ 1.341.0

data/lib/aws-sdk-sagemaker/client.rb CHANGED Viewed

@@ -950,6 +950,209 @@ module Aws::SageMaker
       req.send_request(options)
     end
+    # Reboots specific nodes within a SageMaker HyperPod cluster using a
+    # soft recovery mechanism. `BatchRebootClusterNodes` performs a graceful
+    # reboot of the specified nodes by calling the Amazon Elastic Compute
+    # Cloud `RebootInstances` API, which attempts to cleanly shut down the
+    # operating system before restarting the instance.
+    #
+    # This operation is useful for recovering from transient issues or
+    # applying certain configuration changes that require a restart.
+    #
+    # <note markdown="1"> * Rebooting a node may cause temporary service interruption for
+    #   workloads running on that node. Ensure your workloads can handle
+    #   node restarts or use appropriate scheduling to minimize impact.
+    #
+    # * You can reboot up to 25 nodes in a single request.
+    #
+    # * For SageMaker HyperPod clusters using the Slurm workload manager,
+    #   ensure rebooting nodes will not disrupt critical cluster operations.
+    #
+    #  </note>
+    #
+    # @option params [required, String] :cluster_name
+    #   The name or Amazon Resource Name (ARN) of the SageMaker HyperPod
+    #   cluster containing the nodes to reboot.
+    #
+    # @option params [Array<String>] :node_ids
+    #   A list of EC2 instance IDs to reboot using soft recovery. You can
+    #   specify between 1 and 25 instance IDs.
+    #
+    #   <note markdown="1"> * Either `NodeIds` or `NodeLogicalIds` must be provided (or both), but
+    #     at least one is required.
+    #
+    #   * Each instance ID must follow the pattern `i-` followed by 17
+    #     hexadecimal characters (for example, `i-0123456789abcdef0`).
+    #
+    #    </note>
+    #
+    # @option params [Array<String>] :node_logical_ids
+    #   A list of logical node IDs to reboot using soft recovery. You can
+    #   specify between 1 and 25 logical node IDs.
+    #
+    #   The `NodeLogicalId` is a unique identifier that persists throughout
+    #   the node's lifecycle and can be used to track nodes that are still
+    #   being provisioned and don't yet have an EC2 instance ID assigned.
+    #
+    #   * This parameter is only supported for clusters using `Continuous` as
+    #     the `NodeProvisioningMode`. For clusters using the default
+    #     provisioning mode, use `NodeIds` instead.
+    #
+    #   * Either `NodeIds` or `NodeLogicalIds` must be provided (or both), but
+    #     at least one is required.
+    #
+    # @return [Types::BatchRebootClusterNodesResponse] Returns a {Seahorse::Client::Response response} object which responds to the following methods:
+    #
+    #   * {Types::BatchRebootClusterNodesResponse#successful #successful} => Array&lt;String&gt;
+    #   * {Types::BatchRebootClusterNodesResponse#failed #failed} => Array&lt;Types::BatchRebootClusterNodesError&gt;
+    #   * {Types::BatchRebootClusterNodesResponse#failed_node_logical_ids #failed_node_logical_ids} => Array&lt;Types::BatchRebootClusterNodeLogicalIdsError&gt;
+    #   * {Types::BatchRebootClusterNodesResponse#successful_node_logical_ids #successful_node_logical_ids} => Array&lt;String&gt;
+    #
+    # @example Request syntax with placeholder values
+    #
+    #   resp = client.batch_reboot_cluster_nodes({
+    #     cluster_name: "ClusterNameOrArn", # required
+    #     node_ids: ["ClusterNodeId"],
+    #     node_logical_ids: ["ClusterNodeLogicalId"],
+    #   })
+    #
+    # @example Response structure
+    #
+    #   resp.successful #=> Array
+    #   resp.successful[0] #=> String
+    #   resp.failed #=> Array
+    #   resp.failed[0].node_id #=> String
+    #   resp.failed[0].error_code #=> String, one of "InstanceIdNotFound", "InvalidInstanceStatus", "InstanceIdInUse", "InternalServerError"
+    #   resp.failed[0].message #=> String
+    #   resp.failed_node_logical_ids #=> Array
+    #   resp.failed_node_logical_ids[0].node_logical_id #=> String
+    #   resp.failed_node_logical_ids[0].error_code #=> String, one of "InstanceIdNotFound", "InvalidInstanceStatus", "InstanceIdInUse", "InternalServerError"
+    #   resp.failed_node_logical_ids[0].message #=> String
+    #   resp.successful_node_logical_ids #=> Array
+    #   resp.successful_node_logical_ids[0] #=> String
+    #
+    # @see http://docs.aws.amazon.com/goto/WebAPI/sagemaker-2017-07-24/BatchRebootClusterNodes AWS API Documentation
+    #
+    # @overload batch_reboot_cluster_nodes(params = {})
+    # @param [Hash] params ({})
+    def batch_reboot_cluster_nodes(params = {}, options = {})
+      req = build_request(:batch_reboot_cluster_nodes, params)
+      req.send_request(options)
+    end
+    # Replaces specific nodes within a SageMaker HyperPod cluster with new
+    # hardware. `BatchReplaceClusterNodes` terminates the specified
+    # instances and provisions new replacement instances with the same
+    # configuration but fresh hardware. The Amazon Machine Image (AMI) and
+    # instance configuration remain the same.
+    #
+    # This operation is useful for recovering from hardware failures or
+    # persistent issues that cannot be resolved through a reboot.
+    #
+    # * **Data Loss Warning:** Replacing nodes destroys all instance
+    #   volumes, including both root and secondary volumes. All data stored
+    #   on these volumes will be permanently lost and cannot be recovered.
+    #
+    # * To safeguard your work, back up your data to Amazon S3 or an FSx for
+    #   Lustre file system before invoking the API on a worker node group.
+    #   This will help prevent any potential data loss from the instance
+    #   root volume. For more information about backup, see [Use the backup
+    #   script provided by SageMaker HyperPod][1].
+    #
+    # * If you want to invoke this API on an existing cluster, you'll first
+    #   need to patch the cluster by running the [UpdateClusterSoftware
+    #   API][2]. For more information about patching a cluster, see [Update
+    #   the SageMaker HyperPod platform software of a cluster][3].
+    #
+    # * You can replace up to 25 nodes in a single request.
+    #
+    #
+    #
+    # [1]: https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-operate-cli-command.html#sagemaker-hyperpod-operate-cli-command-update-cluster-software-backup
+    # [2]: https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html
+    # [3]: https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-operate-cli-command.html#sagemaker-hyperpod-operate-cli-command-update-cluster-software
+    #
+    # @option params [required, String] :cluster_name
+    #   The name or Amazon Resource Name (ARN) of the SageMaker HyperPod
+    #   cluster containing the nodes to replace.
+    #
+    # @option params [Array<String>] :node_ids
+    #   A list of EC2 instance IDs to replace with new hardware. You can
+    #   specify between 1 and 25 instance IDs.
+    #
+    #   Replace operations destroy all instance volumes (root and secondary).
+    #   Ensure you have backed up any important data before proceeding.
+    #
+    #   <note markdown="1"> * Either `NodeIds` or `NodeLogicalIds` must be provided (or both), but
+    #     at least one is required.
+    #
+    #   * Each instance ID must follow the pattern `i-` followed by 17
+    #     hexadecimal characters (for example, `i-0123456789abcdef0`).
+    #
+    #   * For SageMaker HyperPod clusters using the Slurm workload manager,
+    #     you cannot replace instances that are configured as Slurm controller
+    #     nodes.
+    #
+    #    </note>
+    #
+    # @option params [Array<String>] :node_logical_ids
+    #   A list of logical node IDs to replace with new hardware. You can
+    #   specify between 1 and 25 logical node IDs.
+    #
+    #   The `NodeLogicalId` is a unique identifier that persists throughout
+    #   the node's lifecycle and can be used to track nodes that are still
+    #   being provisioned and don't yet have an EC2 instance ID assigned.
+    #
+    #   * Replace operations destroy all instance volumes (root and
+    #     secondary). Ensure you have backed up any important data before
+    #     proceeding.
+    #
+    #   * This parameter is only supported for clusters using `Continuous` as
+    #     the `NodeProvisioningMode`. For clusters using the default
+    #     provisioning mode, use `NodeIds` instead.
+    #
+    #   * Either `NodeIds` or `NodeLogicalIds` must be provided (or both), but
+    #     at least one is required.
+    #
+    # @return [Types::BatchReplaceClusterNodesResponse] Returns a {Seahorse::Client::Response response} object which responds to the following methods:
+    #
+    #   * {Types::BatchReplaceClusterNodesResponse#successful #successful} => Array&lt;String&gt;
+    #   * {Types::BatchReplaceClusterNodesResponse#failed #failed} => Array&lt;Types::BatchReplaceClusterNodesError&gt;
+    #   * {Types::BatchReplaceClusterNodesResponse#failed_node_logical_ids #failed_node_logical_ids} => Array&lt;Types::BatchReplaceClusterNodeLogicalIdsError&gt;
+    #   * {Types::BatchReplaceClusterNodesResponse#successful_node_logical_ids #successful_node_logical_ids} => Array&lt;String&gt;
+    #
+    # @example Request syntax with placeholder values
+    #
+    #   resp = client.batch_replace_cluster_nodes({
+    #     cluster_name: "ClusterNameOrArn", # required
+    #     node_ids: ["ClusterNodeId"],
+    #     node_logical_ids: ["ClusterNodeLogicalId"],
+    #   })
+    #
+    # @example Response structure
+    #
+    #   resp.successful #=> Array
+    #   resp.successful[0] #=> String
+    #   resp.failed #=> Array
+    #   resp.failed[0].node_id #=> String
+    #   resp.failed[0].error_code #=> String, one of "InstanceIdNotFound", "InvalidInstanceStatus", "InstanceIdInUse", "InternalServerError"
+    #   resp.failed[0].message #=> String
+    #   resp.failed_node_logical_ids #=> Array
+    #   resp.failed_node_logical_ids[0].node_logical_id #=> String
+    #   resp.failed_node_logical_ids[0].error_code #=> String, one of "InstanceIdNotFound", "InvalidInstanceStatus", "InstanceIdInUse", "InternalServerError"
+    #   resp.failed_node_logical_ids[0].message #=> String
+    #   resp.successful_node_logical_ids #=> Array
+    #   resp.successful_node_logical_ids[0] #=> String
+    #
+    # @see http://docs.aws.amazon.com/goto/WebAPI/sagemaker-2017-07-24/BatchReplaceClusterNodes AWS API Documentation
+    #
+    # @overload batch_replace_cluster_nodes(params = {})
+    # @param [Hash] params ({})
+    def batch_replace_cluster_nodes(params = {}, options = {})
+      req = build_request(:batch_replace_cluster_nodes, params)
+      req.send_request(options)
+    end
     # Creates an *action*. An action is a lineage tracking entity that
     # represents an action or activity. For example, a model deployment or
     # an HPO job. Generally, an action involves at least one input or output
@@ -2243,6 +2446,7 @@ module Aws::SageMaker
     #     instance_groups: [
     #       {
     #         instance_count: 1, # required
+    #         min_instance_count: 1,
     #         instance_group_name: "ClusterInstanceGroupName", # required
     #         instance_type: "ml.p4d.24xlarge", # required, accepts ml.p4d.24xlarge, ml.p4de.24xlarge, ml.p5.48xlarge, ml.p6e-gb200.36xlarge, ml.trn1.32xlarge, ml.trn1n.32xlarge, ml.g5.xlarge, ml.g5.2xlarge, ml.g5.4xlarge, ml.g5.8xlarge, ml.g5.12xlarge, ml.g5.16xlarge, ml.g5.24xlarge, ml.g5.48xlarge, ml.c5.large, ml.c5.xlarge, ml.c5.2xlarge, ml.c5.4xlarge, ml.c5.9xlarge, ml.c5.12xlarge, ml.c5.18xlarge, ml.c5.24xlarge, ml.c5n.large, ml.c5n.2xlarge, ml.c5n.4xlarge, ml.c5n.9xlarge, ml.c5n.18xlarge, ml.m5.large, ml.m5.xlarge, ml.m5.2xlarge, ml.m5.4xlarge, ml.m5.8xlarge, ml.m5.12xlarge, ml.m5.16xlarge, ml.m5.24xlarge, ml.t3.medium, ml.t3.large, ml.t3.xlarge, ml.t3.2xlarge, ml.g6.xlarge, ml.g6.2xlarge, ml.g6.4xlarge, ml.g6.8xlarge, ml.g6.16xlarge, ml.g6.12xlarge, ml.g6.24xlarge, ml.g6.48xlarge, ml.gr6.4xlarge, ml.gr6.8xlarge, ml.g6e.xlarge, ml.g6e.2xlarge, ml.g6e.4xlarge, ml.g6e.8xlarge, ml.g6e.16xlarge, ml.g6e.12xlarge, ml.g6e.24xlarge, ml.g6e.48xlarge, ml.p5e.48xlarge, ml.p5en.48xlarge, ml.p6-b200.48xlarge, ml.trn2.3xlarge, ml.trn2.48xlarge, ml.c6i.large, ml.c6i.xlarge, ml.c6i.2xlarge, ml.c6i.4xlarge, ml.c6i.8xlarge, ml.c6i.12xlarge, ml.c6i.16xlarge, ml.c6i.24xlarge, ml.c6i.32xlarge, ml.m6i.large, ml.m6i.xlarge, ml.m6i.2xlarge, ml.m6i.4xlarge, ml.m6i.8xlarge, ml.m6i.12xlarge, ml.m6i.16xlarge, ml.m6i.24xlarge, ml.m6i.32xlarge, ml.r6i.large, ml.r6i.xlarge, ml.r6i.2xlarge, ml.r6i.4xlarge, ml.r6i.8xlarge, ml.r6i.12xlarge, ml.r6i.16xlarge, ml.r6i.24xlarge, ml.r6i.32xlarge, ml.i3en.large, ml.i3en.xlarge, ml.i3en.2xlarge, ml.i3en.3xlarge, ml.i3en.6xlarge, ml.i3en.12xlarge, ml.i3en.24xlarge, ml.m7i.large, ml.m7i.xlarge, ml.m7i.2xlarge, ml.m7i.4xlarge, ml.m7i.8xlarge, ml.m7i.12xlarge, ml.m7i.16xlarge, ml.m7i.24xlarge, ml.m7i.48xlarge, ml.r7i.large, ml.r7i.xlarge, ml.r7i.2xlarge, ml.r7i.4xlarge, ml.r7i.8xlarge, ml.r7i.12xlarge, ml.r7i.16xlarge, ml.r7i.24xlarge, ml.r7i.48xlarge
     #         life_cycle_config: { # required
@@ -2288,6 +2492,24 @@ module Aws::SageMaker
     #           },
     #         },
     #         image_id: "ImageId",
+    #         kubernetes_config: {
+    #           labels: {
+    #             "ClusterKubernetesLabelKey" => "ClusterKubernetesLabelValue",
+    #           },
+    #           taints: [
+    #             {
+    #               key: "ClusterKubernetesTaintKey", # required
+    #               value: "ClusterKubernetesTaintValue",
+    #               effect: "NoSchedule", # required, accepts NoSchedule, PreferNoSchedule, NoExecute
+    #             },
+    #           ],
+    #         },
+    #         capacity_requirements: {
+    #           spot: {
+    #           },
+    #           on_demand: {
+    #           },
+    #         },
     #       },
     #     ],
     #     restricted_instance_groups: [
@@ -2725,6 +2947,10 @@ module Aws::SageMaker
     #           accelerators: 1,
     #           v_cpu: 1.0,
     #           memory_in_gi_b: 1.0,
+    #           accelerator_partition: {
+    #             type: "mig-1g.5gb", # required, accepts mig-1g.5gb, mig-1g.10gb, mig-1g.18gb, mig-1g.20gb, mig-1g.23gb, mig-1g.35gb, mig-1g.45gb, mig-1g.47gb, mig-2g.10gb, mig-2g.20gb, mig-2g.35gb, mig-2g.45gb, mig-2g.47gb, mig-3g.20gb, mig-3g.40gb, mig-3g.71gb, mig-3g.90gb, mig-3g.93gb, mig-4g.20gb, mig-4g.40gb, mig-4g.71gb, mig-4g.90gb, mig-4g.93gb, mig-7g.40gb, mig-7g.80gb, mig-7g.141gb, mig-7g.180gb, mig-7g.186gb
+    #             count: 1, # required
+    #           },
     #         },
     #       ],
     #       resource_sharing_config: {
@@ -8363,6 +8589,9 @@ module Aws::SageMaker
     #   The type of instance that hosts the optimized model that you create
     #   with the optimization job.
     #
+    # @option params [Integer] :max_instance_count
+    #   The maximum number of instances to use for the optimization job.
+    #
     # @option params [Hash<String,String>] :optimization_environment
     #   The environment variables to set in the model container.
     #
@@ -8424,8 +8653,12 @@ module Aws::SageMaker
     #           accept_eula: false, # required
     #         },
     #       },
+    #       sage_maker_model: {
+    #         model_name: "ModelName",
+    #       },
     #     },
-    #     deployment_instance_type: "ml.p4d.24xlarge", # required, accepts ml.p4d.24xlarge, ml.p4de.24xlarge, ml.p5.48xlarge, ml.g5.xlarge, ml.g5.2xlarge, ml.g5.4xlarge, ml.g5.8xlarge, ml.g5.12xlarge, ml.g5.16xlarge, ml.g5.24xlarge, ml.g5.48xlarge, ml.g6.xlarge, ml.g6.2xlarge, ml.g6.4xlarge, ml.g6.8xlarge, ml.g6.12xlarge, ml.g6.16xlarge, ml.g6.24xlarge, ml.g6.48xlarge, ml.g6e.xlarge, ml.g6e.2xlarge, ml.g6e.4xlarge, ml.g6e.8xlarge, ml.g6e.12xlarge, ml.g6e.16xlarge, ml.g6e.24xlarge, ml.g6e.48xlarge, ml.inf2.xlarge, ml.inf2.8xlarge, ml.inf2.24xlarge, ml.inf2.48xlarge, ml.trn1.2xlarge, ml.trn1.32xlarge, ml.trn1n.32xlarge
+    #     deployment_instance_type: "ml.p4d.24xlarge", # required, accepts ml.p4d.24xlarge, ml.p4de.24xlarge, ml.p5.48xlarge, ml.p5e.48xlarge, ml.p5en.48xlarge, ml.g5.xlarge, ml.g5.2xlarge, ml.g5.4xlarge, ml.g5.8xlarge, ml.g5.12xlarge, ml.g5.16xlarge, ml.g5.24xlarge, ml.g5.48xlarge, ml.g6.xlarge, ml.g6.2xlarge, ml.g6.4xlarge, ml.g6.8xlarge, ml.g6.12xlarge, ml.g6.16xlarge, ml.g6.24xlarge, ml.g6.48xlarge, ml.g6e.xlarge, ml.g6e.2xlarge, ml.g6e.4xlarge, ml.g6e.8xlarge, ml.g6e.12xlarge, ml.g6e.16xlarge, ml.g6e.24xlarge, ml.g6e.48xlarge, ml.inf2.xlarge, ml.inf2.8xlarge, ml.inf2.24xlarge, ml.inf2.48xlarge, ml.trn1.2xlarge, ml.trn1.32xlarge, ml.trn1n.32xlarge
+    #     max_instance_count: 1,
     #     optimization_environment: {
     #       "NonEmptyString256" => "String256",
     #     },
@@ -8449,11 +8682,21 @@ module Aws::SageMaker
     #             "NonEmptyString256" => "String256",
     #           },
     #         },
+    #         model_speculative_decoding_config: {
+    #           technique: "EAGLE", # required, accepts EAGLE
+    #           training_data_source: {
+    #             s3_uri: "S3Uri", # required
+    #             s3_data_type: "S3Prefix", # required, accepts S3Prefix, ManifestFile
+    #           },
+    #         },
     #       },
     #     ],
     #     output_config: { # required
     #       kms_key_id: "KmsKeyId",
     #       s3_output_location: "S3Uri", # required
+    #       sage_maker_model: {
+    #         model_name: "ModelName",
+    #       },
     #     },
     #     stopping_condition: { # required
     #       max_runtime_in_seconds: 1,
@@ -13443,6 +13686,7 @@ module Aws::SageMaker
     #   resp.instance_groups #=> Array
     #   resp.instance_groups[0].current_count #=> Integer
     #   resp.instance_groups[0].target_count #=> Integer
+    #   resp.instance_groups[0].min_count #=> Integer
     #   resp.instance_groups[0].instance_group_name #=> String
     #   resp.instance_groups[0].instance_type #=> String, one of "ml.p4d.24xlarge", "ml.p4de.24xlarge", "ml.p5.48xlarge", "ml.p6e-gb200.36xlarge", "ml.trn1.32xlarge", "ml.trn1n.32xlarge", "ml.g5.xlarge", "ml.g5.2xlarge", "ml.g5.4xlarge", "ml.g5.8xlarge", "ml.g5.12xlarge", "ml.g5.16xlarge", "ml.g5.24xlarge", "ml.g5.48xlarge", "ml.c5.large", "ml.c5.xlarge", "ml.c5.2xlarge", "ml.c5.4xlarge", "ml.c5.9xlarge", "ml.c5.12xlarge", "ml.c5.18xlarge", "ml.c5.24xlarge", "ml.c5n.large", "ml.c5n.2xlarge", "ml.c5n.4xlarge", "ml.c5n.9xlarge", "ml.c5n.18xlarge", "ml.m5.large", "ml.m5.xlarge", "ml.m5.2xlarge", "ml.m5.4xlarge", "ml.m5.8xlarge", "ml.m5.12xlarge", "ml.m5.16xlarge", "ml.m5.24xlarge", "ml.t3.medium", "ml.t3.large", "ml.t3.xlarge", "ml.t3.2xlarge", "ml.g6.xlarge", "ml.g6.2xlarge", "ml.g6.4xlarge", "ml.g6.8xlarge", "ml.g6.16xlarge", "ml.g6.12xlarge", "ml.g6.24xlarge", "ml.g6.48xlarge", "ml.gr6.4xlarge", "ml.gr6.8xlarge", "ml.g6e.xlarge", "ml.g6e.2xlarge", "ml.g6e.4xlarge", "ml.g6e.8xlarge", "ml.g6e.16xlarge", "ml.g6e.12xlarge", "ml.g6e.24xlarge", "ml.g6e.48xlarge", "ml.p5e.48xlarge", "ml.p5en.48xlarge", "ml.p6-b200.48xlarge", "ml.trn2.3xlarge", "ml.trn2.48xlarge", "ml.c6i.large", "ml.c6i.xlarge", "ml.c6i.2xlarge", "ml.c6i.4xlarge", "ml.c6i.8xlarge", "ml.c6i.12xlarge", "ml.c6i.16xlarge", "ml.c6i.24xlarge", "ml.c6i.32xlarge", "ml.m6i.large", "ml.m6i.xlarge", "ml.m6i.2xlarge", "ml.m6i.4xlarge", "ml.m6i.8xlarge", "ml.m6i.12xlarge", "ml.m6i.16xlarge", "ml.m6i.24xlarge", "ml.m6i.32xlarge", "ml.r6i.large", "ml.r6i.xlarge", "ml.r6i.2xlarge", "ml.r6i.4xlarge", "ml.r6i.8xlarge", "ml.r6i.12xlarge", "ml.r6i.16xlarge", "ml.r6i.24xlarge", "ml.r6i.32xlarge", "ml.i3en.large", "ml.i3en.xlarge", "ml.i3en.2xlarge", "ml.i3en.3xlarge", "ml.i3en.6xlarge", "ml.i3en.12xlarge", "ml.i3en.24xlarge", "ml.m7i.large", "ml.m7i.xlarge", "ml.m7i.2xlarge", "ml.m7i.4xlarge", "ml.m7i.8xlarge", "ml.m7i.12xlarge", "ml.m7i.16xlarge", "ml.m7i.24xlarge", "ml.m7i.48xlarge", "ml.r7i.large", "ml.r7i.xlarge", "ml.r7i.2xlarge", "ml.r7i.4xlarge", "ml.r7i.8xlarge", "ml.r7i.12xlarge", "ml.r7i.16xlarge", "ml.r7i.24xlarge", "ml.r7i.48xlarge"
     #   resp.instance_groups[0].life_cycle_config.source_s3_uri #=> String
@@ -13472,6 +13716,20 @@ module Aws::SageMaker
     #   resp.instance_groups[0].scheduled_update_config.deployment_config.auto_rollback_configuration[0].alarm_name #=> String
     #   resp.instance_groups[0].current_image_id #=> String
     #   resp.instance_groups[0].desired_image_id #=> String
+    #   resp.instance_groups[0].active_operations #=> Hash
+    #   resp.instance_groups[0].active_operations["ActiveClusterOperationName"] #=> Integer
+    #   resp.instance_groups[0].kubernetes_config.current_labels #=> Hash
+    #   resp.instance_groups[0].kubernetes_config.current_labels["ClusterKubernetesLabelKey"] #=> String
+    #   resp.instance_groups[0].kubernetes_config.desired_labels #=> Hash
+    #   resp.instance_groups[0].kubernetes_config.desired_labels["ClusterKubernetesLabelKey"] #=> String
+    #   resp.instance_groups[0].kubernetes_config.current_taints #=> Array
+    #   resp.instance_groups[0].kubernetes_config.current_taints[0].key #=> String
+    #   resp.instance_groups[0].kubernetes_config.current_taints[0].value #=> String
+    #   resp.instance_groups[0].kubernetes_config.current_taints[0].effect #=> String, one of "NoSchedule", "PreferNoSchedule", "NoExecute"
+    #   resp.instance_groups[0].kubernetes_config.desired_taints #=> Array
+    #   resp.instance_groups[0].kubernetes_config.desired_taints[0].key #=> String
+    #   resp.instance_groups[0].kubernetes_config.desired_taints[0].value #=> String
+    #   resp.instance_groups[0].kubernetes_config.desired_taints[0].effect #=> String, one of "NoSchedule", "PreferNoSchedule", "NoExecute"
     #   resp.instance_groups[0].target_state_count #=> Integer
     #   resp.instance_groups[0].software_update_status #=> String, one of "Pending", "InProgress", "Succeeded", "Failed", "RollbackInProgress", "RollbackComplete"
     #   resp.instance_groups[0].active_software_update_config.rolling_update_policy.maximum_batch_size.type #=> String, one of "INSTANCE_COUNT", "CAPACITY_PERCENTAGE"
@@ -13582,6 +13840,7 @@ module Aws::SageMaker
     #   resp.event_details.event_details.event_metadata.instance_group.ami_override #=> String
     #   resp.event_details.event_details.event_metadata.instance_group_scaling.instance_count #=> Integer
     #   resp.event_details.event_details.event_metadata.instance_group_scaling.target_count #=> Integer
+    #   resp.event_details.event_details.event_metadata.instance_group_scaling.min_count #=> Integer
     #   resp.event_details.event_details.event_metadata.instance_group_scaling.failure_message #=> String
     #   resp.event_details.event_details.event_metadata.instance.customer_eni #=> String
     #   resp.event_details.event_details.event_metadata.instance.additional_enis.efa_enis #=> Array
@@ -13659,6 +13918,19 @@ module Aws::SageMaker
     #   resp.node_details.current_image_id #=> String
     #   resp.node_details.desired_image_id #=> String
     #   resp.node_details.ultra_server_info.id #=> String
+    #   resp.node_details.kubernetes_config.current_labels #=> Hash
+    #   resp.node_details.kubernetes_config.current_labels["ClusterKubernetesLabelKey"] #=> String
+    #   resp.node_details.kubernetes_config.desired_labels #=> Hash
+    #   resp.node_details.kubernetes_config.desired_labels["ClusterKubernetesLabelKey"] #=> String
+    #   resp.node_details.kubernetes_config.current_taints #=> Array
+    #   resp.node_details.kubernetes_config.current_taints[0].key #=> String
+    #   resp.node_details.kubernetes_config.current_taints[0].value #=> String
+    #   resp.node_details.kubernetes_config.current_taints[0].effect #=> String, one of "NoSchedule", "PreferNoSchedule", "NoExecute"
+    #   resp.node_details.kubernetes_config.desired_taints #=> Array
+    #   resp.node_details.kubernetes_config.desired_taints[0].key #=> String
+    #   resp.node_details.kubernetes_config.desired_taints[0].value #=> String
+    #   resp.node_details.kubernetes_config.desired_taints[0].effect #=> String, one of "NoSchedule", "PreferNoSchedule", "NoExecute"
+    #   resp.node_details.capacity_type #=> String, one of "Spot", "OnDemand"
     #
     # @see http://docs.aws.amazon.com/goto/WebAPI/sagemaker-2017-07-24/DescribeClusterNode AWS API Documentation
     #
@@ -13912,6 +14184,8 @@ module Aws::SageMaker
     #   resp.compute_quota_config.compute_quota_resources[0].accelerators #=> Integer
     #   resp.compute_quota_config.compute_quota_resources[0].v_cpu #=> Float
     #   resp.compute_quota_config.compute_quota_resources[0].memory_in_gi_b #=> Float
+    #   resp.compute_quota_config.compute_quota_resources[0].accelerator_partition.type #=> String, one of "mig-1g.5gb", "mig-1g.10gb", "mig-1g.18gb", "mig-1g.20gb", "mig-1g.23gb", "mig-1g.35gb", "mig-1g.45gb", "mig-1g.47gb", "mig-2g.10gb", "mig-2g.20gb", "mig-2g.35gb", "mig-2g.45gb", "mig-2g.47gb", "mig-3g.20gb", "mig-3g.40gb", "mig-3g.71gb", "mig-3g.90gb", "mig-3g.93gb", "mig-4g.20gb", "mig-4g.40gb", "mig-4g.71gb", "mig-4g.90gb", "mig-4g.93gb", "mig-7g.40gb", "mig-7g.80gb", "mig-7g.141gb", "mig-7g.180gb", "mig-7g.186gb"
+    #   resp.compute_quota_config.compute_quota_resources[0].accelerator_partition.count #=> Integer
     #   resp.compute_quota_config.resource_sharing_config.strategy #=> String, one of "Lend", "DontLend", "LendAndBorrow"
     #   resp.compute_quota_config.resource_sharing_config.borrow_limit #=> Integer
     #   resp.compute_quota_config.preempt_team_tasks #=> String, one of "Never", "LowerPriority"
@@ -17399,6 +17673,7 @@ module Aws::SageMaker
     #   * {Types::DescribeOptimizationJobResponse#model_source #model_source} => Types::OptimizationJobModelSource
     #   * {Types::DescribeOptimizationJobResponse#optimization_environment #optimization_environment} => Hash&lt;String,String&gt;
     #   * {Types::DescribeOptimizationJobResponse#deployment_instance_type #deployment_instance_type} => String
+    #   * {Types::DescribeOptimizationJobResponse#max_instance_count #max_instance_count} => Integer
     #   * {Types::DescribeOptimizationJobResponse#optimization_configs #optimization_configs} => Array&lt;Types::OptimizationConfig&gt;
     #   * {Types::DescribeOptimizationJobResponse#output_config #output_config} => Types::OptimizationJobOutputConfig
     #   * {Types::DescribeOptimizationJobResponse#optimization_output #optimization_output} => Types::OptimizationOutput
@@ -17424,9 +17699,11 @@ module Aws::SageMaker
     #   resp.optimization_job_name #=> String
     #   resp.model_source.s3.s3_uri #=> String
     #   resp.model_source.s3.model_access_config.accept_eula #=> Boolean
+    #   resp.model_source.sage_maker_model.model_name #=> String
     #   resp.optimization_environment #=> Hash
     #   resp.optimization_environment["NonEmptyString256"] #=> String
-    #   resp.deployment_instance_type #=> String, one of "ml.p4d.24xlarge", "ml.p4de.24xlarge", "ml.p5.48xlarge", "ml.g5.xlarge", "ml.g5.2xlarge", "ml.g5.4xlarge", "ml.g5.8xlarge", "ml.g5.12xlarge", "ml.g5.16xlarge", "ml.g5.24xlarge", "ml.g5.48xlarge", "ml.g6.xlarge", "ml.g6.2xlarge", "ml.g6.4xlarge", "ml.g6.8xlarge", "ml.g6.12xlarge", "ml.g6.16xlarge", "ml.g6.24xlarge", "ml.g6.48xlarge", "ml.g6e.xlarge", "ml.g6e.2xlarge", "ml.g6e.4xlarge", "ml.g6e.8xlarge", "ml.g6e.12xlarge", "ml.g6e.16xlarge", "ml.g6e.24xlarge", "ml.g6e.48xlarge", "ml.inf2.xlarge", "ml.inf2.8xlarge", "ml.inf2.24xlarge", "ml.inf2.48xlarge", "ml.trn1.2xlarge", "ml.trn1.32xlarge", "ml.trn1n.32xlarge"
+    #   resp.deployment_instance_type #=> String, one of "ml.p4d.24xlarge", "ml.p4de.24xlarge", "ml.p5.48xlarge", "ml.p5e.48xlarge", "ml.p5en.48xlarge", "ml.g5.xlarge", "ml.g5.2xlarge", "ml.g5.4xlarge", "ml.g5.8xlarge", "ml.g5.12xlarge", "ml.g5.16xlarge", "ml.g5.24xlarge", "ml.g5.48xlarge", "ml.g6.xlarge", "ml.g6.2xlarge", "ml.g6.4xlarge", "ml.g6.8xlarge", "ml.g6.12xlarge", "ml.g6.16xlarge", "ml.g6.24xlarge", "ml.g6.48xlarge", "ml.g6e.xlarge", "ml.g6e.2xlarge", "ml.g6e.4xlarge", "ml.g6e.8xlarge", "ml.g6e.12xlarge", "ml.g6e.16xlarge", "ml.g6e.24xlarge", "ml.g6e.48xlarge", "ml.inf2.xlarge", "ml.inf2.8xlarge", "ml.inf2.24xlarge", "ml.inf2.48xlarge", "ml.trn1.2xlarge", "ml.trn1.32xlarge", "ml.trn1n.32xlarge"
+    #   resp.max_instance_count #=> Integer
     #   resp.optimization_configs #=> Array
     #   resp.optimization_configs[0].model_quantization_config.image #=> String
     #   resp.optimization_configs[0].model_quantization_config.override_environment #=> Hash
@@ -17437,8 +17714,12 @@ module Aws::SageMaker
     #   resp.optimization_configs[0].model_sharding_config.image #=> String
     #   resp.optimization_configs[0].model_sharding_config.override_environment #=> Hash
     #   resp.optimization_configs[0].model_sharding_config.override_environment["NonEmptyString256"] #=> String
+    #   resp.optimization_configs[0].model_speculative_decoding_config.technique #=> String, one of "EAGLE"
+    #   resp.optimization_configs[0].model_speculative_decoding_config.training_data_source.s3_uri #=> String
+    #   resp.optimization_configs[0].model_speculative_decoding_config.training_data_source.s3_data_type #=> String, one of "S3Prefix", "ManifestFile"
     #   resp.output_config.kms_key_id #=> String
     #   resp.output_config.s3_output_location #=> String
+    #   resp.output_config.sage_maker_model.model_name #=> String
     #   resp.optimization_output.recommended_inference_image #=> String
     #   resp.role_arn #=> String
     #   resp.stopping_condition.max_runtime_in_seconds #=> Integer
@@ -18411,7 +18692,7 @@ module Aws::SageMaker
     #   resp.available_spare_instance_count #=> Integer
     #   resp.total_ultra_server_count #=> Integer
     #   resp.target_resources #=> Array
-    #   resp.target_resources[0] #=> String, one of "training-job", "hyperpod-cluster"
+    #   resp.target_resources[0] #=> String, one of "training-job", "hyperpod-cluster", "endpoint"
     #   resp.reserved_capacity_summaries #=> Array
     #   resp.reserved_capacity_summaries[0].reserved_capacity_arn #=> String
     #   resp.reserved_capacity_summaries[0].reserved_capacity_type #=> String, one of "UltraServer", "Instance"
@@ -20350,6 +20631,7 @@ module Aws::SageMaker
     #   resp.cluster_node_summaries[0].instance_status.status #=> String, one of "Running", "Failure", "Pending", "ShuttingDown", "SystemUpdating", "DeepHealthCheckInProgress", "NotFound"
     #   resp.cluster_node_summaries[0].instance_status.message #=> String
     #   resp.cluster_node_summaries[0].ultra_server_info.id #=> String
+    #   resp.cluster_node_summaries[0].private_dns_hostname #=> String
     #
     # @see http://docs.aws.amazon.com/goto/WebAPI/sagemaker-2017-07-24/ListClusterNodes AWS API Documentation
     #
@@ -20813,6 +21095,8 @@ module Aws::SageMaker
     #   resp.compute_quota_summaries[0].compute_quota_config.compute_quota_resources[0].accelerators #=> Integer
     #   resp.compute_quota_summaries[0].compute_quota_config.compute_quota_resources[0].v_cpu #=> Float
     #   resp.compute_quota_summaries[0].compute_quota_config.compute_quota_resources[0].memory_in_gi_b #=> Float
+    #   resp.compute_quota_summaries[0].compute_quota_config.compute_quota_resources[0].accelerator_partition.type #=> String, one of "mig-1g.5gb", "mig-1g.10gb", "mig-1g.18gb", "mig-1g.20gb", "mig-1g.23gb", "mig-1g.35gb", "mig-1g.45gb", "mig-1g.47gb", "mig-2g.10gb", "mig-2g.20gb", "mig-2g.35gb", "mig-2g.45gb", "mig-2g.47gb", "mig-3g.20gb", "mig-3g.40gb", "mig-3g.71gb", "mig-3g.90gb", "mig-3g.93gb", "mig-4g.20gb", "mig-4g.40gb", "mig-4g.71gb", "mig-4g.90gb", "mig-4g.93gb", "mig-7g.40gb", "mig-7g.80gb", "mig-7g.141gb", "mig-7g.180gb", "mig-7g.186gb"
+    #   resp.compute_quota_summaries[0].compute_quota_config.compute_quota_resources[0].accelerator_partition.count #=> Integer
     #   resp.compute_quota_summaries[0].compute_quota_config.resource_sharing_config.strategy #=> String, one of "Lend", "DontLend", "LendAndBorrow"
     #   resp.compute_quota_summaries[0].compute_quota_config.resource_sharing_config.borrow_limit #=> Integer
     #   resp.compute_quota_summaries[0].compute_quota_config.preempt_team_tasks #=> String, one of "Never", "LowerPriority"
@@ -24261,7 +24545,8 @@ module Aws::SageMaker
     #   resp.optimization_job_summaries[0].optimization_start_time #=> Time
     #   resp.optimization_job_summaries[0].optimization_end_time #=> Time
     #   resp.optimization_job_summaries[0].last_modified_time #=> Time
-    #   resp.optimization_job_summaries[0].deployment_instance_type #=> String, one of "ml.p4d.24xlarge", "ml.p4de.24xlarge", "ml.p5.48xlarge", "ml.g5.xlarge", "ml.g5.2xlarge", "ml.g5.4xlarge", "ml.g5.8xlarge", "ml.g5.12xlarge", "ml.g5.16xlarge", "ml.g5.24xlarge", "ml.g5.48xlarge", "ml.g6.xlarge", "ml.g6.2xlarge", "ml.g6.4xlarge", "ml.g6.8xlarge", "ml.g6.12xlarge", "ml.g6.16xlarge", "ml.g6.24xlarge", "ml.g6.48xlarge", "ml.g6e.xlarge", "ml.g6e.2xlarge", "ml.g6e.4xlarge", "ml.g6e.8xlarge", "ml.g6e.12xlarge", "ml.g6e.16xlarge", "ml.g6e.24xlarge", "ml.g6e.48xlarge", "ml.inf2.xlarge", "ml.inf2.8xlarge", "ml.inf2.24xlarge", "ml.inf2.48xlarge", "ml.trn1.2xlarge", "ml.trn1.32xlarge", "ml.trn1n.32xlarge"
+    #   resp.optimization_job_summaries[0].deployment_instance_type #=> String, one of "ml.p4d.24xlarge", "ml.p4de.24xlarge", "ml.p5.48xlarge", "ml.p5e.48xlarge", "ml.p5en.48xlarge", "ml.g5.xlarge", "ml.g5.2xlarge", "ml.g5.4xlarge", "ml.g5.8xlarge", "ml.g5.12xlarge", "ml.g5.16xlarge", "ml.g5.24xlarge", "ml.g5.48xlarge", "ml.g6.xlarge", "ml.g6.2xlarge", "ml.g6.4xlarge", "ml.g6.8xlarge", "ml.g6.12xlarge", "ml.g6.16xlarge", "ml.g6.24xlarge", "ml.g6.48xlarge", "ml.g6e.xlarge", "ml.g6e.2xlarge", "ml.g6e.4xlarge", "ml.g6e.8xlarge", "ml.g6e.12xlarge", "ml.g6e.16xlarge", "ml.g6e.24xlarge", "ml.g6e.48xlarge", "ml.inf2.xlarge", "ml.inf2.8xlarge", "ml.inf2.24xlarge", "ml.inf2.48xlarge", "ml.trn1.2xlarge", "ml.trn1.32xlarge", "ml.trn1n.32xlarge"
+    #   resp.optimization_job_summaries[0].max_instance_count #=> Integer
     #   resp.optimization_job_summaries[0].optimization_types #=> Array
     #   resp.optimization_job_summaries[0].optimization_types[0] #=> String
     #   resp.next_token #=> String
@@ -25460,7 +25745,7 @@ module Aws::SageMaker
     #   resp.training_plan_summaries[0].in_use_instance_count #=> Integer
     #   resp.training_plan_summaries[0].total_ultra_server_count #=> Integer
     #   resp.training_plan_summaries[0].target_resources #=> Array
-    #   resp.training_plan_summaries[0].target_resources[0] #=> String, one of "training-job", "hyperpod-cluster"
+    #   resp.training_plan_summaries[0].target_resources[0] #=> String, one of "training-job", "hyperpod-cluster", "endpoint"
     #   resp.training_plan_summaries[0].reserved_capacity_summaries #=> Array
     #   resp.training_plan_summaries[0].reserved_capacity_summaries[0].reserved_capacity_arn #=> String
     #   resp.training_plan_summaries[0].reserved_capacity_summaries[0].reserved_capacity_type #=> String, one of "UltraServer", "Instance"
@@ -26481,7 +26766,7 @@ module Aws::SageMaker
     #
     # @option params [required, Array<String>] :target_resources
     #   The target resources (e.g., SageMaker Training Jobs, SageMaker
-    #   HyperPod) to search for in the offerings.
+    #   HyperPod, SageMaker Endpoints) to search for in the offerings.
     #
     #   Training plans are specific to their target resource.
     #
@@ -26491,6 +26776,10 @@ module Aws::SageMaker
     #   * A training plan for HyperPod clusters can be used exclusively to
     #     provide compute resources to a cluster's instance group.
     #
+    #   * A training plan for SageMaker endpoints can be used exclusively to
+    #     provide compute resources to SageMaker endpoints for model
+    #     deployment.
+    #
     # @return [Types::SearchTrainingPlanOfferingsResponse] Returns a {Seahorse::Client::Response response} object which responds to the following methods:
     #
     #   * {Types::SearchTrainingPlanOfferingsResponse#training_plan_offerings #training_plan_offerings} => Array&lt;Types::TrainingPlanOffering&gt;
@@ -26505,7 +26794,7 @@ module Aws::SageMaker
     #     start_time_after: Time.now,
     #     end_time_before: Time.now,
     #     duration_hours: 1, # required
-    #     target_resources: ["training-job"], # required, accepts training-job, hyperpod-cluster
+    #     target_resources: ["training-job"], # required, accepts training-job, hyperpod-cluster, endpoint
     #   })
     #
     # @example Response structure
@@ -26513,7 +26802,7 @@ module Aws::SageMaker
     #   resp.training_plan_offerings #=> Array
     #   resp.training_plan_offerings[0].training_plan_offering_id #=> String
     #   resp.training_plan_offerings[0].target_resources #=> Array
-    #   resp.training_plan_offerings[0].target_resources[0] #=> String, one of "training-job", "hyperpod-cluster"
+    #   resp.training_plan_offerings[0].target_resources[0] #=> String, one of "training-job", "hyperpod-cluster", "endpoint"
     #   resp.training_plan_offerings[0].requested_start_time_after #=> Time
     #   resp.training_plan_offerings[0].requested_end_time_before #=> Time
     #   resp.training_plan_offerings[0].duration_hours #=> Integer
@@ -27596,6 +27885,7 @@ module Aws::SageMaker
     #     instance_groups: [
     #       {
     #         instance_count: 1, # required
+    #         min_instance_count: 1,
     #         instance_group_name: "ClusterInstanceGroupName", # required
     #         instance_type: "ml.p4d.24xlarge", # required, accepts ml.p4d.24xlarge, ml.p4de.24xlarge, ml.p5.48xlarge, ml.p6e-gb200.36xlarge, ml.trn1.32xlarge, ml.trn1n.32xlarge, ml.g5.xlarge, ml.g5.2xlarge, ml.g5.4xlarge, ml.g5.8xlarge, ml.g5.12xlarge, ml.g5.16xlarge, ml.g5.24xlarge, ml.g5.48xlarge, ml.c5.large, ml.c5.xlarge, ml.c5.2xlarge, ml.c5.4xlarge, ml.c5.9xlarge, ml.c5.12xlarge, ml.c5.18xlarge, ml.c5.24xlarge, ml.c5n.large, ml.c5n.2xlarge, ml.c5n.4xlarge, ml.c5n.9xlarge, ml.c5n.18xlarge, ml.m5.large, ml.m5.xlarge, ml.m5.2xlarge, ml.m5.4xlarge, ml.m5.8xlarge, ml.m5.12xlarge, ml.m5.16xlarge, ml.m5.24xlarge, ml.t3.medium, ml.t3.large, ml.t3.xlarge, ml.t3.2xlarge, ml.g6.xlarge, ml.g6.2xlarge, ml.g6.4xlarge, ml.g6.8xlarge, ml.g6.16xlarge, ml.g6.12xlarge, ml.g6.24xlarge, ml.g6.48xlarge, ml.gr6.4xlarge, ml.gr6.8xlarge, ml.g6e.xlarge, ml.g6e.2xlarge, ml.g6e.4xlarge, ml.g6e.8xlarge, ml.g6e.16xlarge, ml.g6e.12xlarge, ml.g6e.24xlarge, ml.g6e.48xlarge, ml.p5e.48xlarge, ml.p5en.48xlarge, ml.p6-b200.48xlarge, ml.trn2.3xlarge, ml.trn2.48xlarge, ml.c6i.large, ml.c6i.xlarge, ml.c6i.2xlarge, ml.c6i.4xlarge, ml.c6i.8xlarge, ml.c6i.12xlarge, ml.c6i.16xlarge, ml.c6i.24xlarge, ml.c6i.32xlarge, ml.m6i.large, ml.m6i.xlarge, ml.m6i.2xlarge, ml.m6i.4xlarge, ml.m6i.8xlarge, ml.m6i.12xlarge, ml.m6i.16xlarge, ml.m6i.24xlarge, ml.m6i.32xlarge, ml.r6i.large, ml.r6i.xlarge, ml.r6i.2xlarge, ml.r6i.4xlarge, ml.r6i.8xlarge, ml.r6i.12xlarge, ml.r6i.16xlarge, ml.r6i.24xlarge, ml.r6i.32xlarge, ml.i3en.large, ml.i3en.xlarge, ml.i3en.2xlarge, ml.i3en.3xlarge, ml.i3en.6xlarge, ml.i3en.12xlarge, ml.i3en.24xlarge, ml.m7i.large, ml.m7i.xlarge, ml.m7i.2xlarge, ml.m7i.4xlarge, ml.m7i.8xlarge, ml.m7i.12xlarge, ml.m7i.16xlarge, ml.m7i.24xlarge, ml.m7i.48xlarge, ml.r7i.large, ml.r7i.xlarge, ml.r7i.2xlarge, ml.r7i.4xlarge, ml.r7i.8xlarge, ml.r7i.12xlarge, ml.r7i.16xlarge, ml.r7i.24xlarge, ml.r7i.48xlarge
     #         life_cycle_config: { # required
@@ -27641,6 +27931,24 @@ module Aws::SageMaker
     #           },
     #         },
     #         image_id: "ImageId",
+    #         kubernetes_config: {
+    #           labels: {
+    #             "ClusterKubernetesLabelKey" => "ClusterKubernetesLabelValue",
+    #           },
+    #           taints: [
+    #             {
+    #               key: "ClusterKubernetesTaintKey", # required
+    #               value: "ClusterKubernetesTaintValue",
+    #               effect: "NoSchedule", # required, accepts NoSchedule, PreferNoSchedule, NoExecute
+    #             },
+    #           ],
+    #         },
+    #         capacity_requirements: {
+    #           spot: {
+    #           },
+    #           on_demand: {
+    #           },
+    #         },
     #       },
     #     ],
     #     restricted_instance_groups: [
@@ -27951,6 +28259,10 @@ module Aws::SageMaker
     #           accelerators: 1,
     #           v_cpu: 1.0,
     #           memory_in_gi_b: 1.0,
+    #           accelerator_partition: {
+    #             type: "mig-1g.5gb", # required, accepts mig-1g.5gb, mig-1g.10gb, mig-1g.18gb, mig-1g.20gb, mig-1g.23gb, mig-1g.35gb, mig-1g.45gb, mig-1g.47gb, mig-2g.10gb, mig-2g.20gb, mig-2g.35gb, mig-2g.45gb, mig-2g.47gb, mig-3g.20gb, mig-3g.40gb, mig-3g.71gb, mig-3g.90gb, mig-3g.93gb, mig-4g.20gb, mig-4g.40gb, mig-4g.71gb, mig-4g.90gb, mig-4g.93gb, mig-7g.40gb, mig-7g.80gb, mig-7g.141gb, mig-7g.180gb, mig-7g.186gb
+    #             count: 1, # required
+    #           },
     #         },
     #       ],
     #       resource_sharing_config: {
@@ -31359,7 +31671,7 @@ module Aws::SageMaker
         tracer: tracer
       )
       context[:gem_name] = 'aws-sdk-sagemaker'
-      context[:gem_version] = '1.339.0'
+      context[:gem_version] = '1.341.0'
       Seahorse::Client::Request.new(handlers, context)
     end