npm - @aws/ml-container-creator - Versions diffs - 0.13.3 → 0.13.4 - Mend

@aws/ml-container-creator 0.13.3 → 0.13.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (31) hide show

package/package.json +2 -2
package/servers/instance-sizer/lib/model-resolver.js +127 -185
package/servers/instance-sizer/lib/vram-estimator.js +86 -0
package/servers/lib/catalogs/instances.json +0 -27
package/src/lib/bootstrap-command-handler.js +2 -2
package/src/lib/generated/cli-options.js +1 -1
package/src/lib/generated/parameter-matrix.js +1 -1
package/src/lib/generated/validation-rules.js +1 -1
package/src/lib/prompt-runner.js +14 -31
package/templates/IAM_PERMISSIONS.md +64 -13
package/templates/do/.tune_helper.py +5 -2
package/templates/do/README.md +50 -604
package/templates/do/adapter +1 -4
package/templates/do/build +2 -5
package/templates/do/clean.d/async-inference.ejs +2 -5
package/templates/do/clean.d/batch-transform.ejs +2 -5
package/templates/do/clean.d/hyperpod-eks.ejs +2 -5
package/templates/do/clean.d/managed-inference.ejs +2 -5
package/templates/do/deploy.d/async-inference.ejs +6 -9
package/templates/do/deploy.d/batch-transform.ejs +4 -7
package/templates/do/deploy.d/hyperpod-eks.ejs +1 -4
package/templates/do/deploy.d/managed-inference.ejs +15 -6
package/templates/do/lib/profile.sh +19 -15
package/templates/do/push +2 -5
package/templates/do/register +2 -5
package/templates/do/stage +36 -33
package/templates/do/submit +1 -4
package/templates/do/tune +1 -4
package/templates/MIGRATION.md +0 -488
package/templates/TEMPLATE_SYSTEM.md +0 -243
package/templates/do/__pycache__/.benchmark_writer.cpython-312.pyc +0 -0

package/src/lib/prompt-runner.js CHANGED Viewed

@@ -18,8 +18,6 @@ import {
     modelLoadStrategyPrompts,
     modelProfilePrompts,
     modulePrompts,
-    loraPrompts,
-    benchmarkPrompts,
     infraRegionAndTargetPrompts,
     infraExistingEndpointPrompts,
     infraInstancePrompts,
@@ -521,38 +519,23 @@ export default class PromptRunner {
         const ngcApiKeyAnswers = { ngcApiKey: secretAnswers.ngcApiKey, ngcTokenArn: secretAnswers.ngcTokenArn };
         // Module selection
-        const moduleAnswers = await this._runPhase(modulePrompts, { ...frameworkAnswers, ...engineAnswers }, explicitConfig, existingConfig);
-        // Ensure transformers, diffusors, and ineligible Triton backends don't get sample model
-        if (frameworkAnswers.architecture === 'transformers' ||
-            frameworkAnswers.architecture === 'diffusors' ||
-            (frameworkAnswers.architecture === 'triton' &&
-             !this._tritonBackends[frameworkAnswers.backend]?.supportsSampleModel)) {
+        // Only ask about sample model for non-transformers/diffusors (Triton etc.)
+        const moduleAnswers = {};
+        if (frameworkAnswers.architecture !== 'transformers' &&
+            frameworkAnswers.architecture !== 'diffusors') {
+            const sampleModelAnswers = await this._runPhase(
+                modulePrompts.filter(p => p.name === 'includeSampleModel'),
+                { ...frameworkAnswers, ...engineAnswers }, explicitConfig, existingConfig
+            );
+            Object.assign(moduleAnswers, sampleModelAnswers);
+        } else {
             moduleAnswers.includeSampleModel = false;
         }
-        // Benchmark prompts — derive includeBenchmark from testTypes selection or CLI flag
-        // Requirements: 1.1, 1.2
-        let benchmarkAnswers = {};
-        if (frameworkAnswers.architecture === 'transformers' || frameworkAnswers.architecture === 'diffusors') {
-            const testTypes = moduleAnswers.testTypes || [];
-            const includeBenchmark = testTypes.includes('sagemaker-ai-automated-benchmarking') ||
-                explicitConfig.includeBenchmark === true ||
-                explicitConfig.includeBenchmark === 'true';
-            benchmarkAnswers.includeBenchmark = includeBenchmark;
-            if (includeBenchmark) {
-                const subAnswers = await this._runPhase(benchmarkPrompts, { ...frameworkAnswers, ...moduleAnswers, includeBenchmark }, explicitConfig, existingConfig);
-                benchmarkAnswers = { ...benchmarkAnswers, ...subAnswers };
-            }
-        }
-        // LoRA adapter prompts — only for transformers with vllm/sglang/djl-lmi
-        // Requirements: 1.1, 1.2, 1.4
-        let loraAnswers = {};
-        const loraSubAnswers = await this._runPhase(loraPrompts, { ...frameworkAnswers, ...engineAnswers }, explicitConfig, existingConfig);
-        if (loraSubAnswers.enableLora !== undefined) {
-            loraAnswers = loraSubAnswers;
-        }
+        // Test types, benchmark, and LoRA are always-on (BL-122)
+        moduleAnswers.testTypes = ['hosted-model-endpoint', 'sagemaker-ai-automated-benchmarking'];
+        const benchmarkAnswers = { includeBenchmark: true };
+        const loraAnswers = { enableLora: true };
         // Validate instance type against framework requirements (now that framework version is known)
         const finalInstanceType = infraAnswers.customInstanceType || infraAnswers.instanceType;

package/templates/IAM_PERMISSIONS.md CHANGED Viewed

@@ -10,14 +10,47 @@ This project uses three sets of IAM permissions:
 ## SageMaker Execution Role
-The bootstrap command creates an IAM role (`mlcc-sagemaker-execution-role`) with permissions for:
+The bootstrap command creates an IAM role (`mlcc-sagemaker-execution-role`) with these permission groups:
-- **SageMaker**: Create, update, delete, and invoke endpoints, endpoint configs, models, and inference components
-- **ECR**: Pull images from the `ml-container-creator` repository
-- **CloudWatch Logs**: Write container logs
-- **S3**: Read model artifacts from `ml-container-creator-*` buckets
+### Endpoint Management
+Create, update, delete, describe, and invoke endpoints, endpoint configs, models, and inference components.
-The role is defined in the CloudFormation stack template (`config/bootstrap-stack.json`) and updated automatically when you re-run bootstrap after upgrading.
+### AI Benchmarking
+Create, describe, list, stop, and delete AI benchmark jobs, AI recommendation jobs, and AI workload configs.
+### Training & Model Customization
+Create/describe/stop training jobs, model packages, model package groups. Access SageMaker Hub contents. Manage training plans.
+### MLflow Integration
+List/describe MLflow tracking servers and apps. Create presigned URLs. Call MLflow app APIs.
+### ECR
+Pull container images (GetAuthorizationToken, BatchGetImage, GetDownloadUrlForLayer, BatchCheckLayerAvailability).
+### S3
+Read and write model artifacts, adapters, benchmark results:
+- `s3:GetObject`, `s3:PutObject`, `s3:AbortMultipartUpload`, `s3:ListBucket`
+- Scoped to `mlcc-*` and `ml-container-creator-*` buckets
+### CloudWatch Logs
+Create log groups/streams and put log events.
+### Secrets Manager
+Read and write secrets prefixed with `mlcc/` or `ml-container-creator/` (used for HF tokens, API keys).
+### SNS
+Publish notifications to `mlcc-*` and `ml-container-creator-*` topics (benchmark completion alerts).
+### Service Quotas & Capacity
+Query service quotas and training plan availability for instance selection.
+### Lambda
+Invoke functions (reward model evaluation during training/tuning).
+### PassRole
+Self-pass to SageMaker service, scoped to `mlcc-sagemaker-execution-role`.
+The role is defined in `config/bootstrap-stack.json` and updated automatically when you re-run bootstrap after upgrading.
 If you use a custom role (`--role-arn`), ensure it has at minimum:
@@ -25,12 +58,15 @@ If you use a custom role (`--role-arn`), ensure it has at minimum:
 |-----------|---------|
 | `sagemaker:CreateEndpoint`, `CreateEndpointConfig`, `CreateModel`, `CreateInferenceComponent` | Deploy |
 | `sagemaker:DeleteEndpoint`, `DeleteEndpointConfig`, `DeleteModel`, `DeleteInferenceComponent` | Clean up |
-| `sagemaker:DescribeEndpoint`, `DescribeEndpointConfig`, `DescribeModel`, `DescribeInferenceComponent` | Status checks |
+| `sagemaker:DescribeEndpoint`, `DescribeEndpointConfig`, `DescribeModel`, `DescribeInferenceComponent`, `ListInferenceComponents` | Status |
 | `sagemaker:InvokeEndpoint`, `InvokeEndpointAsync` | Inference |
 | `sagemaker:UpdateEndpoint`, `UpdateEndpointWeightsAndCapacities`, `UpdateInferenceComponent` | Updates |
-| `ecr:GetAuthorizationToken`, `BatchGetImage`, `GetDownloadUrlForLayer`, `BatchCheckLayerAvailability` | Pull container image |
-| `logs:CreateLogGroup`, `CreateLogStream`, `PutLogEvents` | Container logging |
-| `s3:GetObject`, `s3:ListBucket` on `ml-container-creator-*` | Model artifact access |
+| `sagemaker:CreateAIBenchmarkJob`, `DescribeAIBenchmarkJob`, `ListAIBenchmarkJobs` | Benchmark |
+| `sagemaker:CreateTrainingJob`, `DescribeTrainingJob`, `StopTrainingJob` | Training/tuning |
+| `ecr:GetAuthorizationToken`, `BatchGetImage`, `GetDownloadUrlForLayer`, `BatchCheckLayerAvailability` | Pull image |
+| `logs:CreateLogGroup`, `CreateLogStream`, `PutLogEvents` | Logging |
+| `s3:GetObject`, `s3:PutObject`, `s3:ListBucket` on project buckets | Artifacts |
+| `iam:PassRole` (to sagemaker.amazonaws.com) | Role delegation |
 Trust policy must allow `sagemaker.amazonaws.com` to assume the role.
@@ -48,12 +84,27 @@ Your AWS user or CI system needs these permissions to run the do-scripts:
 | Script | Permissions Needed |
 |--------|-------------------|
+| `./do/build` | Local only — no AWS permissions |
+| `./do/run` | Local only — no AWS permissions |
 | `./do/push` | `ecr:GetAuthorizationToken`, `ecr:PutImage`, `ecr:InitiateLayerUpload`, `ecr:UploadLayerPart`, `ecr:CompleteLayerUpload`, `ecr:BatchCheckLayerAvailability` |
 | `./do/submit` | `codebuild:CreateProject`, `codebuild:StartBuild`, `codebuild:BatchGetBuilds`, `iam:CreateRole`, `iam:PutRolePolicy`, `iam:PassRole`, `s3:PutObject`, `s3:CreateBucket` |
-| `./do/deploy` | `sagemaker:CreateEndpointConfig`, `sagemaker:CreateEndpoint`, `sagemaker:CreateInferenceComponent`, `sagemaker:DescribeEndpoint`, `iam:PassRole` |
-| `./do/clean` | `sagemaker:DeleteEndpoint`, `sagemaker:DeleteEndpointConfig`, `sagemaker:DeleteInferenceComponent`, `codebuild:DeleteProject`, `iam:DeleteRole`, `iam:DeleteRolePolicy` |
+| `./do/stage` | `s3:PutObject`, `s3:GetObject`, `s3:ListBucket` on mlcc-* buckets |
+| `./do/deploy` | `sagemaker:CreateEndpointConfig`, `sagemaker:CreateEndpoint`, `sagemaker:CreateModel`, `sagemaker:CreateInferenceComponent`, `sagemaker:DescribeEndpoint`, `iam:PassRole` |
+| `./do/add-ic` | `sagemaker:CreateInferenceComponent`, `sagemaker:DescribeEndpoint`, `sagemaker:ListInferenceComponents`, `iam:PassRole` |
 | `./do/test` | `sagemaker-runtime:InvokeEndpoint` |
-| `bootstrap` | `cloudformation:*`, `iam:CreateRole`, `iam:PutRolePolicy`, `iam:TagRole`, `ecr:CreateRepository`, `s3:CreateBucket` (and `sts:GetCallerIdentity`) |
+| `./do/benchmark` | `sagemaker:CreateAIBenchmarkJob`, `sagemaker:DescribeAIBenchmarkJob`, `sagemaker:ListAIBenchmarkJobs`, `sagemaker:CreateAIWorkloadConfig`, `iam:PassRole`, `s3:GetObject` |
+| `./do/train` | `sagemaker:CreateTrainingJob`, `sagemaker:DescribeTrainingJob`, `iam:PassRole`, `s3:GetObject`, `s3:PutObject` |
+| `./do/tune` | `sagemaker:CreateTrainingJob`, `sagemaker:DescribeTrainingJob`, `iam:PassRole`, `s3:GetObject`, `s3:PutObject` |
+| `./do/adapter` | `sagemaker:CreateInferenceComponent`, `sagemaker:UpdateInferenceComponent`, `sagemaker:DescribeInferenceComponent`, `s3:GetObject` |
+| `./do/optimize` | `sagemaker:CreateModel`, `sagemaker:DescribeModel`, `s3:GetObject`, `s3:PutObject` |
+| `./do/register` | `sagemaker:CreateModelPackage`, `sagemaker:CreateModelPackageGroup`, `sagemaker:DescribeModelPackage` |
+| `./do/logs` | `logs:GetLogEvents`, `logs:FilterLogEvents`, `logs:DescribeLogStreams` |
+| `./do/status` | `sagemaker:DescribeEndpoint`, `sagemaker:DescribeInferenceComponent`, `sagemaker:ListInferenceComponents` |
+| `./do/clean` | `sagemaker:DeleteEndpoint`, `sagemaker:DeleteEndpointConfig`, `sagemaker:DeleteModel`, `sagemaker:DeleteInferenceComponent`, `codebuild:DeleteProject`, `iam:DeleteRole`, `iam:DeleteRolePolicy` |
+| `./do/export` | Local only — reads config files |
+| `./do/validate` | Local only — validates project structure |
+| `./do/manifest` | Local only — generates deployment manifest |
+| `bootstrap` | `cloudformation:*`, `iam:CreateRole`, `iam:PutRolePolicy`, `iam:TagRole`, `ecr:CreateRepository`, `s3:CreateBucket`, `sts:GetCallerIdentity` |
 <% if (framework === 'transformers' && hfToken) { %>
 ## HuggingFace Token Security

package/templates/do/.tune_helper.py CHANGED Viewed

@@ -1510,8 +1510,6 @@ def cmd_discover(args):
     Returns: {"models": [str], "count": int}
     """
-    import boto3
     region = args.region or os.environ.get('AWS_REGION', 'us-east-1')
     family = args.family or ""
@@ -1528,6 +1526,11 @@ def cmd_discover(args):
     if not prefix:
         _error_exit("No family or filter provided for discovery")
+    try:
+        import boto3
+    except ImportError:
+        _error_exit("Hub discovery failed: boto3 is not installed. Install with: pip install boto3")
     try:
         client = boto3.client("sagemaker", region_name=region)
         models = []