npm - @aws/ml-container-creator - Versions diffs - 0.3.0 → 0.4.0 - Mend

@aws/ml-container-creator 0.3.0 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (34) hide show

package/config/bootstrap-stack.json +86 -7
package/config/defaults.json +1 -1
package/package.json +3 -1
package/servers/instance-sizer/index.js +36 -2
package/servers/instance-sizer/lib/instance-ranker.js +114 -10
package/servers/instance-sizer/lib/quota-resolver.js +368 -0
package/servers/instance-sizer/package.json +2 -0
package/servers/lib/catalogs/instances.json +527 -12
package/servers/lib/catalogs/model-servers.json +15 -15
package/servers/lib/catalogs/model-sizes.json +27 -0
package/servers/lib/catalogs/models.json +71 -0
package/servers/lib/schemas/image-catalog.schema.json +9 -1
package/src/app.js +77 -2
package/src/lib/bootstrap-command-handler.js +96 -3
package/src/lib/cli-handler.js +2 -2
package/src/lib/config-manager.js +78 -1
package/src/lib/prompt-runner.js +96 -9
package/src/lib/prompts.js +66 -4
package/src/lib/schema-sync.js +31 -0
package/src/lib/template-manager.js +49 -1
package/src/lib/validate-runner.js +125 -2
package/templates/Dockerfile +10 -2
package/templates/code/cuda_compat.sh +22 -0
package/templates/code/serve +3 -0
package/templates/code/start_server.sh +3 -0
package/templates/diffusors/Dockerfile +2 -1
package/templates/diffusors/serve +3 -0
package/templates/do/README.md +33 -0
package/templates/do/benchmark +646 -0
package/templates/do/clean +86 -0
package/templates/do/config +26 -3
package/templates/do/deploy +6 -1
package/templates/do/register +8 -1
package/templates/triton/Dockerfile +5 -0

package/templates/do/clean CHANGED Viewed

@@ -740,6 +740,49 @@ case "${CLEANUP_TARGET}" in
     codebuild)
         clean_codebuild
         ;;
+<% if (typeof includeBenchmark !== 'undefined' && includeBenchmark) { %>
+    benchmark)
+        echo "🧹 Cleaning benchmark resources..."
+        WORKLOAD_CONFIG_NAME="${PROJECT_NAME}-benchmark-config"
+        # Delete workload config if exists
+        if aws sagemaker describe-ai-workload-config \
+            --ai-workload-config-name "$WORKLOAD_CONFIG_NAME" \
+            --region "$AWS_REGION" 2>/dev/null; then
+            aws sagemaker delete-ai-workload-config \
+                --ai-workload-config-name "$WORKLOAD_CONFIG_NAME" \
+                --region "$AWS_REGION"
+            echo "   ✓ Deleted workload config: $WORKLOAD_CONFIG_NAME"
+        fi
+        # Delete terminal benchmark jobs matching project prefix
+        aws sagemaker list-ai-benchmark-jobs \
+            --name-contains "${PROJECT_NAME}-benchmark-" \
+            --region "$AWS_REGION" \
+            --query 'AIBenchmarkJobs[?AIBenchmarkJobStatus!=`InProgress`].AIBenchmarkJobName' \
+            --output text | tr '\t' '\n' | while read -r job; do
+            [ -z "$job" ] && continue
+            aws sagemaker delete-ai-benchmark-job \
+                --ai-benchmark-job-name "$job" \
+                --region "$AWS_REGION"
+            echo "   ✓ Deleted benchmark job: $job"
+        done
+        # Delete local benchmark results
+        if [ -d "${SCRIPT_DIR}/../benchmarks" ]; then
+            read -p "Delete local benchmark results? (Y/n) " CONFIRM_DELETE
+            CONFIRM_DELETE="${CONFIRM_DELETE:-Y}"
+            if [[ "${CONFIRM_DELETE}" =~ ^[Yy]$ ]]; then
+                rm -rf "${SCRIPT_DIR}/../benchmarks"
+                echo "   ✓ Deleted local benchmarks/ directory"
+            else
+                echo "   ⏭ Skipped local benchmarks/ deletion"
+            fi
+        fi
+        echo "✅ Benchmark cleanup complete"
+        ;;
+<% } %>
     all)
         echo "🧹 Performing complete cleanup"
         echo ""
@@ -790,6 +833,49 @@ case "${CLEANUP_TARGET}" in
             CLEANED_ITEMS+=("CodeBuild resources")
         fi
+<% if (typeof includeBenchmark !== 'undefined' && includeBenchmark) { %>
+        echo ""
+        # Clean benchmark resources
+        WORKLOAD_CONFIG_NAME="${PROJECT_NAME}-benchmark-config"
+        # Delete workload config if exists
+        if aws sagemaker describe-ai-workload-config \
+            --ai-workload-config-name "$WORKLOAD_CONFIG_NAME" \
+            --region "$AWS_REGION" 2>/dev/null; then
+            aws sagemaker delete-ai-workload-config \
+                --ai-workload-config-name "$WORKLOAD_CONFIG_NAME" \
+                --region "$AWS_REGION"
+            echo "   ✓ Deleted workload config: $WORKLOAD_CONFIG_NAME"
+        fi
+        # Delete terminal benchmark jobs matching project prefix
+        aws sagemaker list-ai-benchmark-jobs \
+            --name-contains "${PROJECT_NAME}-benchmark-" \
+            --region "$AWS_REGION" \
+            --query 'AIBenchmarkJobs[?AIBenchmarkJobStatus!=`InProgress`].AIBenchmarkJobName' \
+            --output text | tr '\t' '\n' | while read -r job; do
+            [ -z "$job" ] && continue
+            aws sagemaker delete-ai-benchmark-job \
+                --ai-benchmark-job-name "$job" \
+                --region "$AWS_REGION"
+            echo "   ✓ Deleted benchmark job: $job"
+        done
+        # Delete local benchmark results
+        if [ -d "${SCRIPT_DIR}/../benchmarks" ]; then
+            read -p "Delete local benchmark results? (Y/n) " CONFIRM_DELETE
+            CONFIRM_DELETE="${CONFIRM_DELETE:-Y}"
+            if [[ "${CONFIRM_DELETE}" =~ ^[Yy]$ ]]; then
+                rm -rf "${SCRIPT_DIR}/../benchmarks"
+                echo "   ✓ Deleted local benchmarks/ directory"
+            else
+                echo "   ⏭ Skipped local benchmarks/ deletion"
+            fi
+        fi
+        CLEANED_ITEMS+=("Benchmark resources")
+<% } %>
         # Display summary
         echo ""
         echo "✅ Cleanup complete!"

package/templates/do/config CHANGED Viewed

@@ -30,6 +30,9 @@ export INSTANCE_TYPE="<%= instanceType %>"
 <% if (inferenceAmiVersion) { %>
 export INFERENCE_AMI_VERSION="<%= inferenceAmiVersion %>"
 <% } %>
+<% if (typeof capacityReservationArn !== 'undefined' && capacityReservationArn) { %>
+export CAPACITY_RESERVATION_ARN="<%= capacityReservationArn %>"
+<% } %>
 <% } %>
 <% if (deploymentTarget === 'async-inference') { %>
@@ -126,6 +129,8 @@ export IC_MEMORY_SIZE="<%= icMemorySize %>"
 <% } %>
 <% if (typeof icGpuCount !== 'undefined' && icGpuCount != null) { %>
 export IC_GPU_COUNT="<%= icGpuCount %>"
+<% } else { %>
+export IC_GPU_COUNT="${IC_GPU_COUNT:-1}"
 <% } %>
 <% if (typeof icCopyCount !== 'undefined' && icCopyCount != null) { %>
 export IC_COPY_COUNT="<%= icCopyCount %>"
@@ -186,6 +191,26 @@ export MODEL_FORMAT="<%= modelFormat %>"
 export ROLE_ARN="<%= roleArn %>"
 <% } %>
+<% if (typeof includeBenchmark !== 'undefined' && includeBenchmark) { %>
+# SageMaker AI Benchmarking configuration
+export BENCHMARK_CONCURRENCY="<%= benchmarkConcurrency %>"
+export BENCHMARK_INPUT_TOKENS_MEAN="<%= benchmarkInputTokensMean %>"
+export BENCHMARK_OUTPUT_TOKENS_MEAN="<%= benchmarkOutputTokensMean %>"
+export BENCHMARK_STREAMING="<%= benchmarkStreaming %>"
+<% if (benchmarkRequestCount) { %>
+export BENCHMARK_REQUEST_COUNT="<%= benchmarkRequestCount %>"
+<% } else { %>
+export BENCHMARK_REQUEST_COUNT=""
+<% } %>
+<% if (benchmarkS3OutputPath) { %>
+export BENCHMARK_S3_OUTPUT_PATH="<%= benchmarkS3OutputPath %>"
+<% } else { %>
+export BENCHMARK_S3_OUTPUT_PATH="s3://ml-container-creator-benchmark-${AWS_REGION}-$(aws sts get-caller-identity --query Account --output text)/${PROJECT_NAME}/"
+<% } %>
+export BENCHMARK_JOB_NAME=""
+export BENCHMARK_WORKLOAD_CONFIG_NAME=""
+<% } %>
 <% if (orderedEnvVars && orderedEnvVars.length > 0) { %>
 # Runtime environment variables (from catalog)
 <% orderedEnvVars.forEach(({ key, value }) => { %>
@@ -193,9 +218,7 @@ export <%= key %>=${<%= key %>:-<%= value %>}
 <% }); %>
 <% } %>
-<% if (baseImage) { %>
-export BASE_IMAGE=${BASE_IMAGE:-<%= baseImage %>}
-<% } %>
+export BASE_IMAGE=${BASE_IMAGE:-<%= baseImage || '' %>}
 # Allow environment variable overrides
 export AWS_REGION=${AWS_REGION:-<%= awsRegion %>}

package/templates/do/deploy CHANGED Viewed

@@ -336,6 +336,11 @@ if [ -z "${SKIP_TO}" ]; then
         echo "   AMI version: ${INFERENCE_AMI_VERSION}"
     fi
+    if [ -n "${CAPACITY_RESERVATION_ARN:-}" ]; then
+        VARIANT_JSON="${VARIANT_JSON},\"CapacityReservationConfig\":{\"CapacityReservationPreference\":\"capacity-reservations-only\",\"MlReservationArn\":\"${CAPACITY_RESERVATION_ARN}\"}"
+        echo "   ⚠️  Capacity reservation (experimental): ${CAPACITY_RESERVATION_ARN}"
+    fi
     VARIANT_JSON="${VARIANT_JSON}}]"
     echo "⚙️  Creating endpoint configuration: ${ENDPOINT_CONFIG_NAME}"
@@ -453,7 +458,7 @@ if [ -z "${SKIP_TO}" ] || [ "${SKIP_TO}" = "create_ic" ] || [ "${SKIP_TO}" = "wa
                 \"ContainerStartupHealthCheckTimeoutInSeconds\": 900
             },
             \"ComputeResourceRequirements\": {
-                \"NumberOfAcceleratorDevicesRequired\": 1,
+                \"NumberOfAcceleratorDevicesRequired\": ${IC_GPU_COUNT},
                 \"MinMemoryRequiredInMb\": 1024
             }
         }" \

package/templates/do/register CHANGED Viewed

@@ -393,6 +393,7 @@ CJEOF
     # Try put-item with condition (new record)
     if aws dynamodb put-item \
+        --region "${AWS_REGION}" \
         --table-name "${CI_TABLE_NAME}" \
         --item "{
             \"configId\": {\"S\": \"${config_id}\"},
@@ -412,6 +413,7 @@ CJEOF
     else
         # Record already exists — update it (reset testStatus, update configJson, preserve createdAt)
         if aws dynamodb update-item \
+            --region "${AWS_REGION}" \
             --table-name "${CI_TABLE_NAME}" \
             --key "{\"configId\": {\"S\": \"${config_id}\"}}" \
             --update-expression "SET configJson = :cj, testStatus = :ts, deploymentConfig = :dc, baseImage = :bi, baseImageVersion = :bv, buildStrategy = :bs, projectName = :pn, schemaVersion = :sv" \
@@ -496,6 +498,11 @@ DJEOF
     echo "${DEPLOYMENT_JSON}" | python3 -c "import sys,json; print(json.dumps(json.load(sys.stdin), indent=2))" 2>/dev/null || echo "${DEPLOYMENT_JSON}"
     if [ "${CI_MODE}" = true ]; then
+        # Strip capacity reservation ARN for CI — force on-demand deployment
+        # CI projects must never use reserved capacity (reservations are account-specific
+        # and time-bound; CI replay should always target on-demand instances)
+        unset CAPACITY_RESERVATION_ARN 2>/dev/null || true
         echo ""
         echo "⚠️  CI Integration is experimental and currently only tested for"
         echo "   SageMaker Real-Time Inference endpoints."
@@ -507,7 +514,7 @@ DJEOF
         echo "🔑 configId: ${CONFIG_ID}"
         # Check if CI_Table exists before writing
-        if ! aws dynamodb describe-table --table-name "${CI_TABLE_NAME}" &>/dev/null; then
+        if ! aws dynamodb describe-table --table-name "${CI_TABLE_NAME}" --region "${AWS_REGION}" &>/dev/null; then
             echo ""
             echo "⚠️  CI infrastructure not provisioned. Run 'ml-container-creator bootstrap' with CI enabled."
             echo "   Skipping CI table write."

package/templates/triton/Dockerfile CHANGED Viewed

@@ -122,6 +122,11 @@ EXPOSE 8080
 # --http-port=8080: SageMaker requires port 8080
 # --model-repository: Path to model repository
 # --strict-model-config=false: Allow Triton to auto-complete config for some backends
+# CUDA compatibility: ensure compat libs are on LD_LIBRARY_PATH for newer SageMaker AMIs
+# (NVIDIA Container Toolkit 1.17.4+ no longer auto-mounts these)
+ENV LD_LIBRARY_PATH="/usr/local/cuda/compat:${LD_LIBRARY_PATH:-}"
 ENTRYPOINT ["tritonserver", \
             "--http-port=8080", \
             "--model-repository=/opt/ml/model/model_repository", \