npm - @aws/ml-container-creator - Versions diffs - 0.2.0 - Mend

@aws/ml-container-creator 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (143) hide show

package/LICENSE +202 -0
package/LICENSE-THIRD-PARTY +68620 -0
package/NOTICE +2 -0
package/README.md +106 -0
package/bin/cli.js +365 -0
package/config/defaults.json +32 -0
package/config/presets/transformers-djl.json +26 -0
package/config/presets/transformers-gpu.json +24 -0
package/config/presets/transformers-lmi.json +27 -0
package/package.json +129 -0
package/servers/README.md +419 -0
package/servers/base-image-picker/catalogs/model-servers.json +1191 -0
package/servers/base-image-picker/catalogs/python-slim.json +38 -0
package/servers/base-image-picker/catalogs/triton-backends.json +51 -0
package/servers/base-image-picker/catalogs/triton.json +38 -0
package/servers/base-image-picker/index.js +495 -0
package/servers/base-image-picker/manifest.json +17 -0
package/servers/base-image-picker/package.json +15 -0
package/servers/hyperpod-cluster-picker/LICENSE +202 -0
package/servers/hyperpod-cluster-picker/index.js +424 -0
package/servers/hyperpod-cluster-picker/manifest.json +14 -0
package/servers/hyperpod-cluster-picker/package.json +17 -0
package/servers/instance-recommender/LICENSE +202 -0
package/servers/instance-recommender/catalogs/instances.json +852 -0
package/servers/instance-recommender/index.js +284 -0
package/servers/instance-recommender/manifest.json +16 -0
package/servers/instance-recommender/package.json +15 -0
package/servers/lib/LICENSE +202 -0
package/servers/lib/bedrock-client.js +160 -0
package/servers/lib/custom-validators.js +46 -0
package/servers/lib/dynamic-resolver.js +36 -0
package/servers/lib/package.json +11 -0
package/servers/lib/schemas/image-catalog.schema.json +185 -0
package/servers/lib/schemas/instances.schema.json +124 -0
package/servers/lib/schemas/manifest.schema.json +64 -0
package/servers/lib/schemas/model-catalog.schema.json +91 -0
package/servers/lib/schemas/regions.schema.json +26 -0
package/servers/lib/schemas/triton-backends.schema.json +51 -0
package/servers/model-picker/catalogs/jumpstart-public.json +66 -0
package/servers/model-picker/catalogs/popular-diffusors.json +88 -0
package/servers/model-picker/catalogs/popular-transformers.json +226 -0
package/servers/model-picker/index.js +1693 -0
package/servers/model-picker/manifest.json +18 -0
package/servers/model-picker/package.json +20 -0
package/servers/region-picker/LICENSE +202 -0
package/servers/region-picker/catalogs/regions.json +263 -0
package/servers/region-picker/index.js +230 -0
package/servers/region-picker/manifest.json +16 -0
package/servers/region-picker/package.json +15 -0
package/src/app.js +1007 -0
package/src/copy-tpl.js +77 -0
package/src/lib/accelerator-validator.js +39 -0
package/src/lib/asset-manager.js +385 -0
package/src/lib/aws-profile-parser.js +181 -0
package/src/lib/bootstrap-command-handler.js +1647 -0
package/src/lib/bootstrap-config.js +238 -0
package/src/lib/ci-register-helpers.js +124 -0
package/src/lib/ci-report-helpers.js +158 -0
package/src/lib/ci-stage-helpers.js +268 -0
package/src/lib/cli-handler.js +529 -0
package/src/lib/comment-generator.js +544 -0
package/src/lib/community-reports-validator.js +91 -0
package/src/lib/config-manager.js +2106 -0
package/src/lib/configuration-exporter.js +204 -0
package/src/lib/configuration-manager.js +695 -0
package/src/lib/configuration-matcher.js +221 -0
package/src/lib/cpu-validator.js +36 -0
package/src/lib/cuda-validator.js +57 -0
package/src/lib/deployment-config-resolver.js +103 -0
package/src/lib/deployment-entry-schema.js +125 -0
package/src/lib/deployment-registry.js +598 -0
package/src/lib/docker-introspection-validator.js +51 -0
package/src/lib/engine-prefix-resolver.js +60 -0
package/src/lib/huggingface-client.js +172 -0
package/src/lib/key-value-parser.js +37 -0
package/src/lib/known-flags-validator.js +200 -0
package/src/lib/manifest-cli.js +280 -0
package/src/lib/mcp-client.js +303 -0
package/src/lib/mcp-command-handler.js +532 -0
package/src/lib/neuron-validator.js +80 -0
package/src/lib/parameter-schema-validator.js +284 -0
package/src/lib/prompt-runner.js +1349 -0
package/src/lib/prompts.js +1138 -0
package/src/lib/registry-command-handler.js +519 -0
package/src/lib/registry-loader.js +198 -0
package/src/lib/rocm-validator.js +80 -0
package/src/lib/schema-validator.js +157 -0
package/src/lib/sensitive-redactor.js +59 -0
package/src/lib/template-engine.js +156 -0
package/src/lib/template-manager.js +341 -0
package/src/lib/validation-engine.js +314 -0
package/src/prompt-adapter.js +63 -0
package/templates/Dockerfile +300 -0
package/templates/IAM_PERMISSIONS.md +84 -0
package/templates/MIGRATION.md +488 -0
package/templates/PROJECT_README.md +439 -0
package/templates/TEMPLATE_SYSTEM.md +243 -0
package/templates/buildspec.yml +64 -0
package/templates/code/chat_template.jinja +1 -0
package/templates/code/flask/gunicorn_config.py +35 -0
package/templates/code/flask/wsgi.py +10 -0
package/templates/code/model_handler.py +387 -0
package/templates/code/serve +300 -0
package/templates/code/serve.py +175 -0
package/templates/code/serving.properties +105 -0
package/templates/code/start_server.py +39 -0
package/templates/code/start_server.sh +39 -0
package/templates/diffusors/Dockerfile +72 -0
package/templates/diffusors/patch_image_api.py +35 -0
package/templates/diffusors/serve +115 -0
package/templates/diffusors/start_server.sh +114 -0
package/templates/do/.gitkeep +1 -0
package/templates/do/README.md +541 -0
package/templates/do/build +83 -0
package/templates/do/ci +681 -0
package/templates/do/clean +811 -0
package/templates/do/config +260 -0
package/templates/do/deploy +1560 -0
package/templates/do/export +306 -0
package/templates/do/logs +319 -0
package/templates/do/manifest +12 -0
package/templates/do/push +119 -0
package/templates/do/register +580 -0
package/templates/do/run +113 -0
package/templates/do/submit +417 -0
package/templates/do/test +1147 -0
package/templates/hyperpod/configmap.yaml +24 -0
package/templates/hyperpod/deployment.yaml +71 -0
package/templates/hyperpod/pvc.yaml +42 -0
package/templates/hyperpod/service.yaml +17 -0
package/templates/nginx-diffusors.conf +74 -0
package/templates/nginx-predictors.conf +47 -0
package/templates/nginx-tensorrt.conf +74 -0
package/templates/requirements.txt +61 -0
package/templates/sample_model/test_inference.py +123 -0
package/templates/sample_model/train_abalone.py +252 -0
package/templates/test/test_endpoint.sh +79 -0
package/templates/test/test_local_image.sh +80 -0
package/templates/test/test_model_handler.py +180 -0
package/templates/triton/Dockerfile +128 -0
package/templates/triton/config.pbtxt +163 -0
package/templates/triton/model.py +130 -0
package/templates/triton/requirements.txt +11 -0

package/templates/do/export ADDED Viewed

@@ -0,0 +1,306 @@
+#!/bin/bash
+# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
+# SPDX-License-Identifier: Apache-2.0
+# Export current configuration as a CLI command or JSON object
+# Usage: ./do/export [--json]
+# Source configuration (suppress the summary output)
+SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
+source "${SCRIPT_DIR}/config" > /dev/null 2>&1
+# ── JSON output mode ─────────────────────────────────────────────────────────
+if [ "${1:-}" = "--json" ]; then
+    # Build a JSON object with all configuration parameters.
+    # Uses ConfigManager camelCase keys so the output can be fed directly
+    # back into the generator via --config=<file>.
+    JSON="{"
+    JSON="${JSON}\"projectName\":\"${PROJECT_NAME}\""
+    # Use deploymentConfig if available (bundles framework + model server)
+    if [ -n "${DEPLOYMENT_CONFIG:-}" ]; then
+        JSON="${JSON},\"deploymentConfig\":\"${DEPLOYMENT_CONFIG}\""
+    fi
+    # Model format (traditional ML only)
+    if [ -n "${MODEL_FORMAT:-}" ]; then
+        JSON="${JSON},\"modelFormat\":\"${MODEL_FORMAT}\""
+    fi
+    # Model name (transformers only)
+    if [ -n "${MODEL_NAME:-}" ]; then
+        JSON="${JSON},\"modelName\":\"${MODEL_NAME}\""
+    fi
+    # Build configuration
+    JSON="${JSON},\"buildTarget\":\"${BUILD_TARGET}\""
+    if [ "${BUILD_TARGET}" = "codebuild" ] && [ -n "${CODEBUILD_COMPUTE_TYPE:-}" ]; then
+        JSON="${JSON},\"codebuildComputeType\":\"${CODEBUILD_COMPUTE_TYPE}\""
+    fi
+    # Deployment target
+    JSON="${JSON},\"deploymentTarget\":\"${DEPLOYMENT_TARGET}\""
+<% if (deploymentTarget === 'managed-inference') { %>
+    # SageMaker Managed Inference
+    JSON="${JSON},\"instanceType\":\"${INSTANCE_TYPE}\""
+<% } else if (deploymentTarget === 'async-inference') { %>
+    # SageMaker Async Inference
+    JSON="${JSON},\"instanceType\":\"${INSTANCE_TYPE}\""
+    if [ -n "${ASYNC_S3_OUTPUT_PATH:-}" ]; then
+        JSON="${JSON},\"asyncS3OutputPath\":\"${ASYNC_S3_OUTPUT_PATH}\""
+    fi
+    if [ -n "${ASYNC_SNS_SUCCESS_TOPIC:-}" ]; then
+        JSON="${JSON},\"asyncSnsSuccessTopic\":\"${ASYNC_SNS_SUCCESS_TOPIC}\""
+    fi
+    if [ -n "${ASYNC_SNS_ERROR_TOPIC:-}" ]; then
+        JSON="${JSON},\"asyncSnsErrorTopic\":\"${ASYNC_SNS_ERROR_TOPIC}\""
+    fi
+    if [ "${ASYNC_MAX_CONCURRENT_INVOCATIONS:-1}" != "1" ]; then
+        JSON="${JSON},\"asyncMaxConcurrentInvocations\":${ASYNC_MAX_CONCURRENT_INVOCATIONS}"
+    fi
+<% } else if (deploymentTarget === 'batch-transform') { %>
+    # SageMaker Batch Transform
+    JSON="${JSON},\"instanceType\":\"${INSTANCE_TYPE}\""
+    JSON="${JSON},\"batchInputPath\":\"${BATCH_INPUT_PATH}\""
+    JSON="${JSON},\"batchOutputPath\":\"${BATCH_OUTPUT_PATH}\""
+    JSON="${JSON},\"batchInstanceCount\":${BATCH_INSTANCE_COUNT}"
+    JSON="${JSON},\"batchSplitType\":\"${BATCH_SPLIT_TYPE}\""
+    JSON="${JSON},\"batchStrategy\":\"${BATCH_STRATEGY}\""
+    if [ "${BATCH_JOIN_SOURCE:-None}" != "None" ]; then
+        JSON="${JSON},\"batchJoinSource\":\"${BATCH_JOIN_SOURCE}\""
+    fi
+    if [ "${BATCH_MAX_CONCURRENT_TRANSFORMS:-1}" != "1" ]; then
+        JSON="${JSON},\"batchMaxConcurrentTransforms\":${BATCH_MAX_CONCURRENT_TRANSFORMS}"
+    fi
+    if [ "${BATCH_MAX_PAYLOAD_IN_MB:-6}" != "6" ]; then
+        JSON="${JSON},\"batchMaxPayloadInMB\":${BATCH_MAX_PAYLOAD_IN_MB}"
+    fi
+<% } else if (deploymentTarget === 'hyperpod-eks') { %>
+    # HyperPod EKS
+    JSON="${JSON},\"hyperPodCluster\":\"${HYPERPOD_CLUSTER_NAME}\""
+    if [ "${HYPERPOD_NAMESPACE}" != "default" ]; then
+        JSON="${JSON},\"hyperPodNamespace\":\"${HYPERPOD_NAMESPACE}\""
+    fi
+    if [ "${HYPERPOD_REPLICAS}" != "1" ]; then
+        JSON="${JSON},\"hyperPodReplicas\":${HYPERPOD_REPLICAS}"
+    fi
+<% if (fsxVolumeHandle) { %>
+    JSON="${JSON},\"fsxVolumeHandle\":\"${FSX_VOLUME_HANDLE}\""
+<% } %>
+<% } %>
+    # AWS region
+    JSON="${JSON},\"awsRegion\":\"${AWS_REGION}\""
+    # Role ARN
+    if [ -n "${ROLE_ARN:-}" ]; then
+        JSON="${JSON},\"awsRoleArn\":\"${ROLE_ARN}\""
+    fi
+    # HuggingFace token — reference env var, don't leak the actual value
+    if [ -n "${HF_TOKEN:-}" ]; then
+        JSON="${JSON},\"hfToken\":\"\$HF_TOKEN\""
+    fi
+    # Endpoint configuration (non-default values only)
+<%
+var epParts = [];
+if (endpointInitialInstanceCount != null && endpointInitialInstanceCount !== 1) {
+    epParts.push('"initialInstanceCount":' + endpointInitialInstanceCount);
+}
+if (endpointDataCapturePercent != null && endpointDataCapturePercent !== 0) {
+    epParts.push('"dataCapturePercent":' + endpointDataCapturePercent);
+}
+if (endpointVariantName != null && endpointVariantName !== 'AllTraffic') {
+    epParts.push('"variantName":"' + endpointVariantName + '"');
+}
+if (endpointVolumeSize != null) {
+    epParts.push('"volumeSize":' + endpointVolumeSize);
+}
+%>
+<% if (epParts.length > 0) { %>
+    JSON="${JSON},\"endpointConfig\":{<%- epParts.join(',') %>}"
+<% } %>
+    # IC configuration (non-default values only)
+<%
+var icParts = [];
+if (icCpuCount != null) {
+    icParts.push('"cpuCount":' + icCpuCount);
+}
+if (icMemorySize != null) {
+    icParts.push('"memorySize":' + icMemorySize);
+}
+if (icGpuCount != null) {
+    icParts.push('"gpuCount":' + icGpuCount);
+}
+if (icCopyCount != null && icCopyCount !== 1) {
+    icParts.push('"copyCount":' + icCopyCount);
+}
+if (icModelWeight != null && icModelWeight !== 1.0) {
+    icParts.push('"modelWeight":' + icModelWeight);
+}
+%>
+<% if (icParts.length > 0) { %>
+    JSON="${JSON},\"icConfig\":{<%- icParts.join(',') %>}"
+<% } %>
+    # Model environment variables
+<% if (modelEnvVars && Object.keys(modelEnvVars).length > 0) { %>
+<%
+var mParts = Object.entries(modelEnvVars).map(function(entry) {
+    return '"' + entry[0] + '":"' + entry[1] + '"';
+});
+%>
+    JSON="${JSON},\"modelEnvVars\":{<%- mParts.join(',') %>}"
+<% } %>
+    # Server environment variables
+<% if (serverEnvVars && Object.keys(serverEnvVars).length > 0) { %>
+<%
+var sParts = Object.entries(serverEnvVars).map(function(entry) {
+    return '"' + entry[0] + '":"' + entry[1] + '"';
+});
+%>
+    JSON="${JSON},\"serverEnvVars\":{<%- sParts.join(',') %>}"
+<% } %>
+    JSON="${JSON}}"
+    echo "${JSON}"
+    exit 0
+fi
+# ── CLI command output mode (default) ────────────────────────────────────────
+# Build the command
+CMD="ml-container-creator"
+CMD="${CMD} --project-name=${PROJECT_NAME}"
+# Use deployment-config if available (bundles framework + model server)
+if [ -n "${DEPLOYMENT_CONFIG:-}" ]; then
+    CMD="${CMD} --deployment-config=${DEPLOYMENT_CONFIG}"
+else
+    CMD="${CMD} --framework=${FRAMEWORK}"
+    CMD="${CMD} --model-server=${MODEL_SERVER}"
+fi
+# Model format (traditional ML only)
+if [ -n "${MODEL_FORMAT:-}" ]; then
+    CMD="${CMD} --model-format=${MODEL_FORMAT}"
+fi
+# Model name (transformers only)
+if [ -n "${MODEL_NAME:-}" ]; then
+    CMD="${CMD} --model-name=${MODEL_NAME}"
+fi
+# Build configuration
+CMD="${CMD} --build-target=${BUILD_TARGET}"
+if [ "${BUILD_TARGET}" = "codebuild" ] && [ -n "${CODEBUILD_COMPUTE_TYPE:-}" ]; then
+    CMD="${CMD} --codebuild-compute-type=${CODEBUILD_COMPUTE_TYPE}"
+fi
+# Deployment target
+CMD="${CMD} --deployment-target=${DEPLOYMENT_TARGET}"
+<% if (deploymentTarget === 'managed-inference') { %>
+# SageMaker Managed Inference
+CMD="${CMD} --instance-type=${INSTANCE_TYPE}"
+<% } else if (deploymentTarget === 'batch-transform') { %>
+# SageMaker Managed Inference - Batch
+CMD="${CMD} --instance-type=${INSTANCE_TYPE}"
+CMD="${CMD} --batch-input-path=${BATCH_INPUT_PATH}"
+CMD="${CMD} --batch-output-path=${BATCH_OUTPUT_PATH}"
+CMD="${CMD} --batch-instance-count=${BATCH_INSTANCE_COUNT}"
+CMD="${CMD} --batch-split-type=${BATCH_SPLIT_TYPE}"
+CMD="${CMD} --batch-strategy=${BATCH_STRATEGY}"
+if [ "${BATCH_JOIN_SOURCE:-None}" != "None" ]; then
+    CMD="${CMD} --batch-join-source=${BATCH_JOIN_SOURCE}"
+fi
+if [ "${BATCH_MAX_CONCURRENT_TRANSFORMS:-1}" != "1" ]; then
+    CMD="${CMD} --batch-max-concurrent=${BATCH_MAX_CONCURRENT_TRANSFORMS}"
+fi
+if [ "${BATCH_MAX_PAYLOAD_IN_MB:-6}" != "6" ]; then
+    CMD="${CMD} --batch-max-payload=${BATCH_MAX_PAYLOAD_IN_MB}"
+fi
+<% } else if (deploymentTarget === 'hyperpod-eks') { %>
+# HyperPod EKS
+CMD="${CMD} --hyperpod-cluster=${HYPERPOD_CLUSTER_NAME}"
+if [ "${HYPERPOD_NAMESPACE}" != "default" ]; then
+    CMD="${CMD} --hyperpod-namespace=${HYPERPOD_NAMESPACE}"
+fi
+if [ "${HYPERPOD_REPLICAS}" != "1" ]; then
+    CMD="${CMD} --hyperpod-replicas=${HYPERPOD_REPLICAS}"
+fi
+<% if (fsxVolumeHandle) { %>
+CMD="${CMD} --fsx-volume-handle=${FSX_VOLUME_HANDLE}"
+<% } %>
+<% } %>
+# AWS region
+CMD="${CMD} --region=${AWS_REGION}"
+# Role ARN
+if [ -n "${ROLE_ARN:-}" ]; then
+    CMD="${CMD} --role-arn=${ROLE_ARN}"
+fi
+# HuggingFace token — reference env var, don't leak the actual value
+if [ -n "${HF_TOKEN:-}" ]; then
+    CMD="${CMD} --hf-token=\$HF_TOKEN"
+fi
+# Endpoint configuration (non-default values only)
+<% if (endpointInitialInstanceCount != null && endpointInitialInstanceCount !== 1) { %>
+CMD="${CMD} --endpoint-initial-instance-count=<%= endpointInitialInstanceCount %>"
+<% } %>
+<% if (endpointDataCapturePercent != null && endpointDataCapturePercent !== 0) { %>
+CMD="${CMD} --endpoint-data-capture-percent=<%= endpointDataCapturePercent %>"
+<% } %>
+<% if (endpointVariantName != null && endpointVariantName !== 'AllTraffic') { %>
+CMD="${CMD} --endpoint-variant-name=<%= endpointVariantName %>"
+<% } %>
+<% if (endpointVolumeSize != null) { %>
+CMD="${CMD} --endpoint-volume-size=<%= endpointVolumeSize %>"
+<% } %>
+# IC configuration (non-default values only)
+<% if (icCpuCount != null) { %>
+CMD="${CMD} --ic-cpu-count=<%= icCpuCount %>"
+<% } %>
+<% if (icMemorySize != null) { %>
+CMD="${CMD} --ic-memory-size=<%= icMemorySize %>"
+<% } %>
+<% if (icGpuCount != null) { %>
+CMD="${CMD} --ic-gpu-count=<%= icGpuCount %>"
+<% } %>
+<% if (icCopyCount != null && icCopyCount !== 1) { %>
+CMD="${CMD} --ic-copy-count=<%= icCopyCount %>"
+<% } %>
+<% if (icModelWeight != null && icModelWeight !== 1.0) { %>
+CMD="${CMD} --ic-model-weight=<%= icModelWeight %>"
+<% } %>
+# Model environment variables
+<% if (modelEnvVars && Object.keys(modelEnvVars).length > 0) { %>
+<% Object.entries(modelEnvVars).forEach(([key, value]) => { %>
+CMD="${CMD} --model-env=<%= key %>=<%= value %>"
+<% }); %>
+<% } %>
+# Server environment variables
+<% if (serverEnvVars && Object.keys(serverEnvVars).length > 0) { %>
+<% Object.entries(serverEnvVars).forEach(([key, value]) => { %>
+CMD="${CMD} --server-env=<%= key %>=<%= value %>"
+<% }); %>
+<% } %>
+CMD="${CMD} --skip-prompts"
+echo ""
+echo "# Reproduce this project with a single command:"
+echo "${CMD}"
+echo ""

package/templates/do/logs ADDED Viewed

@@ -0,0 +1,319 @@
+#!/bin/bash
+# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
+# SPDX-License-Identifier: Apache-2.0
+set -e
+set -u
+set -o pipefail
+# Source configuration
+SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
+source "${SCRIPT_DIR}/config"
+<% if (deploymentTarget === 'managed-inference') { %>
+# ============================================================
+# SageMaker Managed Inference Logs (CloudWatch)
+# ============================================================
+# Allow inference component name as argument or from config
+IC_NAME="${1:-${INFERENCE_COMPONENT_NAME:-}}"
+ENDPOINT="${ENDPOINT_NAME:-}"
+if [ -z "${IC_NAME}" ] && [ -z "${ENDPOINT}" ]; then
+    echo "❌ No inference component or endpoint name provided"
+    echo ""
+    echo "Usage:"
+    echo "  ./do/logs <inference-component-name>"
+    echo "  ./do/logs                  # uses INFERENCE_COMPONENT_NAME from do/config"
+    echo ""
+    echo "Run ./do/deploy first to set INFERENCE_COMPONENT_NAME automatically."
+    exit 1
+fi
+# Inference component logs live under the endpoint log group
+# but in log streams named after the inference component
+if [ -z "${ENDPOINT}" ]; then
+    echo "⚠️  ENDPOINT_NAME not set in config — cannot determine log group"
+    echo "   Run ./do/deploy first, or set ENDPOINT_NAME in do/config"
+    exit 1
+fi
+LOG_GROUP="/aws/sagemaker/InferenceComponents/${IC_NAME}"
+echo "📋 Tailing logs for inference component: ${IC_NAME}"
+echo "   Endpoint: ${ENDPOINT}"
+echo "   Log group: ${LOG_GROUP}"
+echo "   Region: ${AWS_REGION}"
+echo ""
+echo "   Press Ctrl+C to stop"
+echo ""
+echo "━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━"
+echo ""
+# Wait for log group to exist before tailing
+MAX_WAIT=300
+INTERVAL=10
+ELAPSED=0
+while true; do
+    if aws logs describe-log-groups \
+        --log-group-name-prefix "${LOG_GROUP}" \
+        --region "${AWS_REGION}" \
+        --query "logGroups[?logGroupName=='${LOG_GROUP}'].logGroupName" \
+        --output text 2>/dev/null | grep -q "${LOG_GROUP}"; then
+        break
+    fi
+    if [ "${ELAPSED}" -ge "${MAX_WAIT}" ]; then
+        echo "❌ Timed out after ${MAX_WAIT}s waiting for log group: ${LOG_GROUP}"
+        echo ""
+        echo "   The inference component may have failed to start."
+        echo "   Check the endpoint log group for errors:"
+        echo "   aws logs tail /aws/sagemaker/Endpoints/${ENDPOINT} --follow --region ${AWS_REGION}"
+        exit 1
+    fi
+    if [ "${ELAPSED}" -eq 0 ]; then
+        echo "⏳ Log group not found yet: ${LOG_GROUP}"
+        echo "   The inference component may still be starting up. Waiting up to ${MAX_WAIT}s..."
+        echo ""
+    fi
+    sleep "${INTERVAL}"
+    ELAPSED=$((ELAPSED + INTERVAL))
+    echo "   Waiting for log group... (${ELAPSED}s/${MAX_WAIT}s)"
+done
+echo "✅ Log group found. Tailing logs..."
+echo ""
+# Tail logs
+aws logs tail "${LOG_GROUP}" \
+    --region "${AWS_REGION}" \
+    --follow \
+    --format short
+<% } else if (deploymentTarget === 'async-inference') { %>
+# ============================================================
+# SageMaker Managed Inference - Async Logs (CloudWatch)
+# ============================================================
+ENDPOINT="${1:-${ENDPOINT_NAME:-}}"
+if [ -z "${ENDPOINT}" ]; then
+    echo "❌ No endpoint name provided"
+    echo ""
+    echo "Usage:"
+    echo "  ./do/logs <endpoint-name>"
+    echo "  ./do/logs                  # uses ENDPOINT_NAME from do/config"
+    echo ""
+    echo "Run ./do/deploy first to set ENDPOINT_NAME automatically."
+    exit 1
+fi
+LOG_GROUP="/aws/sagemaker/Endpoints/${ENDPOINT}"
+echo "📋 Tailing logs for async inference endpoint: ${ENDPOINT}"
+echo "   Log group: ${LOG_GROUP}"
+echo "   Region: ${AWS_REGION}"
+echo ""
+echo "   Press Ctrl+C to stop"
+echo ""
+echo "━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━"
+echo ""
+# Wait for log group to exist before tailing
+MAX_WAIT=300
+INTERVAL=10
+ELAPSED=0
+while true; do
+    if aws logs describe-log-groups \
+        --log-group-name-prefix "${LOG_GROUP}" \
+        --region "${AWS_REGION}" \
+        --query "logGroups[?logGroupName=='${LOG_GROUP}'].logGroupName" \
+        --output text 2>/dev/null | grep -q "${LOG_GROUP}"; then
+        break
+    fi
+    if [ "${ELAPSED}" -ge "${MAX_WAIT}" ]; then
+        echo "❌ Timed out after ${MAX_WAIT}s waiting for log group: ${LOG_GROUP}"
+        echo ""
+        echo "   The endpoint may have failed to start."
+        echo "   Check the SageMaker console for endpoint status."
+        exit 1
+    fi
+    if [ "${ELAPSED}" -eq 0 ]; then
+        echo "⏳ Log group not found yet: ${LOG_GROUP}"
+        echo "   The endpoint may still be starting up. Waiting up to ${MAX_WAIT}s..."
+        echo ""
+    fi
+    sleep "${INTERVAL}"
+    ELAPSED=$((ELAPSED + INTERVAL))
+    echo "   Waiting for log group... (${ELAPSED}s/${MAX_WAIT}s)"
+done
+echo "✅ Log group found. Tailing logs..."
+echo ""
+# Tail logs
+aws logs tail "${LOG_GROUP}" \
+    --region "${AWS_REGION}" \
+    --follow \
+    --format short
+<% } else if (deploymentTarget === 'batch-transform') { %>
+# ============================================================
+# SageMaker Managed Inference - Batch Logs (CloudWatch)
+# ============================================================
+# Allow transform job name as argument or from config
+JOB_NAME="${1:-${TRANSFORM_JOB_NAME:-}}"
+if [ -z "${JOB_NAME}" ]; then
+    echo "❌ No transform job name provided"
+    echo ""
+    echo "Usage:"
+    echo "  ./do/logs <transform-job-name>"
+    echo "  ./do/logs                  # uses TRANSFORM_JOB_NAME from do/config"
+    echo ""
+    echo "Run ./do/deploy first to set TRANSFORM_JOB_NAME automatically."
+    exit 1
+fi
+LOG_GROUP="/aws/sagemaker/TransformJobs"
+echo "📋 Tailing logs for batch transform job: ${JOB_NAME}"
+echo "   Log group: ${LOG_GROUP}"
+echo "   Region: ${AWS_REGION}"
+echo ""
+echo "   Press Ctrl+C to stop"
+echo ""
+echo "━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━"
+echo ""
+# Wait for log group to exist before tailing
+MAX_WAIT=300
+INTERVAL=10
+ELAPSED=0
+while true; do
+    if aws logs describe-log-groups \
+        --log-group-name-prefix "${LOG_GROUP}" \
+        --region "${AWS_REGION}" \
+        --query "logGroups[?logGroupName=='${LOG_GROUP}'].logGroupName" \
+        --output text 2>/dev/null | grep -q "${LOG_GROUP}"; then
+        break
+    fi
+    if [ "${ELAPSED}" -ge "${MAX_WAIT}" ]; then
+        echo "❌ Timed out after ${MAX_WAIT}s waiting for log group: ${LOG_GROUP}"
+        echo ""
+        echo "   The transform job may not have started logging yet."
+        echo "   Check the job status:"
+        echo "   aws sagemaker describe-transform-job --transform-job-name ${JOB_NAME} --region ${AWS_REGION}"
+        exit 1
+    fi
+    if [ "${ELAPSED}" -eq 0 ]; then
+        echo "⏳ Log group not found yet: ${LOG_GROUP}"
+        echo "   The transform job may still be starting up. Waiting up to ${MAX_WAIT}s..."
+        echo ""
+    fi
+    sleep "${INTERVAL}"
+    ELAPSED=$((ELAPSED + INTERVAL))
+    echo "   Waiting for log group... (${ELAPSED}s/${MAX_WAIT}s)"
+done
+echo "✅ Log group found. Tailing logs..."
+echo ""
+# Tail logs, filtering by transform job name
+aws logs tail "${LOG_GROUP}" \
+    --region "${AWS_REGION}" \
+    --log-stream-name-prefix "${JOB_NAME}" \
+    --follow \
+    --format short
+<% } else if (deploymentTarget === 'hyperpod-eks') { %>
+# ============================================================
+# HyperPod EKS Logs (kubectl)
+# ============================================================
+# Allow pod selector as argument, default to app label
+POD_SELECTOR="${1:-app=${PROJECT_NAME}}"
+echo "📋 Tailing logs for HyperPod EKS deployment"
+echo "   Cluster: ${HYPERPOD_CLUSTER_NAME}"
+echo "   Namespace: ${HYPERPOD_NAMESPACE}"
+echo "   Selector: ${POD_SELECTOR}"
+echo "   Region: ${AWS_REGION}"
+echo ""
+# Get kubeconfig for HyperPod cluster
+echo "🔑 Configuring kubectl for HyperPod cluster..."
+KUBECONFIG_PATH="${HOME}/.kube/hyperpod-${HYPERPOD_CLUSTER_NAME}"
+EKS_CLUSTER_ARN=$(aws sagemaker describe-cluster \
+    --cluster-name "${HYPERPOD_CLUSTER_NAME}" \
+    --region "${AWS_REGION}" \
+    --query "Orchestrator.Eks.ClusterArn" \
+    --output text 2>&1) || {
+    echo "❌ Failed to describe HyperPod cluster: ${HYPERPOD_CLUSTER_NAME}"
+    echo ""
+    echo "   Check that:"
+    echo "   • The cluster name is correct"
+    echo "   • The cluster exists in region: ${AWS_REGION}"
+    echo "   • Your IAM user/role has permission to access the cluster"
+    exit 4
+}
+EKS_CLUSTER_NAME=$(echo "${EKS_CLUSTER_ARN}" | awk -F'/' '{print $NF}')
+if ! aws eks update-kubeconfig \
+    --name "${EKS_CLUSTER_NAME}" \
+    --region "${AWS_REGION}" \
+    --kubeconfig "${KUBECONFIG_PATH}" 2>&1; then
+    echo "❌ Failed to configure kubectl for EKS cluster: ${EKS_CLUSTER_NAME}"
+    exit 4
+fi
+export KUBECONFIG="${KUBECONFIG_PATH}"
+# Verify cluster connectivity
+if ! kubectl cluster-info &> /dev/null; then
+    echo "❌ Cannot connect to HyperPod cluster"
+    echo ""
+    echo "   Check that:"
+    echo "   • The cluster is in 'InService' status"
+    echo "   • Your network can reach the cluster API server"
+    exit 4
+fi
+# Check if any pods match the selector
+POD_COUNT=$(kubectl get pods -n "${HYPERPOD_NAMESPACE}" -l "${POD_SELECTOR}" --no-headers 2>/dev/null | wc -l || echo "0")
+if [ "${POD_COUNT}" -eq 0 ]; then
+    echo "⚠️  No pods found matching selector: ${POD_SELECTOR}"
+    echo "   Namespace: ${HYPERPOD_NAMESPACE}"
+    echo ""
+    echo "   Run ./do/deploy first to create the deployment."
+    echo ""
+    echo "   To list all pods in the namespace:"
+    echo "   kubectl get pods -n ${HYPERPOD_NAMESPACE}"
+    exit 1
+fi
+echo "   Found ${POD_COUNT} pod(s) matching selector"
+echo ""
+echo "   Press Ctrl+C to stop"
+echo ""
+echo "━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━"
+echo ""
+# Tail logs from all matching pods
+kubectl logs -f -l "${POD_SELECTOR}" -n "${HYPERPOD_NAMESPACE}" --all-containers --prefix
+<% } %>

package/templates/do/manifest ADDED Viewed

@@ -0,0 +1,12 @@
+#!/bin/bash
+# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
+# SPDX-License-Identifier: Apache-2.0
+# Asset manifest helper — records and queries deployed resources
+# Usage:
+#   ./do/manifest add --type <resourceType> --id <resourceId> --project <projectName> [--meta <json>]
+#   ./do/manifest delete --id <resourceId>
+#   ./do/manifest list [--project <project>] [--status <status>] [--type <type>]
+SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
+node "${SCRIPT_DIR}/lib/manifest-cli.js" "$@"