npm - @aws/ml-container-creator - Versions diffs - 0.2.0 - Mend

@aws/ml-container-creator 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (143) hide show

package/LICENSE +202 -0
package/LICENSE-THIRD-PARTY +68620 -0
package/NOTICE +2 -0
package/README.md +106 -0
package/bin/cli.js +365 -0
package/config/defaults.json +32 -0
package/config/presets/transformers-djl.json +26 -0
package/config/presets/transformers-gpu.json +24 -0
package/config/presets/transformers-lmi.json +27 -0
package/package.json +129 -0
package/servers/README.md +419 -0
package/servers/base-image-picker/catalogs/model-servers.json +1191 -0
package/servers/base-image-picker/catalogs/python-slim.json +38 -0
package/servers/base-image-picker/catalogs/triton-backends.json +51 -0
package/servers/base-image-picker/catalogs/triton.json +38 -0
package/servers/base-image-picker/index.js +495 -0
package/servers/base-image-picker/manifest.json +17 -0
package/servers/base-image-picker/package.json +15 -0
package/servers/hyperpod-cluster-picker/LICENSE +202 -0
package/servers/hyperpod-cluster-picker/index.js +424 -0
package/servers/hyperpod-cluster-picker/manifest.json +14 -0
package/servers/hyperpod-cluster-picker/package.json +17 -0
package/servers/instance-recommender/LICENSE +202 -0
package/servers/instance-recommender/catalogs/instances.json +852 -0
package/servers/instance-recommender/index.js +284 -0
package/servers/instance-recommender/manifest.json +16 -0
package/servers/instance-recommender/package.json +15 -0
package/servers/lib/LICENSE +202 -0
package/servers/lib/bedrock-client.js +160 -0
package/servers/lib/custom-validators.js +46 -0
package/servers/lib/dynamic-resolver.js +36 -0
package/servers/lib/package.json +11 -0
package/servers/lib/schemas/image-catalog.schema.json +185 -0
package/servers/lib/schemas/instances.schema.json +124 -0
package/servers/lib/schemas/manifest.schema.json +64 -0
package/servers/lib/schemas/model-catalog.schema.json +91 -0
package/servers/lib/schemas/regions.schema.json +26 -0
package/servers/lib/schemas/triton-backends.schema.json +51 -0
package/servers/model-picker/catalogs/jumpstart-public.json +66 -0
package/servers/model-picker/catalogs/popular-diffusors.json +88 -0
package/servers/model-picker/catalogs/popular-transformers.json +226 -0
package/servers/model-picker/index.js +1693 -0
package/servers/model-picker/manifest.json +18 -0
package/servers/model-picker/package.json +20 -0
package/servers/region-picker/LICENSE +202 -0
package/servers/region-picker/catalogs/regions.json +263 -0
package/servers/region-picker/index.js +230 -0
package/servers/region-picker/manifest.json +16 -0
package/servers/region-picker/package.json +15 -0
package/src/app.js +1007 -0
package/src/copy-tpl.js +77 -0
package/src/lib/accelerator-validator.js +39 -0
package/src/lib/asset-manager.js +385 -0
package/src/lib/aws-profile-parser.js +181 -0
package/src/lib/bootstrap-command-handler.js +1647 -0
package/src/lib/bootstrap-config.js +238 -0
package/src/lib/ci-register-helpers.js +124 -0
package/src/lib/ci-report-helpers.js +158 -0
package/src/lib/ci-stage-helpers.js +268 -0
package/src/lib/cli-handler.js +529 -0
package/src/lib/comment-generator.js +544 -0
package/src/lib/community-reports-validator.js +91 -0
package/src/lib/config-manager.js +2106 -0
package/src/lib/configuration-exporter.js +204 -0
package/src/lib/configuration-manager.js +695 -0
package/src/lib/configuration-matcher.js +221 -0
package/src/lib/cpu-validator.js +36 -0
package/src/lib/cuda-validator.js +57 -0
package/src/lib/deployment-config-resolver.js +103 -0
package/src/lib/deployment-entry-schema.js +125 -0
package/src/lib/deployment-registry.js +598 -0
package/src/lib/docker-introspection-validator.js +51 -0
package/src/lib/engine-prefix-resolver.js +60 -0
package/src/lib/huggingface-client.js +172 -0
package/src/lib/key-value-parser.js +37 -0
package/src/lib/known-flags-validator.js +200 -0
package/src/lib/manifest-cli.js +280 -0
package/src/lib/mcp-client.js +303 -0
package/src/lib/mcp-command-handler.js +532 -0
package/src/lib/neuron-validator.js +80 -0
package/src/lib/parameter-schema-validator.js +284 -0
package/src/lib/prompt-runner.js +1349 -0
package/src/lib/prompts.js +1138 -0
package/src/lib/registry-command-handler.js +519 -0
package/src/lib/registry-loader.js +198 -0
package/src/lib/rocm-validator.js +80 -0
package/src/lib/schema-validator.js +157 -0
package/src/lib/sensitive-redactor.js +59 -0
package/src/lib/template-engine.js +156 -0
package/src/lib/template-manager.js +341 -0
package/src/lib/validation-engine.js +314 -0
package/src/prompt-adapter.js +63 -0
package/templates/Dockerfile +300 -0
package/templates/IAM_PERMISSIONS.md +84 -0
package/templates/MIGRATION.md +488 -0
package/templates/PROJECT_README.md +439 -0
package/templates/TEMPLATE_SYSTEM.md +243 -0
package/templates/buildspec.yml +64 -0
package/templates/code/chat_template.jinja +1 -0
package/templates/code/flask/gunicorn_config.py +35 -0
package/templates/code/flask/wsgi.py +10 -0
package/templates/code/model_handler.py +387 -0
package/templates/code/serve +300 -0
package/templates/code/serve.py +175 -0
package/templates/code/serving.properties +105 -0
package/templates/code/start_server.py +39 -0
package/templates/code/start_server.sh +39 -0
package/templates/diffusors/Dockerfile +72 -0
package/templates/diffusors/patch_image_api.py +35 -0
package/templates/diffusors/serve +115 -0
package/templates/diffusors/start_server.sh +114 -0
package/templates/do/.gitkeep +1 -0
package/templates/do/README.md +541 -0
package/templates/do/build +83 -0
package/templates/do/ci +681 -0
package/templates/do/clean +811 -0
package/templates/do/config +260 -0
package/templates/do/deploy +1560 -0
package/templates/do/export +306 -0
package/templates/do/logs +319 -0
package/templates/do/manifest +12 -0
package/templates/do/push +119 -0
package/templates/do/register +580 -0
package/templates/do/run +113 -0
package/templates/do/submit +417 -0
package/templates/do/test +1147 -0
package/templates/hyperpod/configmap.yaml +24 -0
package/templates/hyperpod/deployment.yaml +71 -0
package/templates/hyperpod/pvc.yaml +42 -0
package/templates/hyperpod/service.yaml +17 -0
package/templates/nginx-diffusors.conf +74 -0
package/templates/nginx-predictors.conf +47 -0
package/templates/nginx-tensorrt.conf +74 -0
package/templates/requirements.txt +61 -0
package/templates/sample_model/test_inference.py +123 -0
package/templates/sample_model/train_abalone.py +252 -0
package/templates/test/test_endpoint.sh +79 -0
package/templates/test/test_local_image.sh +80 -0
package/templates/test/test_model_handler.py +180 -0
package/templates/triton/Dockerfile +128 -0
package/templates/triton/config.pbtxt +163 -0
package/templates/triton/model.py +130 -0
package/templates/triton/requirements.txt +11 -0

package/servers/model-picker/catalogs/jumpstart-public.json ADDED Viewed

@@ -0,0 +1,66 @@
+{
+    "jumpstart://huggingface-llm-falcon-7b": {
+        "modelId": "jumpstart://huggingface-llm-falcon-7b",
+        "family": "falcon",
+        "framework": "huggingface",
+        "provider": "jumpstart",
+        "tags": ["text-generation", "llm"],
+        "description": "Falcon 7B via JumpStart"
+    },
+    "jumpstart://huggingface-llm-falcon-40b": {
+        "modelId": "jumpstart://huggingface-llm-falcon-40b",
+        "family": "falcon",
+        "framework": "huggingface",
+        "provider": "jumpstart",
+        "tags": ["text-generation", "llm"],
+        "description": "Falcon 40B via JumpStart"
+    },
+    "jumpstart://meta-textgeneration-llama-2-7b": {
+        "modelId": "jumpstart://meta-textgeneration-llama-2-7b",
+        "family": "llama-2",
+        "framework": "huggingface",
+        "provider": "jumpstart",
+        "tags": ["text-generation", "llm", "llama-2"],
+        "description": "Llama 2 7B via JumpStart"
+    },
+    "jumpstart://meta-textgeneration-llama-2-13b": {
+        "modelId": "jumpstart://meta-textgeneration-llama-2-13b",
+        "family": "llama-2",
+        "framework": "huggingface",
+        "provider": "jumpstart",
+        "tags": ["text-generation", "llm", "llama-2"],
+        "description": "Llama 2 13B via JumpStart"
+    },
+    "jumpstart://meta-textgeneration-llama-2-70b": {
+        "modelId": "jumpstart://meta-textgeneration-llama-2-70b",
+        "family": "llama-2",
+        "framework": "huggingface",
+        "provider": "jumpstart",
+        "tags": ["text-generation", "llm", "llama-2"],
+        "description": "Llama 2 70B via JumpStart"
+    },
+    "jumpstart://model-txt2img-stabilityai-stable-diffusion-v2-1-base": {
+        "modelId": "jumpstart://model-txt2img-stabilityai-stable-diffusion-v2-1-base",
+        "family": "stable-diffusion",
+        "framework": "huggingface",
+        "provider": "jumpstart",
+        "tags": ["image-generation", "diffusion", "stable-diffusion"],
+        "description": "Stable Diffusion v2.1 Base via JumpStart"
+    },
+    "jumpstart://huggingface-text2text-flan-t5-xl": {
+        "modelId": "jumpstart://huggingface-text2text-flan-t5-xl",
+        "family": "flan-t5",
+        "framework": "huggingface",
+        "provider": "jumpstart",
+        "tags": ["text-generation", "text2text", "flan-t5"],
+        "description": "Flan-T5 XL via JumpStart"
+    },
+    "jumpstart://huggingface-textembedding-gpt-j-6b": {
+        "modelId": "jumpstart://huggingface-textembedding-gpt-j-6b",
+        "family": "gpt-j",
+        "framework": "huggingface",
+        "provider": "jumpstart",
+        "tags": ["text-embedding", "gpt-j"],
+        "description": "GPT-J 6B Embedding via JumpStart"
+    }
+}

package/servers/model-picker/catalogs/popular-diffusors.json ADDED Viewed

@@ -0,0 +1,88 @@
+{
+    "stabilityai/stable-diffusion-3.5-medium": {
+        "family": "stable-diffusion-3",
+        "chat_template": null,
+        "gated": false,
+        "tags": ["image-generation", "diffusion", "stable-diffusion"],
+        "architecture": "StableDiffusion3Pipeline",
+        "framework_compatibility": {
+            "vllm-omni": ">=0.14.0"
+        },
+        "validation_level": "experimental",
+        "profiles": {
+            "default": {
+                "displayName": "SD3.5 Medium",
+                "envVars": {},
+                "recommendedInstanceTypes": ["ml.g5.2xlarge", "ml.g5.4xlarge"]
+            }
+        },
+        "notes": "Stable Diffusion 3.5 medium model. Supported natively by vLLM-Omni StableDiffusion3Pipeline."
+    },
+    "black-forest-labs/FLUX.1-dev": {
+        "family": "flux",
+        "chat_template": null,
+        "gated": true,
+        "tags": ["image-generation", "diffusion", "flux"],
+        "architecture": "FluxPipeline",
+        "framework_compatibility": {
+            "vllm-omni": ">=0.14.0"
+        },
+        "validation_level": "experimental",
+        "profiles": {
+            "default": {
+                "displayName": "FLUX.1 Dev",
+                "envVars": {},
+                "recommendedInstanceTypes": ["ml.g5.4xlarge", "ml.g5.12xlarge"]
+            }
+        },
+        "notes": "FLUX.1-dev high-quality generation model. Uses dual text encoders (CLIP + T5) and FlowMatchEuler scheduler. Requires significant VRAM."
+    },
+    "black-forest-labs/FLUX.1-schnell": {
+        "family": "flux",
+        "chat_template": null,
+        "gated": false,
+        "tags": ["image-generation", "diffusion", "flux"],
+        "architecture": "FluxPipeline",
+        "framework_compatibility": {
+            "vllm-omni": ">=0.14.0"
+        },
+        "validation_level": "experimental",
+        "notes": "FLUX.1-schnell fast generation model. Fewer denoising steps for faster inference at slightly lower quality"
+    },
+    "Wan-AI/Wan2.1-T2V-14B-Diffusers": {
+        "family": "wan",
+        "chat_template": null,
+        "gated": false,
+        "tags": ["video-generation", "diffusion", "wan"],
+        "architecture": "WanPipeline",
+        "framework_compatibility": {
+            "vllm-omni": ">=0.16.0"
+        },
+        "validation_level": "experimental",
+        "notes": "Wan2.1 text-to-video 14B model (diffusers format). Requires multi-GPU instance (ml.g5.12xlarge or larger). Must use the -Diffusers variant — the base Wan2.1-T2V-14B repo lacks model_index.json required by vLLM-Omni"
+    },
+    "stabilityai/stable-diffusion-*": {
+        "family": "stable-diffusion",
+        "chat_template": null,
+        "gated": false,
+        "tags": ["image-generation", "diffusion", "stable-diffusion"],
+        "architecture": null,
+        "framework_compatibility": {
+            "vllm-omni": ">=0.14.0"
+        },
+        "validation_level": "experimental",
+        "notes": "Fallback for Stable Diffusion variants not explicitly listed"
+    },
+    "black-forest-labs/FLUX*": {
+        "family": "flux",
+        "chat_template": null,
+        "gated": false,
+        "tags": ["image-generation", "diffusion", "flux"],
+        "architecture": null,
+        "framework_compatibility": {
+            "vllm-omni": ">=0.14.0"
+        },
+        "validation_level": "experimental",
+        "notes": "Fallback for FLUX model variants not explicitly listed"
+    }
+}

package/servers/model-picker/catalogs/popular-transformers.json ADDED Viewed

@@ -0,0 +1,226 @@
+{
+    "openai/gpt-oss-20b": {
+        "family": "gpt-oss",
+        "chat_template": "",
+        "gated": false,
+        "tags": ["text-generation", "openai", "conversational"],
+        "architecture": "GPT2LMHeadModel",
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0",
+            "sglang": ">=0.2.0"
+        },
+        "validation_level": "community-validated",
+        "notes": "Open-source 20B parameter model. Requires significant GPU memory for inference"
+    },
+    "meta-llama/Llama-2-7b-chat-hf": {
+        "family": "llama-2",
+        "chat_template": "{% for message in messages %}{% if message['role'] == 'system' %}{{ '[INST] <<SYS>>\\n' + message['content'] + '\\n<</SYS>>\\n\\n' }}{% elif message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ ' ' + message['content'] + ' ' }}{% endif %}{% endfor %}",
+        "gated": true,
+        "tags": ["text-generation", "llama-2", "conversational"],
+        "architecture": "LlamaForCausalLM",
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0",
+            "sglang": ">=0.2.0"
+        },
+        "validation_level": "tested",
+        "profiles": {
+            "7b": {
+                "displayName": "Llama-2 7B",
+                "envVars": {
+                    "MAX_MODEL_LEN": "4096",
+                    "GPU_MEMORY_UTILIZATION": "0.9"
+                },
+                "recommendedInstanceTypes": ["ml.g5.xlarge", "ml.g5.2xlarge"]
+            }
+        },
+        "notes": "Llama-2 7B chat model with official chat template. Requires HuggingFace authentication for download"
+    },
+    "meta-llama/Llama-2-13b-chat-hf": {
+        "family": "llama-2",
+        "chat_template": "{% for message in messages %}{% if message['role'] == 'system' %}{{ '[INST] <<SYS>>\\n' + message['content'] + '\\n<</SYS>>\\n\\n' }}{% elif message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ ' ' + message['content'] + ' ' }}{% endif %}{% endfor %}",
+        "gated": true,
+        "tags": ["text-generation", "llama-2", "conversational"],
+        "architecture": "LlamaForCausalLM",
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0",
+            "sglang": ">=0.2.0"
+        },
+        "validation_level": "tested",
+        "profiles": {
+            "13b": {
+                "displayName": "Llama-2 13B",
+                "envVars": {
+                    "MAX_MODEL_LEN": "4096",
+                    "GPU_MEMORY_UTILIZATION": "0.9"
+                },
+                "recommendedInstanceTypes": ["ml.g5.2xlarge", "ml.g5.4xlarge"]
+            }
+        },
+        "notes": "Llama-2 13B chat model. Requires more GPU memory than 7B variant"
+    },
+    "meta-llama/Llama-2-70b-chat-hf": {
+        "family": "llama-2",
+        "chat_template": "{% for message in messages %}{% if message['role'] == 'system' %}{{ '[INST] <<SYS>>\\n' + message['content'] + '\\n<</SYS>>\\n\\n' }}{% elif message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ ' ' + message['content'] + ' ' }}{% endif %}{% endfor %}",
+        "gated": true,
+        "tags": ["text-generation", "llama-2", "conversational"],
+        "architecture": "LlamaForCausalLM",
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0",
+            "sglang": ">=0.2.0"
+        },
+        "validation_level": "community-validated",
+        "profiles": {
+            "70b-tp2": {
+                "displayName": "Llama-2 70B (2-GPU)",
+                "envVars": {
+                    "TENSOR_PARALLEL_SIZE": "2",
+                    "MAX_MODEL_LEN": "4096",
+                    "GPU_MEMORY_UTILIZATION": "0.95"
+                },
+                "recommendedInstanceTypes": ["ml.g5.12xlarge"]
+            },
+            "70b-tp4": {
+                "displayName": "Llama-2 70B (4-GPU)",
+                "envVars": {
+                    "TENSOR_PARALLEL_SIZE": "4",
+                    "MAX_MODEL_LEN": "4096",
+                    "GPU_MEMORY_UTILIZATION": "0.9"
+                },
+                "recommendedInstanceTypes": ["ml.g5.12xlarge", "ml.g5.48xlarge"]
+            }
+        },
+        "notes": "Llama-2 70B requires tensor parallelism across multiple GPUs"
+    },
+    "mistralai/Mistral-7B-Instruct-v0.1": {
+        "family": "mistral",
+        "chat_template": "{{ bos_token }}{% for message in messages %}{% if message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ message['content'] + eos_token }}{% endif %}{% endfor %}",
+        "gated": false,
+        "tags": ["text-generation", "mistral", "conversational"],
+        "architecture": "MistralForCausalLM",
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0",
+            "sglang": ">=0.2.0"
+        },
+        "validation_level": "tested",
+        "profiles": {
+            "7b": {
+                "displayName": "Mistral 7B Instruct",
+                "envVars": {
+                    "MAX_MODEL_LEN": "8192",
+                    "GPU_MEMORY_UTILIZATION": "0.9"
+                },
+                "recommendedInstanceTypes": ["ml.g5.xlarge", "ml.g5.2xlarge"]
+            }
+        },
+        "notes": "Mistral 7B v0.1 with 8K context window"
+    },
+    "mistralai/Mistral-7B-Instruct-v0.2": {
+        "family": "mistral",
+        "chat_template": "{{ bos_token }}{% for message in messages %}{% if message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ message['content'] + eos_token }}{% endif %}{% endfor %}",
+        "gated": false,
+        "tags": ["text-generation", "mistral", "conversational"],
+        "architecture": "MistralForCausalLM",
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0",
+            "sglang": ">=0.2.0"
+        },
+        "validation_level": "tested",
+        "profiles": {
+            "7b": {
+                "displayName": "Mistral 7B Instruct v0.2",
+                "envVars": {
+                    "MAX_MODEL_LEN": "32768",
+                    "GPU_MEMORY_UTILIZATION": "0.9"
+                },
+                "recommendedInstanceTypes": ["ml.g5.2xlarge", "ml.g5.4xlarge"]
+            }
+        },
+        "notes": "Mistral 7B v0.2 with extended 32K context window. Requires more memory for long contexts"
+    },
+    "mistralai/Mixtral-8x7B-Instruct-v0.1": {
+        "family": "mistral",
+        "chat_template": "{{ bos_token }}{% for message in messages %}{% if message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ message['content'] + eos_token }}{% endif %}{% endfor %}",
+        "gated": false,
+        "tags": ["text-generation", "mistral", "mixture-of-experts"],
+        "architecture": "MixtralForCausalLM",
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0",
+            "sglang": ">=0.2.0"
+        },
+        "validation_level": "community-validated",
+        "profiles": {
+            "8x7b-tp2": {
+                "displayName": "Mixtral 8x7B (2-GPU)",
+                "envVars": {
+                    "TENSOR_PARALLEL_SIZE": "2",
+                    "MAX_MODEL_LEN": "32768",
+                    "GPU_MEMORY_UTILIZATION": "0.95"
+                },
+                "recommendedInstanceTypes": ["ml.g5.12xlarge"]
+            }
+        },
+        "notes": "Mixtral 8x7B MoE model. Requires tensor parallelism for efficient inference"
+    },
+    "meta-llama/Llama-2-*": {
+        "family": "llama-2",
+        "chat_template": "{% for message in messages %}{% if message['role'] == 'system' %}{{ '[INST] <<SYS>>\\n' + message['content'] + '\\n<</SYS>>\\n\\n' }}{% elif message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ ' ' + message['content'] + ' ' }}{% endif %}{% endfor %}",
+        "gated": true,
+        "tags": ["text-generation", "llama-2"],
+        "architecture": null,
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0",
+            "sglang": ">=0.2.0"
+        },
+        "validation_level": "experimental",
+        "notes": "Fallback configuration for Llama-2 models not explicitly listed. Uses standard Llama-2 chat template"
+    },
+    "mistralai/Mistral-*": {
+        "family": "mistral",
+        "chat_template": "{{ bos_token }}{% for message in messages %}{% if message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ message['content'] + eos_token }}{% endif %}{% endfor %}",
+        "gated": false,
+        "tags": ["text-generation", "mistral"],
+        "architecture": null,
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0",
+            "sglang": ">=0.2.0"
+        },
+        "validation_level": "experimental",
+        "notes": "Fallback configuration for Mistral models not explicitly listed. Uses standard Mistral chat template"
+    },
+    "codellama/*": {
+        "family": "codellama",
+        "chat_template": "{% for message in messages %}{% if message['role'] == 'system' %}{{ '[INST] <<SYS>>\\n' + message['content'] + '\\n<</SYS>>\\n\\n' }}{% elif message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ ' ' + message['content'] + ' ' }}{% endif %}{% endfor %}",
+        "gated": false,
+        "tags": ["text-generation", "code", "codellama"],
+        "architecture": null,
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0"
+        },
+        "validation_level": "experimental",
+        "notes": "CodeLlama models use Llama-2 chat template. Optimized for code generation"
+    },
+    "tiiuae/falcon-*": {
+        "family": "falcon",
+        "chat_template": null,
+        "gated": false,
+        "tags": ["text-generation", "falcon"],
+        "architecture": null,
+        "framework_compatibility": {
+            "vllm": ">=0.3.0",
+            "tensorrt-llm": ">=0.8.0"
+        },
+        "validation_level": "experimental",
+        "notes": "Falcon models typically don't require chat templates for instruction following"
+    }
+}