PyPI - xpk - Versions diffs - 0.14.0__py3-none-any.whl → 0.14.2__py3-none-any.whl - Mend

xpk 0.14.0py3-none-any.whl → 0.14.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (41) hide show

integration/__init__.py +15 -0
integration/docker_manager_test.py +102 -0
integration/gcluster_a3mega_test.py +204 -0
integration/gcluster_a3ultra_test.py +176 -0
integration/gcluster_a4_test.py +176 -0
integration/gcluster_test.py +107 -0
xpk/commands/cluster.py +17 -4
xpk/commands/cluster_gcluster.py +4 -0
xpk/commands/cluster_test.py +92 -0
xpk/commands/common.py +6 -0
xpk/commands/kind.py +1 -0
xpk/commands/workload.py +41 -7
xpk/commands/workload_test.py +81 -0
xpk/core/blueprint/testing/__init__.py +15 -0
xpk/core/cluster.py +1 -1
xpk/core/config.py +1 -1
xpk/core/kueue_manager.py +62 -22
xpk/core/kueue_manager_test.py +53 -21
xpk/core/system_characteristics.py +16 -4
xpk/core/system_characteristics_test.py +73 -0
xpk/templates/cluster_preheat.yaml.j2 +31 -0
xpk/templates/filestore-pv.yaml +17 -0
xpk/templates/filestore-pvc.yaml +11 -0
xpk/templates/filestore-sc.yaml +10 -0
xpk/templates/fuse-pv.yaml +17 -0
xpk/templates/fuse-pvc.yaml +13 -0
xpk/templates/kueue_config.yaml.j2 +95 -0
xpk/templates/kueue_gke_default_topology.yaml.j2 +10 -0
xpk/templates/kueue_sub_slicing_topology.yaml.j2 +14 -0
xpk/templates/mtc-cpc.yaml +15 -0
xpk/templates/volume_bundle.yaml +7 -0
xpk/utils/templates.py +14 -1
xpk/utils/topology.py +9 -0
xpk/utils/topology_test.py +21 -1
{xpk-0.14.0.dist-info → xpk-0.14.2.dist-info}/METADATA +1 -1
{xpk-0.14.0.dist-info → xpk-0.14.2.dist-info}/RECORD +40 -19
xpk-0.14.2.dist-info/top_level.txt +2 -0
xpk-0.14.0.dist-info/top_level.txt +0 -1
{xpk-0.14.0.dist-info → xpk-0.14.2.dist-info}/WHEEL +0 -0
{xpk-0.14.0.dist-info → xpk-0.14.2.dist-info}/entry_points.txt +0 -0
{xpk-0.14.0.dist-info → xpk-0.14.2.dist-info}/licenses/LICENSE +0 -0

xpk/core/kueue_manager.py CHANGED Viewed

@@ -39,17 +39,19 @@ from ..core.commands import (
 )
 from ..utils.file import write_tmp_file
 from ..utils.console import xpk_print, xpk_exit
-from ..utils.templates import TEMPLATE_PATH
+from ..utils.templates import TEMPLATE_PATH, get_templates_absolute_path
 WAIT_FOR_KUEUE_TIMEOUT = "10m"
 CLUSTER_QUEUE_NAME = "cluster-queue"
 LOCAL_QUEUE_NAME = "multislice-queue"
+SUB_SLICE_TOPOLOGY_NAME = "sub-slice-topology"
 KUEUE_CONFIG_JINJA_FILE = "kueue_config.yaml.j2"
-KUEUE_TOPOLOGY_JINJA_FILE = "kueue_topology.yaml.j2"
+KUEUE_GKE_DEFAULT_TOPOLOGY_JINJA_FILE = "kueue_gke_default_topology.yaml.j2"
 KUEUE_CONTROLLER_MANAGER_JINJA_FILE = "kueue_controller_manager.yaml.j2"
+KUEUE_SUB_SLICING_TOPOLOGY_JINJA_FILE = "kueue_sub_slicing_topology.yaml.j2"
 MEMORY_SIZE_PER_VM = 1.2
 MIN_MEMORY_LIMIT_SIZE = 4096
-KUEUE_VERSION = "v0.14.1"
+KUEUE_VERSION = "v0.12.2"
 @dataclass
@@ -58,12 +60,19 @@ class KueueConfig:
   total_chips: int
   cpu_limit: int
   memory_limit: str
+  configure_sub_slicing: bool
   is_pathways_cluster: bool = False
   autoprovisioning_enabled: bool = False
   flex: bool = False
   num_slices: int = 1
+@dataclass
+class _NameAndYaml:
+  name: str
+  yaml: str
 class KueueManager:
   """Manages the installation and configuration of Kueue on an XPK cluster."""
@@ -73,7 +82,12 @@ class KueueManager:
       template_path=TEMPLATE_PATH,
   ):
     self.kueue_version = kueue_version
-    self.template_env = Environment(loader=FileSystemLoader(template_path))
+    self.template_env = Environment(
+        loader=FileSystemLoader(
+            searchpath=get_templates_absolute_path(template_path)
+        )
+    )
   def install_or_upgrade(
       self,
@@ -87,7 +101,7 @@ class KueueManager:
     Args:
         tolerations: An optional list of tolerations to apply to the kueue-controller-manager.
     """
-    return_code, installed_version = self.__get_installed_kueue_version()
+    return_code, installed_version = self.get_installed_kueue_version()
     if return_code == 0:
       if installed_version and installed_version > self.kueue_version:
@@ -107,7 +121,7 @@ class KueueManager:
     return self.__configure(kueue_config)
-  def __get_installed_kueue_version(self) -> tuple[int, str | None]:
+  def get_installed_kueue_version(self) -> tuple[int, str | None]:
     command = (
         "kubectl get deployment kueue-controller-manager -n kueue-system -o"
         " jsonpath='{.spec.template.spec.containers[0].image}'"
@@ -117,7 +131,7 @@ class KueueManager:
         command,
         task,
         dry_run_return_val="""
-        v0.14.1""",
+        v0.12.1""",
     )
     if return_code != 0:
       return return_code, None
@@ -208,6 +222,13 @@ class KueueManager:
     """
     template = self.template_env.get_template(KUEUE_CONFIG_JINJA_FILE)
+    topology_name_and_yaml = self.__get_topology_name_and_yaml(
+        kueue_config.system, kueue_config.configure_sub_slicing
+    )
+    topology_name = (
+        topology_name_and_yaml.name if topology_name_and_yaml else None
+    )
     # The manager builds the context internally based on its opinionated logic
     context = self.__build_template_context(
         system=kueue_config.system,
@@ -218,18 +239,16 @@ class KueueManager:
         num_slices=kueue_config.num_slices,
         cpu_limit=kueue_config.cpu_limit,
         memory_limit=kueue_config.memory_limit,
+        topology_name=topology_name,
     )
-    rendered_manifest = template.render(context)
+    config_yaml = template.render(context)
+    yamls = [config_yaml]
-    if kueue_config.system.device_type in [
-        H100_MEGA_DEVICE_TYPE,
-        H200_DEVICE_TYPE,
-        B200_DEVICE_TYPE,
-    ]:
-      topology_yaml = self.template_env.get_template(KUEUE_TOPOLOGY_JINJA_FILE)
-      rendered_manifest = topology_yaml.render() + rendered_manifest
+    if topology_name_and_yaml:
+      yamls.append(topology_name_and_yaml.yaml)
+    rendered_manifest = "\n---\n".join(yamls)
     return_code = self.__apply_manifest(rendered_manifest)
     if return_code != 0:
       return return_code
@@ -246,6 +265,7 @@ class KueueManager:
       num_slices: int,
       cpu_limit: int,
       memory_limit: str,
+      topology_name: str | None,
   ) -> Dict[str, Any]:
     """Prepares the context for the Jinja2 template."""
     # Main accelerator flavor
@@ -267,13 +287,7 @@ class KueueManager:
       key, value = machine_label.split(":", 1)
       node_labels_dict[key] = value.strip()
-    topology_label = ""
-    if system.device_type in [
-        H100_MEGA_DEVICE_TYPE,
-        H200_DEVICE_TYPE,
-        B200_DEVICE_TYPE,
-    ]:
-      topology_label = 'topologyName: "gke-default"'
+    topology_label = f"topologyName: {topology_name}" if topology_name else ""
     flavors = [{
         "name": main_flavor_name,
@@ -335,6 +349,32 @@ class KueueManager:
         "admission_checks": admission_checks,
     }
+  def __get_topology_name_and_yaml(
+      self, system: SystemCharacteristics, configure_sub_slicing: bool
+  ) -> _NameAndYaml | None:
+    if system.device_type in [
+        H100_MEGA_DEVICE_TYPE,
+        H200_DEVICE_TYPE,
+        B200_DEVICE_TYPE,
+    ]:
+      return _NameAndYaml(
+          name="gke-default",
+          yaml=self.template_env.get_template(
+              KUEUE_GKE_DEFAULT_TOPOLOGY_JINJA_FILE
+          ).render(),
+      )
+    elif configure_sub_slicing:
+      return _NameAndYaml(
+          name=SUB_SLICE_TOPOLOGY_NAME,
+          yaml=self.template_env.get_template(
+              KUEUE_SUB_SLICING_TOPOLOGY_JINJA_FILE
+          ).render({
+              "sub_slice_topology_name": SUB_SLICE_TOPOLOGY_NAME,
+          }),
+      )
+    else:
+      return None
   def __apply_manifest(self, manifest: str) -> int:
     task = "Applying Kueue Custom Resources"
     if is_dry_run():

xpk/core/kueue_manager_test.py CHANGED Viewed

@@ -76,16 +76,14 @@ class KueueManagerTest(unittest.TestCase):
       mock_install.assert_called_once()
       mock_configure.assert_called_once()
-  @patch(
-      "xpk.core.kueue_manager.KueueManager._KueueManager__get_installed_kueue_version"
-  )
+  @patch("xpk.core.kueue_manager.KueueManager.get_installed_kueue_version")
   @patch("xpk.core.kueue_manager.KueueManager._KueueManager__install")
   @patch("xpk.core.kueue_manager.KueueManager._KueueManager__configure")
   def test_install_or_upgrade_when_newer_version_already_installed(
       self, mock_configure, mock_install, mock_get_version
   ):
     """Test install_or_upgrade when Kueue is already up to date."""
-    mock_get_version.return_value = (0, "v0.99.9")
+    mock_get_version.return_value = (0, "v0.12.3")
     kueue_config = MagicMock(spec=KueueConfig)
     result = self.kueue_manager.install_or_upgrade(kueue_config)
@@ -95,9 +93,7 @@ class KueueManagerTest(unittest.TestCase):
     mock_install.assert_not_called()
     mock_configure.assert_not_called()
-  @patch(
-      "xpk.core.kueue_manager.KueueManager._KueueManager__get_installed_kueue_version"
-  )
+  @patch("xpk.core.kueue_manager.KueueManager.get_installed_kueue_version")
   def test_install_or_upgrade_when_outdated(
       self,
       mock_get_version,
@@ -121,9 +117,7 @@ class KueueManagerTest(unittest.TestCase):
     mock_install.assert_called_once()
     mock_configure.assert_called_once()
-  @patch(
-      "xpk.core.kueue_manager.KueueManager._KueueManager__get_installed_kueue_version"
-  )
+  @patch("xpk.core.kueue_manager.KueueManager.get_installed_kueue_version")
   def test_install_or_upgrade_when_not_installed(
       self,
       mock_get_version,
@@ -155,7 +149,7 @@ class KueueManagerTest(unittest.TestCase):
             return_value=0,
         ) as mock_run_retry,
         patch(
-            "xpk.core.kueue_manager.KueueManager._KueueManager__get_installed_kueue_version",
+            "xpk.core.kueue_manager.KueueManager.get_installed_kueue_version",
             return_value=(1, None),
         ),
         patch(
@@ -199,7 +193,7 @@ class KueueManagerTest(unittest.TestCase):
             return_value=0,
         ) as mock_run_retry,
         patch(
-            "xpk.core.kueue_manager.KueueManager._KueueManager__get_installed_kueue_version",
+            "xpk.core.kueue_manager.KueueManager.get_installed_kueue_version",
             return_value=(1, None),
         ),
         patch(
@@ -224,9 +218,7 @@ class KueueManagerTest(unittest.TestCase):
       self.assertEqual(result, 0)
       self.assertEqual(mock_run_retry.call_count, 0)
-  @patch(
-      "xpk.core.kueue_manager.KueueManager._KueueManager__get_installed_kueue_version"
-  )
+  @patch("xpk.core.kueue_manager.KueueManager.get_installed_kueue_version")
   @patch("xpk.core.kueue_manager.KueueManager._KueueManager__apply_manifest")
   def test_configuration_updates_resources(
       self, mock_apply_manifest, mock_get_version
@@ -240,6 +232,7 @@ class KueueManagerTest(unittest.TestCase):
         total_chips=8,
         cpu_limit=100,
         memory_limit="100Gi",
+        configure_sub_slicing=False,
     )
     with (
@@ -265,6 +258,7 @@ class KueueManagerTest(unittest.TestCase):
         total_chips=8,
         cpu_limit=100,
         memory_limit="100Gi",
+        configure_sub_slicing=False,
     )
     with (
@@ -274,7 +268,7 @@ class KueueManagerTest(unittest.TestCase):
         ),
         patch.object(
             self.kueue_manager,
-            "_KueueManager__get_installed_kueue_version",
+            "get_installed_kueue_version",
             return_value=(1, None),
         ),
         patch.object(
@@ -307,6 +301,7 @@ class KueueManagerTest(unittest.TestCase):
         total_chips=8,
         cpu_limit=100,
         memory_limit="100Gi",
+        configure_sub_slicing=False,
     )
     with (
@@ -316,7 +311,7 @@ class KueueManagerTest(unittest.TestCase):
         ),
         patch.object(
             self.kueue_manager,
-            "_KueueManager__get_installed_kueue_version",
+            "get_installed_kueue_version",
             return_value=(1, None),
         ),
         patch.object(
@@ -344,7 +339,7 @@ class KueueManagerTest(unittest.TestCase):
   @patch(
       "xpk.core.kueue_manager.KueueManager._KueueManager__update_kueue_resources_if_necessary"
   )
-  def test_configure_generates_correct_manifest(
+  def test_configure_generates_correct_manifest_for_tpu(
       self, mock_update_resources, mock_install
   ):
     """Test that __configure generates the correct manifest content for TPUs."""
@@ -357,6 +352,7 @@ class KueueManagerTest(unittest.TestCase):
         memory_limit="100Gi",
         autoprovisioning_enabled=False,
         num_slices=2,
+        configure_sub_slicing=False,
     )
     rendered_manifest = self._trigger_installation(kueue_config)
@@ -413,6 +409,7 @@ class KueueManagerTest(unittest.TestCase):
         autoprovisioning_enabled=False,
         num_slices=1,
         flex=True,
+        configure_sub_slicing=False,
     )
     rendered_manifest = self._trigger_installation(kueue_config)
@@ -432,7 +429,7 @@ class KueueManagerTest(unittest.TestCase):
   @patch(
       "xpk.core.kueue_manager.KueueManager._KueueManager__update_kueue_resources_if_necessary"
   )
-  def test_configure_generates_correct_manifest_with_topology(
+  def test_configure_generates_correct_manifest_with_gke_default_topology(
       self, mock_update_resources, mock_install
   ):
     """Test that __configure generates correct manifest for GPUs."""
@@ -444,11 +441,11 @@ class KueueManagerTest(unittest.TestCase):
         cpu_limit=100,
         memory_limit="100Gi",
         num_slices=2,
+        configure_sub_slicing=False,
     )
     rendered_manifest = self._trigger_installation(kueue_config)
-    self.assertIn("kind: Topology", rendered_manifest)
     manifest_docs = list(yaml.safe_load_all(rendered_manifest))
     resource_flavor = _first(
         doc for doc in manifest_docs if doc["kind"] == "ResourceFlavor"
@@ -459,6 +456,40 @@ class KueueManagerTest(unittest.TestCase):
         ],
         "h100-mega-80gb-8",
     )
+    self.assertEqual(resource_flavor["spec"]["topologyName"], "gke-default")
+    topology = _first(doc for doc in manifest_docs if doc["kind"] == "Topology")
+    self.assertEqual(topology["metadata"]["name"], "gke-default")
+  @patch("xpk.core.kueue_manager.KueueManager._KueueManager__install")
+  @patch(
+      "xpk.core.kueue_manager.KueueManager._KueueManager__update_kueue_resources_if_necessary"
+  )
+  def test_configure_generates_correct_manifest_with_sub_slicing(
+      self, mock_update_resources, mock_install
+  ):
+    """Test that __configure generates correct manifest with sub-slicing topology."""
+    mock_install.return_value = 0
+    mock_update_resources.return_value = 0
+    kueue_config = KueueConfig(
+        system=self.mock_system_chars,
+        total_chips=16,
+        cpu_limit=100,
+        memory_limit="100Gi",
+        num_slices=2,
+        configure_sub_slicing=True,
+    )
+    rendered_manifest = self._trigger_installation(kueue_config)
+    manifest_docs = list(yaml.safe_load_all(rendered_manifest))
+    resource_flavor = _first(
+        doc for doc in manifest_docs if doc["kind"] == "ResourceFlavor"
+    )
+    self.assertEqual(
+        resource_flavor["spec"]["topologyName"], "sub-slice-topology"
+    )
+    topology = _first(doc for doc in manifest_docs if doc["kind"] == "Topology")
+    self.assertEqual(topology["metadata"]["name"], "sub-slice-topology")
   @patch("xpk.core.kueue_manager.KueueManager._KueueManager__install")
   @patch(
@@ -477,6 +508,7 @@ class KueueManagerTest(unittest.TestCase):
         memory_limit="100Gi",
         is_pathways_cluster=True,
         num_slices=2,
+        configure_sub_slicing=False,
     )
     rendered_manifest = self._trigger_installation(kueue_config)
@@ -513,7 +545,7 @@ class KueueManagerTest(unittest.TestCase):
     """Calls Kueue installation and returns the rendered manifest."""
     with (
         patch.object(
-            self.kueue_manager, "_KueueManager__get_installed_kueue_version"
+            self.kueue_manager, "get_installed_kueue_version"
         ) as mock_get_version,
         patch.object(
             self.kueue_manager, "_KueueManager__apply_manifest"

xpk/core/system_characteristics.py CHANGED Viewed

@@ -135,10 +135,9 @@ def get_tpu_system_characteristics_map(
 ) -> dict[str, SystemCharacteristics]:
   system_characteristics_map = {}
   for topology in supported_topologies:
-    total_chips = get_topology_product(topology)
-    num_tensorcores = total_chips * tensorcores_per_chip
-    chips_per_vm = 1 if total_chips == 1 else 4
-    vms_per_slice = total_chips // chips_per_vm
+    chips_per_vm = compute_chips_per_vm(topology)
+    vms_per_slice = compute_vms_per_slice(topology)
+    num_tensorcores = compute_num_tensorcores(tensorcores_per_chip, topology)
     system = SystemCharacteristics(
         topology=topology,
         vms_per_slice=vms_per_slice,
@@ -156,6 +155,19 @@ def get_tpu_system_characteristics_map(
   return system_characteristics_map
+def compute_chips_per_vm(topology: str) -> int:
+  return 1 if get_topology_product(topology) == 1 else 4
+def compute_num_tensorcores(tensorcores_per_chip: int, topology: str) -> int:
+  return get_topology_product(topology) * tensorcores_per_chip
+def compute_vms_per_slice(topology: str) -> int:
+  chips_per_vm = compute_chips_per_vm(topology)
+  return get_topology_product(topology) // chips_per_vm
 ################### Subcommand Helper Functions #############################
 """ !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
 IF YOU MODIFY THE BELOW UserFacingNameToSystemCharacteristics MAP YOU SHOULD

xpk/core/system_characteristics_test.py ADDED Viewed

@@ -0,0 +1,73 @@
+"""
+Copyright 2025 Google LLC
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+     https://www.apache.org/licenses/LICENSE-2.0
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License.
+"""
+from .system_characteristics import get_tpu_system_characteristics_map, SystemCharacteristics
+def test_get_tpu_system_characteristics_map_returns_correct_values_for_1x1_topology():
+  result = get_tpu_system_characteristics_map(
+      prefix="test",
+      tensorcores_per_chip=1,
+      gke_accelerator="test",
+      machine_type="test",
+      supported_topologies=["1x1"],
+      supports_sub_slicing=False,
+      requires_workload_policy=True,
+  )
+  expected_system_characteristics = SystemCharacteristics(
+      topology="1x1",
+      vms_per_slice=1,
+      gke_accelerator="test",
+      gce_machine_type="test",
+      chips_per_vm=1,
+      accelerator_type=1,
+      device_type="test-1",
+      supports_sub_slicing=False,
+      requires_workload_policy=True,
+  )
+  assert result == {
+      "test-1": expected_system_characteristics,
+      "test-1x1": expected_system_characteristics,
+  }
+def test_get_tpu_system_characteristics_map_returns_correct_values_for_2x2_topology():
+  result = get_tpu_system_characteristics_map(
+      prefix="test",
+      tensorcores_per_chip=2,
+      gke_accelerator="test",
+      machine_type="test",
+      supported_topologies=["2x2"],
+      supports_sub_slicing=False,
+      requires_workload_policy=True,
+  )
+  expected_system_characteristics = SystemCharacteristics(
+      topology="2x2",
+      vms_per_slice=1,
+      gke_accelerator="test",
+      gce_machine_type="test",
+      chips_per_vm=4,
+      accelerator_type=1,
+      device_type="test-8",
+      supports_sub_slicing=False,
+      requires_workload_policy=True,
+  )
+  assert result == {
+      "test-8": expected_system_characteristics,
+      "test-2x2": expected_system_characteristics,
+  }

xpk/templates/cluster_preheat.yaml.j2 ADDED Viewed

@@ -0,0 +1,31 @@
+apiVersion: apps/v1
+kind: DaemonSet
+metadata:
+  name: {{ cachekey }}
+  labels:
+    k8s-app: {{ cachekey }}
+spec:
+  selector:
+    matchLabels:
+      k8s-app: {{ cachekey }}
+  updateStrategy:
+    type: RollingUpdate
+  template:
+    metadata:
+      labels:
+        name: {{ cachekey }}
+        k8s-app: {{ cachekey }}
+    spec:
+      affinity:
+        nodeAffinity:
+          requiredDuringSchedulingIgnoredDuringExecution:
+            nodeSelectorTerms:
+            - matchExpressions:
+              - key: {{ nodeSelectorKey }}
+                operator: Exists
+      tolerations:
+      - operator: "Exists"
+      containers:
+      - image: {{ image_name }}
+        name: {{ cachekey }}
+        command: [ "sleep", "inf" ]

xpk/templates/filestore-pv.yaml ADDED Viewed

@@ -0,0 +1,17 @@
+apiVersion: v1
+kind: PersistentVolume
+metadata:
+  name: xpk-filestore-pv
+spec:
+  storageClassName:
+  capacity:
+    storage:
+  accessModes:
+  persistentVolumeReclaimPolicy: Retain
+  volumeMode: Filesystem
+  csi:
+    driver: filestore.csi.storage.gke.io
+    volumeHandle:
+    volumeAttributes:
+      ip:
+      volume:

xpk/templates/filestore-pvc.yaml ADDED Viewed

@@ -0,0 +1,11 @@
+kind: PersistentVolumeClaim
+apiVersion: v1
+metadata:
+  name:
+spec:
+  accessModes:
+  storageClassName:
+  volumeName:
+  resources:
+    requests:
+      storage:

xpk/templates/filestore-sc.yaml ADDED Viewed

@@ -0,0 +1,10 @@
+apiVersion: storage.k8s.io/v1
+kind: StorageClass
+metadata:
+  name:
+provisioner: filestore.csi.storage.gke.io
+volumeBindingMode: Immediate
+allowVolumeExpansion: true
+parameters:
+  tier: standard
+  network: default

xpk/templates/fuse-pv.yaml ADDED Viewed

@@ -0,0 +1,17 @@
+apiVersion: v1
+kind: PersistentVolume
+metadata:
+  name:
+spec:
+  accessModes:
+  - ReadWriteMany
+  capacity:
+    storage:
+  storageClassName: example-storage-class
+  mountOptions:
+    - implicit-dirs
+  csi:
+    driver: gcsfuse.csi.storage.gke.io
+    volumeHandle:
+    volumeAttributes:
+      gcsfuseLoggingSeverity: warning

xpk/templates/fuse-pvc.yaml ADDED Viewed

@@ -0,0 +1,13 @@
+apiVersion: v1
+kind: PersistentVolumeClaim
+metadata:
+  name:
+  namespace: default
+spec:
+  accessModes:
+  - ReadWriteMany
+  resources:
+    requests:
+      storage:
+  volumeName:
+  storageClassName: example-storage-class

xpk/templates/kueue_config.yaml.j2 ADDED Viewed

@@ -0,0 +1,95 @@
+{% for flavor in flavors %}
+apiVersion: kueue.x-k8s.io/v1beta1
+kind: ResourceFlavor
+metadata:
+  name: "{{ flavor.name }}"
+spec:
+  nodeLabels: {{ flavor.nodeLabels | tojson }}
+  {% if flavor.topologyLabel %}
+  {{ flavor.topologyLabel }}
+  {% endif %}
+---
+{% endfor %}
+apiVersion: kueue.x-k8s.io/v1beta1
+kind: AdmissionCheck
+metadata:
+  name: dws-prov
+spec:
+  controllerName: kueue.x-k8s.io/provisioning-request
+  parameters:
+    apiGroup: kueue.x-k8s.io
+    kind: ProvisioningRequestConfig
+    name: dws-config
+---
+apiVersion: kueue.x-k8s.io/v1beta1
+kind: ProvisioningRequestConfig
+metadata:
+  name: dws-config
+spec:
+  provisioningClassName: queued-provisioning.gke.io
+  podSetUpdates:
+    nodeSelector:
+    - key: autoscaling.gke.io/provisioning-request
+      valueFromProvisioningClassDetail: ResizeRequestName
+  managedResources:
+  - {{ managed_resource }}
+---
+apiVersion: kueue.x-k8s.io/v1beta1
+kind: ClusterQueue
+metadata:
+  name: "{{ cluster_queue_name }}"
+spec:
+  preemption:
+    reclaimWithinCohort: Never # Don't preempt other queues in the cohort.
+    withinClusterQueue: LowerPriority
+  namespaceSelector: {} # match all.
+  resourceGroups: {{ resource_groups }}
+  {{ admission_checks | indent(2) }}
+---
+apiVersion: kueue.x-k8s.io/v1beta1
+kind: LocalQueue
+metadata:
+  namespace: default
+  name: {{ local_queue_name }}
+spec:
+  clusterQueue: {{ cluster_queue_name }}
+---
+apiVersion: scheduling.k8s.io/v1
+kind: PriorityClass
+metadata:
+  name: very-low
+value: 100
+globalDefault: false
+description: "Very Low"
+---
+apiVersion: scheduling.k8s.io/v1
+kind: PriorityClass
+metadata:
+  name: low
+value: 250
+globalDefault: false
+description: "Low"
+---
+apiVersion: scheduling.k8s.io/v1
+kind: PriorityClass
+metadata:
+  name: medium
+value: 500
+globalDefault: false
+description: "Medium"
+---
+apiVersion: scheduling.k8s.io/v1
+kind: PriorityClass
+metadata:
+  name: high
+value: 750
+globalDefault: false
+description: "High"
+---
+apiVersion: scheduling.k8s.io/v1
+kind: PriorityClass
+metadata:
+  name: very-high
+value: 1000
+globalDefault: false
+description: "Very High"

xpk 0.14.0__py3-none-any.whl → 0.14.2__py3-none-any.whl

xpk 0.14.0py3-none-any.whl → 0.14.2py3-none-any.whl