konduktor-nightly 0.1.0.dev20250515104942__tar.gz → 0.1.0.dev20250515213403__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (97) hide show
  1. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/PKG-INFO +1 -1
  2. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/__init__.py +2 -2
  3. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/templates/pod.yaml.j2 +18 -14
  4. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/pyproject.toml +1 -1
  5. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/LICENSE +0 -0
  6. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/README.md +0 -0
  7. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/adaptors/__init__.py +0 -0
  8. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/adaptors/aws.py +0 -0
  9. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/adaptors/common.py +0 -0
  10. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/adaptors/gcp.py +0 -0
  11. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/authentication.py +0 -0
  12. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/backends/__init__.py +0 -0
  13. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/backends/backend.py +0 -0
  14. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/backends/jobset.py +0 -0
  15. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/backends/jobset_utils.py +0 -0
  16. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/check.py +0 -0
  17. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/cli.py +0 -0
  18. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/config.py +0 -0
  19. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/constants.py +0 -0
  20. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/controller/__init__.py +0 -0
  21. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/controller/constants.py +0 -0
  22. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/controller/launch.py +0 -0
  23. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/controller/node.py +0 -0
  24. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/controller/parse.py +0 -0
  25. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/README.md +0 -0
  26. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/backend/main.py +0 -0
  27. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/backend/sockets.py +0 -0
  28. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/.eslintrc.json +0 -0
  29. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/.gitignore +0 -0
  30. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/api/jobs/route.js +0 -0
  31. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/api/namespaces/route.js +0 -0
  32. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/Grafana.jsx +0 -0
  33. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/JobsData.jsx +0 -0
  34. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/LogsData.jsx +0 -0
  35. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/NavMenu.jsx +0 -0
  36. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/NavTabs.jsx +0 -0
  37. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/NavTabs2.jsx +0 -0
  38. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/SelectBtn.jsx +0 -0
  39. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/lib/utils.js +0 -0
  40. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/ui/chip-select.jsx +0 -0
  41. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/ui/input.jsx +0 -0
  42. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/ui/navigation-menu.jsx +0 -0
  43. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/components/ui/select.jsx +0 -0
  44. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/favicon.ico +0 -0
  45. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/globals.css +0 -0
  46. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/jobs/page.js +0 -0
  47. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/layout.js +0 -0
  48. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/logs/page.js +0 -0
  49. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/app/page.js +0 -0
  50. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/jsconfig.json +0 -0
  51. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/next.config.mjs +0 -0
  52. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/package-lock.json +0 -0
  53. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/package.json +0 -0
  54. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/postcss.config.mjs +0 -0
  55. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/server.js +0 -0
  56. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/dashboard/frontend/tailwind.config.js +0 -0
  57. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/__init__.py +0 -0
  58. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/aws/__init__.py +0 -0
  59. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/aws/s3.py +0 -0
  60. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/constants.py +0 -0
  61. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/data_utils.py +0 -0
  62. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/gcp/__init__.py +0 -0
  63. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/gcp/constants.py +0 -0
  64. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/gcp/gcs.py +0 -0
  65. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/gcp/utils.py +0 -0
  66. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/registry.py +0 -0
  67. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/storage.py +0 -0
  68. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/data/storage_utils.py +0 -0
  69. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/execution.py +0 -0
  70. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/kube_client.py +0 -0
  71. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/logging.py +0 -0
  72. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/manifests/controller_deployment.yaml +0 -0
  73. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/manifests/dashboard_deployment.yaml +0 -0
  74. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/manifests/dmesg_daemonset.yaml +0 -0
  75. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/manifests/pod_cleanup_controller.yaml +0 -0
  76. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/resource.py +0 -0
  77. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/task.py +0 -0
  78. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/templates/jobset.yaml.j2 +0 -0
  79. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/usage/__init__.py +0 -0
  80. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/usage/constants.py +0 -0
  81. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/__init__.py +0 -0
  82. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/accelerator_registry.py +0 -0
  83. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/annotations.py +0 -0
  84. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/base64_utils.py +0 -0
  85. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/common_utils.py +0 -0
  86. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/constants.py +0 -0
  87. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/env_options.py +0 -0
  88. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/exceptions.py +0 -0
  89. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/kubernetes_enums.py +0 -0
  90. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/kubernetes_utils.py +0 -0
  91. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/log_utils.py +0 -0
  92. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/loki_utils.py +0 -0
  93. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/rich_utils.py +0 -0
  94. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/schemas.py +0 -0
  95. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/subprocess_utils.py +0 -0
  96. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/ux_utils.py +0 -0
  97. {konduktor_nightly-0.1.0.dev20250515104942 → konduktor_nightly-0.1.0.dev20250515213403}/konduktor/utils/validator.py +0 -0
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.3
2
2
  Name: konduktor-nightly
3
- Version: 0.1.0.dev20250515104942
3
+ Version: 0.1.0.dev20250515213403
4
4
  Summary: GPU Cluster Health Management
5
5
  Author: Andrew Aikawa
6
6
  Author-email: asai@berkeley.edu
@@ -14,7 +14,7 @@ __all__ = [
14
14
  ]
15
15
 
16
16
  # Replaced with the current commit when building the wheels.
17
- _KONDUKTOR_COMMIT_SHA = 'c0bd8e8774fab8042721b43a8cb8c35a624f8299'
17
+ _KONDUKTOR_COMMIT_SHA = '4423217b6e17ef650ab478d3d9f60e28708ccc29'
18
18
  os.makedirs(os.path.expanduser('~/.konduktor'), exist_ok=True)
19
19
 
20
20
 
@@ -48,5 +48,5 @@ def _get_git_commit():
48
48
 
49
49
 
50
50
  __commit__ = _get_git_commit()
51
- __version__ = '1.0.0.dev0.1.0.dev20250515104942'
51
+ __version__ = '1.0.0.dev0.1.0.dev20250515213403'
52
52
  __root_dir__ = os.path.dirname(os.path.abspath(__file__))
@@ -243,40 +243,44 @@ kubernetes:
243
243
  # set default port to 2222
244
244
  $(prefix_cmd) sed -i 's/#Port 22/Port 2222/' /etc/ssh/sshd_config
245
245
 
246
- echo "Exposing ENV variables"
247
- env -0 | awk -v RS='\0' '
248
- {
249
- gsub(/\\/,"\\\\"); # escape existing backslashes first
250
- gsub(/"/,"\\\""); # escape any double quotes
251
- gsub(/\n/,"\\n"); # turn real newlines into the two characters \n
252
- sub(/=/,"=\""); # open the value-quoting
253
- print $0 "\""; # close the quote and add a newline record separator
254
- }
255
- ' > /etc/environment
256
- echo "set -a; source /etc/environment; set +a;" >> /root/.bashrc
257
-
258
246
  $(prefix_cmd) mkdir /run/sshd
259
247
  $(prefix_cmd) chmod 0755 /run/sshd
260
248
 
261
249
  $(prefix_cmd) service ssh start
262
250
  $(prefix_cmd) echo "sshd service started"
263
251
  }
252
+ export TS_HOSTNAME=$(echo "$POD_NAME" | sed 's/-[^-]*$//')
253
+ echo "Exposing ENV variables"
254
+ $(prefix_cmd) env -0 | awk -v RS='\0' '
255
+ {
256
+ gsub(/\\/,"\\\\"); # escape existing backslashes first
257
+ gsub(/"/,"\\\""); # escape any double quotes
258
+ gsub(/\n/,"\\n"); # turn real newlines into the two characters \n
259
+ sub(/=/,"=\""); # open the value-quoting
260
+ print $0 "\""; # close the quote and add a newline record separator
261
+ }
262
+ ' > /etc/environment
263
+
264
+ $(prefix_cmd) echo "TS_HOSTNAME=${TS_HOSTNAME}" >> /etc/environment
265
+ $(prefix_cmd) echo "set -a; source /etc/environment; set +a;" >> $HOME/.bashrc
264
266
 
265
267
  InstallSSH
266
268
  {% endif %}
267
269
  {% if tailscale_secret %}
268
270
  function InstallTailscale {
271
+ set -x
269
272
  if ! command -v tailscale >/dev/null 2>&1; then
270
- export TS_HOSTNAME=$(echo "$POD_NAME" | sed 's/-[^-]*$//')
273
+ $(prefix_cmd) mkdir -p /var/run/tailscale /var/cache/tailscale /var/lib/tailscale
271
274
  $(prefix_cmd) curl -fsSL https://tailscale.com/install.sh | DEBIAN_FRONTEND=noninteractive $(prefix_cmd) sh > ~/.konduktor/tmp/tailscale-install.log 2>&1
272
275
  $(prefix_cmd) tailscaled --tun=userspace-networking >/dev/null 2>&1 &
273
276
  while ! tailscale status >/dev/null 2>&1; do
274
277
  $(prefix_cmd) timeout 5 tailscale up --auth-key=${TS_AUTHKEY} --ssh --hostname=${TS_HOSTNAME}
275
278
  sleep 1
276
279
  done
280
+ $(prefix_cmd) echo "Tailscale is up"
277
281
  fi
278
282
  }
279
- InstallTailscale &
283
+ InstallTailscale | tee ~/.konduktor/tmp/tailscale-out.log &
280
284
  {% endif %}
281
285
  end_epoch=$(date +%s);
282
286
 
@@ -1,6 +1,6 @@
1
1
  [tool.poetry]
2
2
  name = "konduktor-nightly"
3
- version = "0.1.0.dev20250515104942"
3
+ version = "0.1.0.dev20250515213403"
4
4
  description = "GPU Cluster Health Management"
5
5
  packages = [
6
6
  {include = "konduktor"}