llama-stack 0.3.4__tar.gz → 0.3.5__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (633) hide show
  1. {llama_stack-0.3.4/llama_stack.egg-info → llama_stack-0.3.5}/PKG-INFO +3 -80
  2. {llama_stack-0.3.4 → llama_stack-0.3.5}/README.md +0 -77
  3. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/inference_store.py +5 -13
  4. {llama_stack-0.3.4 → llama_stack-0.3.5/llama_stack.egg-info}/PKG-INFO +3 -80
  5. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack.egg-info/requires.txt +2 -2
  6. {llama_stack-0.3.4 → llama_stack-0.3.5}/pyproject.toml +3 -3
  7. {llama_stack-0.3.4 → llama_stack-0.3.5}/LICENSE +0 -0
  8. {llama_stack-0.3.4 → llama_stack-0.3.5}/MANIFEST.in +0 -0
  9. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/__init__.py +0 -0
  10. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/__init__.py +0 -0
  11. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/agents/__init__.py +0 -0
  12. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/agents/agents.py +0 -0
  13. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/agents/openai_responses.py +0 -0
  14. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/batches/__init__.py +0 -0
  15. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/batches/batches.py +0 -0
  16. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/benchmarks/__init__.py +0 -0
  17. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/benchmarks/benchmarks.py +0 -0
  18. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/common/__init__.py +0 -0
  19. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/common/content_types.py +0 -0
  20. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/common/errors.py +0 -0
  21. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/common/job_types.py +0 -0
  22. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/common/responses.py +0 -0
  23. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/common/training_types.py +0 -0
  24. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/common/type_system.py +0 -0
  25. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/conversations/__init__.py +0 -0
  26. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/conversations/conversations.py +0 -0
  27. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/datasetio/__init__.py +0 -0
  28. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/datasetio/datasetio.py +0 -0
  29. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/datasets/__init__.py +0 -0
  30. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/datasets/datasets.py +0 -0
  31. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/datatypes.py +0 -0
  32. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/eval/__init__.py +0 -0
  33. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/eval/eval.py +0 -0
  34. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/files/__init__.py +0 -0
  35. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/files/files.py +0 -0
  36. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/inference/__init__.py +0 -0
  37. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/inference/event_logger.py +0 -0
  38. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/inference/inference.py +0 -0
  39. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/inspect/__init__.py +0 -0
  40. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/inspect/inspect.py +0 -0
  41. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/models/__init__.py +0 -0
  42. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/models/models.py +0 -0
  43. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/post_training/__init__.py +0 -0
  44. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/post_training/post_training.py +0 -0
  45. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/prompts/__init__.py +0 -0
  46. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/prompts/prompts.py +0 -0
  47. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/providers/__init__.py +0 -0
  48. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/providers/providers.py +0 -0
  49. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/resource.py +0 -0
  50. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/safety/__init__.py +0 -0
  51. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/safety/safety.py +0 -0
  52. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/scoring/__init__.py +0 -0
  53. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/scoring/scoring.py +0 -0
  54. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/scoring_functions/__init__.py +0 -0
  55. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/scoring_functions/scoring_functions.py +0 -0
  56. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/shields/__init__.py +0 -0
  57. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/shields/shields.py +0 -0
  58. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/synthetic_data_generation/__init__.py +0 -0
  59. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/synthetic_data_generation/synthetic_data_generation.py +0 -0
  60. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/telemetry/__init__.py +0 -0
  61. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/telemetry/telemetry.py +0 -0
  62. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/tools/__init__.py +0 -0
  63. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/tools/rag_tool.py +0 -0
  64. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/tools/tools.py +0 -0
  65. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/vector_io/__init__.py +0 -0
  66. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/vector_io/vector_io.py +0 -0
  67. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/vector_stores/__init__.py +0 -0
  68. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/vector_stores/vector_stores.py +0 -0
  69. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/apis/version.py +0 -0
  70. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/__init__.py +0 -0
  71. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/llama.py +0 -0
  72. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/scripts/__init__.py +0 -0
  73. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/scripts/install-wheel-from-presigned.sh +0 -0
  74. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/scripts/run.py +0 -0
  75. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/__init__.py +0 -0
  76. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/_list_deps.py +0 -0
  77. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/list_apis.py +0 -0
  78. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/list_deps.py +0 -0
  79. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/list_providers.py +0 -0
  80. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/list_stacks.py +0 -0
  81. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/remove.py +0 -0
  82. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/run.py +0 -0
  83. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/stack.py +0 -0
  84. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/stack/utils.py +0 -0
  85. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/subcommand.py +0 -0
  86. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/table.py +0 -0
  87. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/cli/utils.py +0 -0
  88. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/__init__.py +0 -0
  89. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/access_control/__init__.py +0 -0
  90. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/access_control/access_control.py +0 -0
  91. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/access_control/conditions.py +0 -0
  92. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/access_control/datatypes.py +0 -0
  93. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/build.py +0 -0
  94. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/client.py +0 -0
  95. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/common.sh +0 -0
  96. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/configure.py +0 -0
  97. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/conversations/__init__.py +0 -0
  98. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/conversations/conversations.py +0 -0
  99. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/datatypes.py +0 -0
  100. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/distribution.py +0 -0
  101. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/external.py +0 -0
  102. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/id_generation.py +0 -0
  103. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/inspect.py +0 -0
  104. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/library_client.py +0 -0
  105. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/prompts/__init__.py +0 -0
  106. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/prompts/prompts.py +0 -0
  107. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/providers.py +0 -0
  108. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/request_headers.py +0 -0
  109. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/resolver.py +0 -0
  110. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routers/__init__.py +0 -0
  111. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routers/datasets.py +0 -0
  112. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routers/eval_scoring.py +0 -0
  113. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routers/inference.py +0 -0
  114. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routers/safety.py +0 -0
  115. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routers/tool_runtime.py +0 -0
  116. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routers/vector_io.py +0 -0
  117. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routing_tables/__init__.py +0 -0
  118. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routing_tables/benchmarks.py +0 -0
  119. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routing_tables/common.py +0 -0
  120. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routing_tables/datasets.py +0 -0
  121. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routing_tables/models.py +0 -0
  122. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routing_tables/scoring_functions.py +0 -0
  123. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routing_tables/shields.py +0 -0
  124. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routing_tables/toolgroups.py +0 -0
  125. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/routing_tables/vector_stores.py +0 -0
  126. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/server/__init__.py +0 -0
  127. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/server/auth.py +0 -0
  128. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/server/auth_providers.py +0 -0
  129. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/server/quota.py +0 -0
  130. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/server/routes.py +0 -0
  131. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/server/server.py +0 -0
  132. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/server/tracing.py +0 -0
  133. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/stack.py +0 -0
  134. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/start_stack.sh +0 -0
  135. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/storage/__init__.py +0 -0
  136. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/storage/datatypes.py +0 -0
  137. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/store/__init__.py +0 -0
  138. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/store/registry.py +0 -0
  139. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/testing_context.py +0 -0
  140. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/__init__.py +0 -0
  141. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/app.py +0 -0
  142. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/modules/__init__.py +0 -0
  143. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/modules/api.py +0 -0
  144. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/modules/utils.py +0 -0
  145. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/__init__.py +0 -0
  146. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/__init__.py +0 -0
  147. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/datasets.py +0 -0
  148. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/eval_tasks.py +0 -0
  149. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/models.py +0 -0
  150. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/providers.py +0 -0
  151. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/resources.py +0 -0
  152. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/scoring_functions.py +0 -0
  153. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/shields.py +0 -0
  154. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/evaluations/__init__.py +0 -0
  155. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/evaluations/app_eval.py +0 -0
  156. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/evaluations/native_eval.py +0 -0
  157. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/playground/__init__.py +0 -0
  158. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/playground/chat.py +0 -0
  159. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/ui/page/playground/tools.py +0 -0
  160. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/__init__.py +0 -0
  161. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/config.py +0 -0
  162. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/config_dirs.py +0 -0
  163. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/config_resolution.py +0 -0
  164. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/context.py +0 -0
  165. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/dynamic.py +0 -0
  166. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/exec.py +0 -0
  167. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/image_types.py +0 -0
  168. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/model_utils.py +0 -0
  169. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/prompt_for_config.py +0 -0
  170. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/core/utils/serialize.py +0 -0
  171. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/__init__.py +0 -0
  172. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/dell/__init__.py +0 -0
  173. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/dell/build.yaml +0 -0
  174. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/dell/dell.py +0 -0
  175. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/dell/run-with-safety.yaml +0 -0
  176. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/dell/run.yaml +0 -0
  177. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/__init__.py +0 -0
  178. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/build.yaml +0 -0
  179. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/meta_reference.py +0 -0
  180. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/run-with-safety.yaml +0 -0
  181. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/run.yaml +0 -0
  182. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/__init__.py +0 -0
  183. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/build.yaml +0 -0
  184. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/nvidia.py +0 -0
  185. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/run-with-safety.yaml +0 -0
  186. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/run.yaml +0 -0
  187. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/open-benchmark/__init__.py +0 -0
  188. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/open-benchmark/build.yaml +0 -0
  189. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/open-benchmark/open_benchmark.py +0 -0
  190. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/open-benchmark/run.yaml +0 -0
  191. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/postgres-demo/__init__.py +0 -0
  192. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/postgres-demo/build.yaml +0 -0
  193. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/postgres-demo/postgres_demo.py +0 -0
  194. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/postgres-demo/run.yaml +0 -0
  195. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter/__init__.py +0 -0
  196. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter/build.yaml +0 -0
  197. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter/run-with-postgres-store.yaml +0 -0
  198. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter/run.yaml +0 -0
  199. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter/starter.py +0 -0
  200. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/__init__.py +0 -0
  201. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/build.yaml +0 -0
  202. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/run-with-postgres-store.yaml +0 -0
  203. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/run.yaml +0 -0
  204. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/starter_gpu.py +0 -0
  205. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/template.py +0 -0
  206. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/watsonx/__init__.py +0 -0
  207. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/watsonx/build.yaml +0 -0
  208. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/watsonx/run.yaml +0 -0
  209. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/distributions/watsonx/watsonx.py +0 -0
  210. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/env.py +0 -0
  211. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/log.py +0 -0
  212. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/__init__.py +0 -0
  213. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/__init__.py +0 -0
  214. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/checkpoint.py +0 -0
  215. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/datatypes.py +0 -0
  216. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/hadamard_utils.py +0 -0
  217. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/__init__.py +0 -0
  218. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/args.py +0 -0
  219. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/chat_format.py +0 -0
  220. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/generation.py +0 -0
  221. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/interface.py +0 -0
  222. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/model.py +0 -0
  223. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/__init__.py +0 -0
  224. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/encoder_utils.py +0 -0
  225. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/image_transform.py +0 -0
  226. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/model.py +0 -0
  227. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/utils.py +0 -0
  228. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/prompt_templates/__init__.py +0 -0
  229. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/prompt_templates/base.py +0 -0
  230. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/prompt_templates/system_prompts.py +0 -0
  231. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/prompt_templates/tool_response.py +0 -0
  232. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/quantization/__init__.py +0 -0
  233. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/quantization/loader.py +0 -0
  234. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/template_data.py +0 -0
  235. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/tokenizer.model +0 -0
  236. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/tokenizer.py +0 -0
  237. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/tool_utils.py +0 -0
  238. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_1/__init__.py +0 -0
  239. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_1/prompt_format.md +0 -0
  240. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_1/prompts.py +0 -0
  241. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/__init__.py +0 -0
  242. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/prompts_text.py +0 -0
  243. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/prompts_vision.py +0 -0
  244. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/text_prompt_format.md +0 -0
  245. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/vision_prompt_format.md +0 -0
  246. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_3/__init__.py +0 -0
  247. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_3/prompts.py +0 -0
  248. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/__init__.py +0 -0
  249. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/args.py +0 -0
  250. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/chat_format.py +0 -0
  251. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/datatypes.py +0 -0
  252. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/ffn.py +0 -0
  253. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/generation.py +0 -0
  254. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/model.py +0 -0
  255. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/moe.py +0 -0
  256. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/preprocess.py +0 -0
  257. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/prompt_format.md +0 -0
  258. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/prompt_templates/__init__.py +0 -0
  259. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/prompt_templates/system_prompts.py +0 -0
  260. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/prompts.py +0 -0
  261. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/quantization/__init__.py +0 -0
  262. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/quantization/loader.py +0 -0
  263. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/tokenizer.model +0 -0
  264. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/tokenizer.py +0 -0
  265. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/vision/__init__.py +0 -0
  266. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/vision/embedding.py +0 -0
  267. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/vision/encoder.py +0 -0
  268. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/prompt_format.py +0 -0
  269. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/quantize_impls.py +0 -0
  270. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/sku_list.py +0 -0
  271. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/sku_types.py +0 -0
  272. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/models/llama/tokenizer_utils.py +0 -0
  273. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/__init__.py +0 -0
  274. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/datatypes.py +0 -0
  275. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/__init__.py +0 -0
  276. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/__init__.py +0 -0
  277. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/__init__.py +0 -0
  278. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/agent_instance.py +0 -0
  279. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/agents.py +0 -0
  280. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/config.py +0 -0
  281. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/persistence.py +0 -0
  282. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/__init__.py +0 -0
  283. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/openai_responses.py +0 -0
  284. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/streaming.py +0 -0
  285. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/tool_executor.py +0 -0
  286. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/types.py +0 -0
  287. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/utils.py +0 -0
  288. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/safety.py +0 -0
  289. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/batches/__init__.py +0 -0
  290. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/batches/reference/__init__.py +0 -0
  291. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/batches/reference/batches.py +0 -0
  292. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/batches/reference/config.py +0 -0
  293. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/datasetio/__init__.py +0 -0
  294. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/datasetio/localfs/__init__.py +0 -0
  295. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/datasetio/localfs/config.py +0 -0
  296. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/datasetio/localfs/datasetio.py +0 -0
  297. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/eval/__init__.py +0 -0
  298. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/eval/meta_reference/__init__.py +0 -0
  299. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/eval/meta_reference/config.py +0 -0
  300. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/eval/meta_reference/eval.py +0 -0
  301. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/files/localfs/__init__.py +0 -0
  302. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/files/localfs/config.py +0 -0
  303. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/files/localfs/files.py +0 -0
  304. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/__init__.py +0 -0
  305. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/__init__.py +0 -0
  306. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/common.py +0 -0
  307. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/config.py +0 -0
  308. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/generators.py +0 -0
  309. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/inference.py +0 -0
  310. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/model_parallel.py +0 -0
  311. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/parallel_utils.py +0 -0
  312. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/sentence_transformers/__init__.py +0 -0
  313. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/sentence_transformers/config.py +0 -0
  314. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/sentence_transformers/sentence_transformers.py +0 -0
  315. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/__init__.py +0 -0
  316. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/common/__init__.py +0 -0
  317. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/common/utils.py +0 -0
  318. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/common/validator.py +0 -0
  319. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/__init__.py +0 -0
  320. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/config.py +0 -0
  321. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/post_training.py +0 -0
  322. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/recipes/__init__.py +0 -0
  323. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/recipes/finetune_single_device.py +0 -0
  324. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/recipes/finetune_single_device_dpo.py +0 -0
  325. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/utils.py +0 -0
  326. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/__init__.py +0 -0
  327. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/common/__init__.py +0 -0
  328. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/common/checkpointer.py +0 -0
  329. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/common/utils.py +0 -0
  330. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/config.py +0 -0
  331. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/datasets/__init__.py +0 -0
  332. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/datasets/format_adapter.py +0 -0
  333. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/datasets/sft.py +0 -0
  334. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/post_training.py +0 -0
  335. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/recipes/__init__.py +0 -0
  336. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/recipes/lora_finetuning_single_device.py +0 -0
  337. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/__init__.py +0 -0
  338. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/code_scanner/__init__.py +0 -0
  339. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/code_scanner/code_scanner.py +0 -0
  340. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/code_scanner/config.py +0 -0
  341. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/llama_guard/__init__.py +0 -0
  342. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/llama_guard/config.py +0 -0
  343. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/llama_guard/llama_guard.py +0 -0
  344. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/prompt_guard/__init__.py +0 -0
  345. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/prompt_guard/config.py +0 -0
  346. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/prompt_guard/prompt_guard.py +0 -0
  347. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/__init__.py +0 -0
  348. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/__init__.py +0 -0
  349. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/config.py +0 -0
  350. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring.py +0 -0
  351. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/__init__.py +0 -0
  352. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/docvqa_scoring_fn.py +0 -0
  353. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/equality_scoring_fn.py +0 -0
  354. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/__init__.py +0 -0
  355. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/docvqa.py +0 -0
  356. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/equality.py +0 -0
  357. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/ifeval.py +0 -0
  358. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/regex_parser_math_response.py +0 -0
  359. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/regex_parser_multiple_choice_answer.py +0 -0
  360. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/subset_of.py +0 -0
  361. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/ifeval_scoring_fn.py +0 -0
  362. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/regex_parser_math_response_scoring_fn.py +0 -0
  363. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/regex_parser_scoring_fn.py +0 -0
  364. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/subset_of_scoring_fn.py +0 -0
  365. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/utils/__init__.py +0 -0
  366. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/utils/ifeval_utils.py +0 -0
  367. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/utils/math_utils.py +0 -0
  368. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/__init__.py +0 -0
  369. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/braintrust.py +0 -0
  370. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/config.py +0 -0
  371. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/__init__.py +0 -0
  372. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/__init__.py +0 -0
  373. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/answer_correctness.py +0 -0
  374. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/answer_relevancy.py +0 -0
  375. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/answer_similarity.py +0 -0
  376. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/context_entity_recall.py +0 -0
  377. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/context_precision.py +0 -0
  378. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/context_recall.py +0 -0
  379. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/context_relevancy.py +0 -0
  380. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/factuality.py +0 -0
  381. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/faithfulness.py +0 -0
  382. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/__init__.py +0 -0
  383. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/config.py +0 -0
  384. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring.py +0 -0
  385. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/__init__.py +0 -0
  386. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/fn_defs/__init__.py +0 -0
  387. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/fn_defs/llm_as_judge_405b_simpleqa.py +0 -0
  388. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/fn_defs/llm_as_judge_base.py +0 -0
  389. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/llm_as_judge_scoring_fn.py +0 -0
  390. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/telemetry/__init__.py +0 -0
  391. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/telemetry/meta_reference/__init__.py +0 -0
  392. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/telemetry/meta_reference/config.py +0 -0
  393. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/telemetry/meta_reference/telemetry.py +0 -0
  394. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/__init__.py +0 -0
  395. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/rag/__init__.py +0 -0
  396. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/rag/config.py +0 -0
  397. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/rag/context_retriever.py +0 -0
  398. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/rag/memory.py +0 -0
  399. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/__init__.py +0 -0
  400. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/chroma/__init__.py +0 -0
  401. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/chroma/config.py +0 -0
  402. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/faiss/__init__.py +0 -0
  403. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/faiss/config.py +0 -0
  404. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/faiss/faiss.py +0 -0
  405. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/milvus/__init__.py +0 -0
  406. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/milvus/config.py +0 -0
  407. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/qdrant/__init__.py +0 -0
  408. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/qdrant/config.py +0 -0
  409. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/sqlite_vec/__init__.py +0 -0
  410. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/sqlite_vec/config.py +0 -0
  411. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/sqlite_vec/sqlite_vec.py +0 -0
  412. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/__init__.py +0 -0
  413. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/agents.py +0 -0
  414. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/batches.py +0 -0
  415. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/datasetio.py +0 -0
  416. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/eval.py +0 -0
  417. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/files.py +0 -0
  418. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/inference.py +0 -0
  419. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/post_training.py +0 -0
  420. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/safety.py +0 -0
  421. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/scoring.py +0 -0
  422. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/tool_runtime.py +0 -0
  423. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/registry/vector_io.py +0 -0
  424. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/__init__.py +0 -0
  425. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/agents/__init__.py +0 -0
  426. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/__init__.py +0 -0
  427. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/huggingface/__init__.py +0 -0
  428. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/huggingface/config.py +0 -0
  429. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/huggingface/huggingface.py +0 -0
  430. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/nvidia/__init__.py +0 -0
  431. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/nvidia/config.py +0 -0
  432. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/nvidia/datasetio.py +0 -0
  433. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/eval/__init__.py +0 -0
  434. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/eval/nvidia/__init__.py +0 -0
  435. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/eval/nvidia/config.py +0 -0
  436. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/eval/nvidia/eval.py +0 -0
  437. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/files/s3/__init__.py +0 -0
  438. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/files/s3/config.py +0 -0
  439. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/files/s3/files.py +0 -0
  440. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/__init__.py +0 -0
  441. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/anthropic/__init__.py +0 -0
  442. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/anthropic/anthropic.py +0 -0
  443. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/anthropic/config.py +0 -0
  444. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/azure/__init__.py +0 -0
  445. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/azure/azure.py +0 -0
  446. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/azure/config.py +0 -0
  447. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/bedrock/__init__.py +0 -0
  448. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/bedrock/bedrock.py +0 -0
  449. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/bedrock/config.py +0 -0
  450. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/bedrock/models.py +0 -0
  451. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/cerebras/__init__.py +0 -0
  452. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/cerebras/cerebras.py +0 -0
  453. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/cerebras/config.py +0 -0
  454. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/databricks/__init__.py +0 -0
  455. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/databricks/config.py +0 -0
  456. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/databricks/databricks.py +0 -0
  457. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/fireworks/__init__.py +0 -0
  458. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/fireworks/config.py +0 -0
  459. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/fireworks/fireworks.py +0 -0
  460. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/gemini/__init__.py +0 -0
  461. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/gemini/config.py +0 -0
  462. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/gemini/gemini.py +0 -0
  463. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/groq/__init__.py +0 -0
  464. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/groq/config.py +0 -0
  465. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/groq/groq.py +0 -0
  466. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/llama_openai_compat/__init__.py +0 -0
  467. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/llama_openai_compat/config.py +0 -0
  468. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/llama_openai_compat/llama.py +0 -0
  469. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/nvidia/__init__.py +0 -0
  470. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/nvidia/config.py +0 -0
  471. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/nvidia/nvidia.py +0 -0
  472. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/nvidia/utils.py +0 -0
  473. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/ollama/__init__.py +0 -0
  474. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/ollama/config.py +0 -0
  475. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/ollama/ollama.py +0 -0
  476. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/openai/__init__.py +0 -0
  477. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/openai/config.py +0 -0
  478. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/openai/openai.py +0 -0
  479. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/passthrough/__init__.py +0 -0
  480. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/passthrough/config.py +0 -0
  481. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/passthrough/passthrough.py +0 -0
  482. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/runpod/__init__.py +0 -0
  483. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/runpod/config.py +0 -0
  484. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/runpod/runpod.py +0 -0
  485. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/sambanova/__init__.py +0 -0
  486. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/sambanova/config.py +0 -0
  487. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/sambanova/sambanova.py +0 -0
  488. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/tgi/__init__.py +0 -0
  489. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/tgi/config.py +0 -0
  490. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/tgi/tgi.py +0 -0
  491. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/together/__init__.py +0 -0
  492. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/together/config.py +0 -0
  493. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/together/together.py +0 -0
  494. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vertexai/__init__.py +0 -0
  495. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vertexai/config.py +0 -0
  496. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vertexai/vertexai.py +0 -0
  497. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vllm/__init__.py +0 -0
  498. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vllm/config.py +0 -0
  499. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vllm/vllm.py +0 -0
  500. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/watsonx/__init__.py +0 -0
  501. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/watsonx/config.py +0 -0
  502. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/watsonx/watsonx.py +0 -0
  503. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/__init__.py +0 -0
  504. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/__init__.py +0 -0
  505. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/config.py +0 -0
  506. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/models.py +0 -0
  507. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/post_training.py +0 -0
  508. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/utils.py +0 -0
  509. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/__init__.py +0 -0
  510. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/bedrock/__init__.py +0 -0
  511. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/bedrock/bedrock.py +0 -0
  512. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/bedrock/config.py +0 -0
  513. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/nvidia/__init__.py +0 -0
  514. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/nvidia/config.py +0 -0
  515. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/nvidia/nvidia.py +0 -0
  516. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/sambanova/__init__.py +0 -0
  517. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/sambanova/config.py +0 -0
  518. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/sambanova/sambanova.py +0 -0
  519. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/__init__.py +0 -0
  520. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/bing_search/__init__.py +0 -0
  521. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/bing_search/bing_search.py +0 -0
  522. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/bing_search/config.py +0 -0
  523. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/brave_search/__init__.py +0 -0
  524. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/brave_search/brave_search.py +0 -0
  525. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/brave_search/config.py +0 -0
  526. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/model_context_protocol/__init__.py +0 -0
  527. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/model_context_protocol/config.py +0 -0
  528. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/model_context_protocol/model_context_protocol.py +0 -0
  529. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/tavily_search/__init__.py +0 -0
  530. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/tavily_search/config.py +0 -0
  531. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/tavily_search/tavily_search.py +0 -0
  532. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/wolfram_alpha/__init__.py +0 -0
  533. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/wolfram_alpha/config.py +0 -0
  534. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/wolfram_alpha/wolfram_alpha.py +0 -0
  535. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/__init__.py +0 -0
  536. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/chroma/__init__.py +0 -0
  537. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/chroma/chroma.py +0 -0
  538. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/chroma/config.py +0 -0
  539. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/milvus/__init__.py +0 -0
  540. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/milvus/config.py +0 -0
  541. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/milvus/milvus.py +0 -0
  542. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/pgvector/__init__.py +0 -0
  543. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/pgvector/config.py +0 -0
  544. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/pgvector/pgvector.py +0 -0
  545. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/qdrant/__init__.py +0 -0
  546. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/qdrant/config.py +0 -0
  547. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/qdrant/qdrant.py +0 -0
  548. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/weaviate/__init__.py +0 -0
  549. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/weaviate/config.py +0 -0
  550. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/weaviate/weaviate.py +0 -0
  551. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/__init__.py +0 -0
  552. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/bedrock/__init__.py +0 -0
  553. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/bedrock/client.py +0 -0
  554. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/bedrock/config.py +0 -0
  555. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/bedrock/refreshable_boto_session.py +0 -0
  556. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/common/__init__.py +0 -0
  557. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/common/data_schema_validator.py +0 -0
  558. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/datasetio/__init__.py +0 -0
  559. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/datasetio/url_utils.py +0 -0
  560. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/files/__init__.py +0 -0
  561. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/files/form_data.py +0 -0
  562. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/__init__.py +0 -0
  563. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/embedding_mixin.py +0 -0
  564. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/litellm_openai_mixin.py +0 -0
  565. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/model_registry.py +0 -0
  566. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/openai_compat.py +0 -0
  567. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/openai_mixin.py +0 -0
  568. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/prompt_adapter.py +0 -0
  569. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/__init__.py +0 -0
  570. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/api.py +0 -0
  571. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/config.py +0 -0
  572. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/kvstore.py +0 -0
  573. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/mongodb/__init__.py +0 -0
  574. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/mongodb/mongodb.py +0 -0
  575. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/postgres/__init__.py +0 -0
  576. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/postgres/postgres.py +0 -0
  577. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/redis/__init__.py +0 -0
  578. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/redis/redis.py +0 -0
  579. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/sqlite/__init__.py +0 -0
  580. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/sqlite/config.py +0 -0
  581. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/sqlite/sqlite.py +0 -0
  582. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/memory/__init__.py +0 -0
  583. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/memory/file_utils.py +0 -0
  584. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/memory/openai_vector_store_mixin.py +0 -0
  585. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/memory/vector_store.py +0 -0
  586. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/pagination.py +0 -0
  587. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/responses/__init__.py +0 -0
  588. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/responses/responses_store.py +0 -0
  589. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/scheduler.py +0 -0
  590. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/scoring/__init__.py +0 -0
  591. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/scoring/aggregation_utils.py +0 -0
  592. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/scoring/base_scoring_fn.py +0 -0
  593. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/scoring/basic_scoring_utils.py +0 -0
  594. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/__init__.py +0 -0
  595. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/api.py +0 -0
  596. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/authorized_sqlstore.py +0 -0
  597. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/sqlalchemy_sqlstore.py +0 -0
  598. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/sqlstore.py +0 -0
  599. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/telemetry/__init__.py +0 -0
  600. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/telemetry/trace_protocol.py +0 -0
  601. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/telemetry/tracing.py +0 -0
  602. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/tools/__init__.py +0 -0
  603. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/tools/mcp.py +0 -0
  604. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/tools/ttl_dict.py +0 -0
  605. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/vector_io/__init__.py +0 -0
  606. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/providers/utils/vector_io/vector_utils.py +0 -0
  607. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/schema_utils.py +0 -0
  608. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/__init__.py +0 -0
  609. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/auxiliary.py +0 -0
  610. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/classdef.py +0 -0
  611. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/core.py +0 -0
  612. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/deserializer.py +0 -0
  613. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/docstring.py +0 -0
  614. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/exception.py +0 -0
  615. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/inspection.py +0 -0
  616. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/mapping.py +0 -0
  617. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/name.py +0 -0
  618. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/py.typed +0 -0
  619. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/schema.py +0 -0
  620. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/serialization.py +0 -0
  621. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/serializer.py +0 -0
  622. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/slots.py +0 -0
  623. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/strong_typing/topological.py +0 -0
  624. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/testing/__init__.py +0 -0
  625. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/testing/api_recorder.py +0 -0
  626. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack/ui/node_modules/flatted/python/flatted.py +0 -0
  627. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack.egg-info/SOURCES.txt +0 -0
  628. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack.egg-info/dependency_links.txt +0 -0
  629. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack.egg-info/entry_points.txt +0 -0
  630. {llama_stack-0.3.4 → llama_stack-0.3.5}/llama_stack.egg-info/top_level.txt +0 -0
  631. {llama_stack-0.3.4 → llama_stack-0.3.5}/setup.cfg +0 -0
  632. {llama_stack-0.3.4 → llama_stack-0.3.5}/tests/integration/test_cases/inference/chat_completion.json +0 -0
  633. {llama_stack-0.3.4 → llama_stack-0.3.5}/tests/integration/test_cases/inference/completion.json +0 -0
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.4
2
2
  Name: llama_stack
3
- Version: 0.3.4
3
+ Version: 0.3.5
4
4
  Summary: Llama Stack
5
5
  Author-email: Meta Llama <llama-oss@meta.com>
6
6
  License: MIT
@@ -22,7 +22,7 @@ Requires-Dist: fire
22
22
  Requires-Dist: httpx
23
23
  Requires-Dist: jinja2>=3.1.6
24
24
  Requires-Dist: jsonschema
25
- Requires-Dist: llama-stack-client>=0.3.4
25
+ Requires-Dist: llama-stack-client==0.3.5
26
26
  Requires-Dist: openai>=1.107
27
27
  Requires-Dist: prompt-toolkit
28
28
  Requires-Dist: python-dotenv
@@ -45,7 +45,7 @@ Requires-Dist: starlette>=0.49.1
45
45
  Provides-Extra: ui
46
46
  Requires-Dist: streamlit; extra == "ui"
47
47
  Requires-Dist: pandas; extra == "ui"
48
- Requires-Dist: llama-stack-client>=0.3.4; extra == "ui"
48
+ Requires-Dist: llama-stack-client==0.3.5; extra == "ui"
49
49
  Requires-Dist: streamlit-option-menu; extra == "ui"
50
50
  Dynamic: license-file
51
51
 
@@ -61,83 +61,6 @@ Dynamic: license-file
61
61
  [**Quick Start**](https://llamastack.github.io/docs/getting_started/quickstart) | [**Documentation**](https://llamastack.github.io/docs) | [**Colab Notebook**](./docs/getting_started.ipynb) | [**Discord**](https://discord.gg/llama-stack)
62
62
 
63
63
 
64
- ### ✨🎉 Llama 4 Support 🎉✨
65
- We released [Version 0.2.0](https://github.com/meta-llama/llama-stack/releases/tag/v0.2.0) with support for the Llama 4 herd of models released by Meta.
66
-
67
- <details>
68
-
69
- <summary>👋 Click here to see how to run Llama 4 models on Llama Stack </summary>
70
-
71
- \
72
- *Note you need 8xH100 GPU-host to run these models*
73
-
74
- ```bash
75
- pip install -U llama_stack
76
-
77
- MODEL="Llama-4-Scout-17B-16E-Instruct"
78
- # get meta url from llama.com
79
- huggingface-cli download meta-llama/$MODEL --local-dir ~/.llama/$MODEL
80
-
81
- # install dependencies for the distribution
82
- llama stack list-deps meta-reference-gpu | xargs -L1 uv pip install
83
-
84
- # start a llama stack server
85
- INFERENCE_MODEL=meta-llama/$MODEL llama stack run meta-reference-gpu
86
-
87
- # install client to interact with the server
88
- pip install llama-stack-client
89
- ```
90
- ### CLI
91
- ```bash
92
- # Run a chat completion
93
- MODEL="Llama-4-Scout-17B-16E-Instruct"
94
-
95
- llama-stack-client --endpoint http://localhost:8321 \
96
- inference chat-completion \
97
- --model-id meta-llama/$MODEL \
98
- --message "write a haiku for meta's llama 4 models"
99
-
100
- OpenAIChatCompletion(
101
- ...
102
- choices=[
103
- OpenAIChatCompletionChoice(
104
- finish_reason='stop',
105
- index=0,
106
- message=OpenAIChatCompletionChoiceMessageOpenAIAssistantMessageParam(
107
- role='assistant',
108
- content='...**Silent minds awaken,** \n**Whispers of billions of words,** \n**Reasoning breaks the night.** \n\n— \n*This haiku blends the essence of LLaMA 4\'s capabilities with nature-inspired metaphor, evoking its vast training data and transformative potential.*',
109
- ...
110
- ),
111
- ...
112
- )
113
- ],
114
- ...
115
- )
116
- ```
117
- ### Python SDK
118
- ```python
119
- from llama_stack_client import LlamaStackClient
120
-
121
- client = LlamaStackClient(base_url=f"http://localhost:8321")
122
-
123
- model_id = "meta-llama/Llama-4-Scout-17B-16E-Instruct"
124
- prompt = "Write a haiku about coding"
125
-
126
- print(f"User> {prompt}")
127
- response = client.chat.completions.create(
128
- model=model_id,
129
- messages=[
130
- {"role": "system", "content": "You are a helpful assistant."},
131
- {"role": "user", "content": prompt},
132
- ],
133
- )
134
- print(f"Assistant> {response.choices[0].message.content}")
135
- ```
136
- As more providers start supporting Llama 4, you can use them in Llama Stack as well. We are adding to the list. Stay tuned!
137
-
138
-
139
- </details>
140
-
141
64
  ### 🚀 One-Line Installer 🚀
142
65
 
143
66
  To try Llama Stack locally, run:
@@ -10,83 +10,6 @@
10
10
  [**Quick Start**](https://llamastack.github.io/docs/getting_started/quickstart) | [**Documentation**](https://llamastack.github.io/docs) | [**Colab Notebook**](./docs/getting_started.ipynb) | [**Discord**](https://discord.gg/llama-stack)
11
11
 
12
12
 
13
- ### ✨🎉 Llama 4 Support 🎉✨
14
- We released [Version 0.2.0](https://github.com/meta-llama/llama-stack/releases/tag/v0.2.0) with support for the Llama 4 herd of models released by Meta.
15
-
16
- <details>
17
-
18
- <summary>👋 Click here to see how to run Llama 4 models on Llama Stack </summary>
19
-
20
- \
21
- *Note you need 8xH100 GPU-host to run these models*
22
-
23
- ```bash
24
- pip install -U llama_stack
25
-
26
- MODEL="Llama-4-Scout-17B-16E-Instruct"
27
- # get meta url from llama.com
28
- huggingface-cli download meta-llama/$MODEL --local-dir ~/.llama/$MODEL
29
-
30
- # install dependencies for the distribution
31
- llama stack list-deps meta-reference-gpu | xargs -L1 uv pip install
32
-
33
- # start a llama stack server
34
- INFERENCE_MODEL=meta-llama/$MODEL llama stack run meta-reference-gpu
35
-
36
- # install client to interact with the server
37
- pip install llama-stack-client
38
- ```
39
- ### CLI
40
- ```bash
41
- # Run a chat completion
42
- MODEL="Llama-4-Scout-17B-16E-Instruct"
43
-
44
- llama-stack-client --endpoint http://localhost:8321 \
45
- inference chat-completion \
46
- --model-id meta-llama/$MODEL \
47
- --message "write a haiku for meta's llama 4 models"
48
-
49
- OpenAIChatCompletion(
50
- ...
51
- choices=[
52
- OpenAIChatCompletionChoice(
53
- finish_reason='stop',
54
- index=0,
55
- message=OpenAIChatCompletionChoiceMessageOpenAIAssistantMessageParam(
56
- role='assistant',
57
- content='...**Silent minds awaken,** \n**Whispers of billions of words,** \n**Reasoning breaks the night.** \n\n— \n*This haiku blends the essence of LLaMA 4\'s capabilities with nature-inspired metaphor, evoking its vast training data and transformative potential.*',
58
- ...
59
- ),
60
- ...
61
- )
62
- ],
63
- ...
64
- )
65
- ```
66
- ### Python SDK
67
- ```python
68
- from llama_stack_client import LlamaStackClient
69
-
70
- client = LlamaStackClient(base_url=f"http://localhost:8321")
71
-
72
- model_id = "meta-llama/Llama-4-Scout-17B-16E-Instruct"
73
- prompt = "Write a haiku about coding"
74
-
75
- print(f"User> {prompt}")
76
- response = client.chat.completions.create(
77
- model=model_id,
78
- messages=[
79
- {"role": "system", "content": "You are a helpful assistant."},
80
- {"role": "user", "content": prompt},
81
- ],
82
- )
83
- print(f"Assistant> {response.choices[0].message.content}")
84
- ```
85
- As more providers start supporting Llama 4, you can use them in Llama Stack as well. We are adding to the list. Stay tuned!
86
-
87
-
88
- </details>
89
-
90
13
  ### 🚀 One-Line Installer 🚀
91
14
 
92
15
  To try Llama Stack locally, run:
@@ -56,7 +56,7 @@ class InferenceStore:
56
56
  logger.debug("Write queue disabled for SQLite (WAL mode handles concurrency)")
57
57
 
58
58
  await self.sql_store.create_table(
59
- "chat_completions",
59
+ self.reference.table_name,
60
60
  {
61
61
  "id": ColumnDefinition(type=ColumnType.STRING, primary_key=True),
62
62
  "created": ColumnType.INTEGER,
@@ -66,14 +66,6 @@ class InferenceStore:
66
66
  },
67
67
  )
68
68
 
69
- if self.enable_write_queue:
70
- self._queue = asyncio.Queue(maxsize=self._max_write_queue_size)
71
- for _ in range(self._num_writers):
72
- self._worker_tasks.append(asyncio.create_task(self._worker_loop()))
73
- logger.debug(
74
- f"Inference store write queue enabled with {self._num_writers} writers, max queue size {self._max_write_queue_size}"
75
- )
76
-
77
69
  async def shutdown(self) -> None:
78
70
  if not self._worker_tasks:
79
71
  return
@@ -161,7 +153,7 @@ class InferenceStore:
161
153
 
162
154
  try:
163
155
  await self.sql_store.insert(
164
- table="chat_completions",
156
+ table=self.reference.table_name,
165
157
  data=record_data,
166
158
  )
167
159
  except IntegrityError as e:
@@ -173,7 +165,7 @@ class InferenceStore:
173
165
  error_message = str(e.orig) if e.orig else str(e)
174
166
  if self._is_unique_constraint_error(error_message):
175
167
  # Update the existing record instead
176
- await self.sql_store.update(table="chat_completions", data=record_data, where={"id": data["id"]})
168
+ await self.sql_store.update(table=self.reference.table_name, data=record_data, where={"id": data["id"]})
177
169
  else:
178
170
  # Re-raise if it's not a unique constraint error
179
171
  raise
@@ -217,7 +209,7 @@ class InferenceStore:
217
209
  where_conditions["model"] = model
218
210
 
219
211
  paginated_result = await self.sql_store.fetch_all(
220
- table="chat_completions",
212
+ table=self.reference.table_name,
221
213
  where=where_conditions if where_conditions else None,
222
214
  order_by=[("created", order.value)],
223
215
  cursor=("id", after) if after else None,
@@ -246,7 +238,7 @@ class InferenceStore:
246
238
  raise ValueError("Inference store is not initialized")
247
239
 
248
240
  row = await self.sql_store.fetch_one(
249
- table="chat_completions",
241
+ table=self.reference.table_name,
250
242
  where={"id": completion_id},
251
243
  )
252
244
 
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.4
2
2
  Name: llama_stack
3
- Version: 0.3.4
3
+ Version: 0.3.5
4
4
  Summary: Llama Stack
5
5
  Author-email: Meta Llama <llama-oss@meta.com>
6
6
  License: MIT
@@ -22,7 +22,7 @@ Requires-Dist: fire
22
22
  Requires-Dist: httpx
23
23
  Requires-Dist: jinja2>=3.1.6
24
24
  Requires-Dist: jsonschema
25
- Requires-Dist: llama-stack-client>=0.3.4
25
+ Requires-Dist: llama-stack-client==0.3.5
26
26
  Requires-Dist: openai>=1.107
27
27
  Requires-Dist: prompt-toolkit
28
28
  Requires-Dist: python-dotenv
@@ -45,7 +45,7 @@ Requires-Dist: starlette>=0.49.1
45
45
  Provides-Extra: ui
46
46
  Requires-Dist: streamlit; extra == "ui"
47
47
  Requires-Dist: pandas; extra == "ui"
48
- Requires-Dist: llama-stack-client>=0.3.4; extra == "ui"
48
+ Requires-Dist: llama-stack-client==0.3.5; extra == "ui"
49
49
  Requires-Dist: streamlit-option-menu; extra == "ui"
50
50
  Dynamic: license-file
51
51
 
@@ -61,83 +61,6 @@ Dynamic: license-file
61
61
  [**Quick Start**](https://llamastack.github.io/docs/getting_started/quickstart) | [**Documentation**](https://llamastack.github.io/docs) | [**Colab Notebook**](./docs/getting_started.ipynb) | [**Discord**](https://discord.gg/llama-stack)
62
62
 
63
63
 
64
- ### ✨🎉 Llama 4 Support 🎉✨
65
- We released [Version 0.2.0](https://github.com/meta-llama/llama-stack/releases/tag/v0.2.0) with support for the Llama 4 herd of models released by Meta.
66
-
67
- <details>
68
-
69
- <summary>👋 Click here to see how to run Llama 4 models on Llama Stack </summary>
70
-
71
- \
72
- *Note you need 8xH100 GPU-host to run these models*
73
-
74
- ```bash
75
- pip install -U llama_stack
76
-
77
- MODEL="Llama-4-Scout-17B-16E-Instruct"
78
- # get meta url from llama.com
79
- huggingface-cli download meta-llama/$MODEL --local-dir ~/.llama/$MODEL
80
-
81
- # install dependencies for the distribution
82
- llama stack list-deps meta-reference-gpu | xargs -L1 uv pip install
83
-
84
- # start a llama stack server
85
- INFERENCE_MODEL=meta-llama/$MODEL llama stack run meta-reference-gpu
86
-
87
- # install client to interact with the server
88
- pip install llama-stack-client
89
- ```
90
- ### CLI
91
- ```bash
92
- # Run a chat completion
93
- MODEL="Llama-4-Scout-17B-16E-Instruct"
94
-
95
- llama-stack-client --endpoint http://localhost:8321 \
96
- inference chat-completion \
97
- --model-id meta-llama/$MODEL \
98
- --message "write a haiku for meta's llama 4 models"
99
-
100
- OpenAIChatCompletion(
101
- ...
102
- choices=[
103
- OpenAIChatCompletionChoice(
104
- finish_reason='stop',
105
- index=0,
106
- message=OpenAIChatCompletionChoiceMessageOpenAIAssistantMessageParam(
107
- role='assistant',
108
- content='...**Silent minds awaken,** \n**Whispers of billions of words,** \n**Reasoning breaks the night.** \n\n— \n*This haiku blends the essence of LLaMA 4\'s capabilities with nature-inspired metaphor, evoking its vast training data and transformative potential.*',
109
- ...
110
- ),
111
- ...
112
- )
113
- ],
114
- ...
115
- )
116
- ```
117
- ### Python SDK
118
- ```python
119
- from llama_stack_client import LlamaStackClient
120
-
121
- client = LlamaStackClient(base_url=f"http://localhost:8321")
122
-
123
- model_id = "meta-llama/Llama-4-Scout-17B-16E-Instruct"
124
- prompt = "Write a haiku about coding"
125
-
126
- print(f"User> {prompt}")
127
- response = client.chat.completions.create(
128
- model=model_id,
129
- messages=[
130
- {"role": "system", "content": "You are a helpful assistant."},
131
- {"role": "user", "content": prompt},
132
- ],
133
- )
134
- print(f"Assistant> {response.choices[0].message.content}")
135
- ```
136
- As more providers start supporting Llama 4, you can use them in Llama Stack as well. We are adding to the list. Stay tuned!
137
-
138
-
139
- </details>
140
-
141
64
  ### 🚀 One-Line Installer 🚀
142
65
 
143
66
  To try Llama Stack locally, run:
@@ -4,7 +4,7 @@ fire
4
4
  httpx
5
5
  jinja2>=3.1.6
6
6
  jsonschema
7
- llama-stack-client>=0.3.4
7
+ llama-stack-client==0.3.5
8
8
  openai>=1.107
9
9
  prompt-toolkit
10
10
  python-dotenv
@@ -28,5 +28,5 @@ starlette>=0.49.1
28
28
  [ui]
29
29
  streamlit
30
30
  pandas
31
- llama-stack-client>=0.3.4
31
+ llama-stack-client==0.3.5
32
32
  streamlit-option-menu
@@ -7,7 +7,7 @@ required-version = ">=0.7.0"
7
7
 
8
8
  [project]
9
9
  name = "llama_stack"
10
- version = "0.3.4"
10
+ version = "0.3.5"
11
11
  authors = [{ name = "Meta Llama", email = "llama-oss@meta.com" }]
12
12
  description = "Llama Stack"
13
13
  readme = "README.md"
@@ -30,7 +30,7 @@ dependencies = [
30
30
  "httpx",
31
31
  "jinja2>=3.1.6",
32
32
  "jsonschema",
33
- "llama-stack-client>=0.3.4",
33
+ "llama-stack-client==0.3.5",
34
34
  "openai>=1.107", # for expires_after support
35
35
  "prompt-toolkit",
36
36
  "python-dotenv",
@@ -56,7 +56,7 @@ dependencies = [
56
56
  ui = [
57
57
  "streamlit",
58
58
  "pandas",
59
- "llama-stack-client>=0.3.4",
59
+ "llama-stack-client==0.3.5",
60
60
  "streamlit-option-menu",
61
61
  ]
62
62
 
File without changes
File without changes