npm - llama-stack-client - Versions diffs - 0.6.1 → 0.7.1 - Mend

llama-stack-client 0.6.1 → 0.7.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (332) hide show

package/.github/workflows/ci.yml +16 -10
package/.gitignore +1 -0
package/.release-please-manifest.json +1 -1
package/.stats.yml +4 -4
package/CHANGELOG.md +80 -0
package/CONTRIBUTING.md +2 -2
package/README.md +22 -0
package/api.md +1 -71
package/dist/CHANGELOG.md +80 -0
package/dist/README.md +22 -0
package/dist/core.d.ts +1 -1
package/dist/core.d.ts.map +1 -1
package/dist/core.js +8 -17
package/dist/core.js.map +1 -1
package/dist/core.mjs +8 -17
package/dist/core.mjs.map +1 -1
package/dist/index.d.mts +51 -12
package/dist/index.d.ts +51 -12
package/dist/index.d.ts.map +1 -1
package/dist/index.js +50 -11
package/dist/index.js.map +1 -1
package/dist/index.mjs +50 -11
package/dist/index.mjs.map +1 -1
package/dist/internal/utils/query.d.ts +2 -0
package/dist/internal/utils/query.d.ts.map +1 -0
package/dist/{resources/alpha/post-training/post-training.js → internal/utils/query.js} +6 -24
package/dist/internal/utils/query.js.map +1 -0
package/dist/{resources/alpha/post-training.mjs → internal/utils/query.mjs} +5 -2
package/dist/internal/utils/query.mjs.map +1 -0
package/dist/package.json +1 -1
package/dist/resources/alpha/alpha.d.ts +0 -4
package/dist/resources/alpha/alpha.d.ts.map +1 -1
package/dist/resources/alpha/alpha.js +0 -4
package/dist/resources/alpha/alpha.js.map +1 -1
package/dist/resources/alpha/alpha.mjs +0 -4
package/dist/resources/alpha/alpha.mjs.map +1 -1
package/dist/resources/alpha/eval/eval.d.ts +3 -0
package/dist/resources/alpha/eval/eval.d.ts.map +1 -1
package/dist/resources/alpha/eval/eval.js +3 -0
package/dist/resources/alpha/eval/eval.js.map +1 -1
package/dist/resources/alpha/eval/eval.mjs +3 -0
package/dist/resources/alpha/eval/eval.mjs.map +1 -1
package/dist/resources/alpha/eval/jobs.d.ts +3 -0
package/dist/resources/alpha/eval/jobs.d.ts.map +1 -1
package/dist/resources/alpha/eval/jobs.js +3 -0
package/dist/resources/alpha/eval/jobs.js.map +1 -1
package/dist/resources/alpha/eval/jobs.mjs +3 -0
package/dist/resources/alpha/eval/jobs.mjs.map +1 -1
package/dist/resources/alpha/index.d.ts +0 -1
package/dist/resources/alpha/index.d.ts.map +1 -1
package/dist/resources/alpha/index.js +1 -3
package/dist/resources/alpha/index.js.map +1 -1
package/dist/resources/alpha/index.mjs +0 -1
package/dist/resources/alpha/index.mjs.map +1 -1
package/dist/resources/alpha/inference.d.ts +8 -0
package/dist/resources/alpha/inference.d.ts.map +1 -1
package/dist/resources/alpha/inference.js +8 -0
package/dist/resources/alpha/inference.js.map +1 -1
package/dist/resources/alpha/inference.mjs +8 -0
package/dist/resources/alpha/inference.mjs.map +1 -1
package/dist/resources/batches.d.ts +8 -0
package/dist/resources/batches.d.ts.map +1 -1
package/dist/resources/batches.js +8 -0
package/dist/resources/batches.js.map +1 -1
package/dist/resources/batches.mjs +8 -0
package/dist/resources/batches.mjs.map +1 -1
package/dist/resources/beta/datasets.d.ts +4 -8
package/dist/resources/beta/datasets.d.ts.map +1 -1
package/dist/resources/chat/chat.d.ts +34 -32
package/dist/resources/chat/chat.d.ts.map +1 -1
package/dist/resources/chat/chat.js.map +1 -1
package/dist/resources/chat/chat.mjs.map +1 -1
package/dist/resources/chat/completions.d.ts +321 -713
package/dist/resources/chat/completions.d.ts.map +1 -1
package/dist/resources/chat/completions.js +8 -0
package/dist/resources/chat/completions.js.map +1 -1
package/dist/resources/chat/completions.mjs +8 -0
package/dist/resources/chat/completions.mjs.map +1 -1
package/dist/resources/completions.d.ts +10 -4
package/dist/resources/completions.d.ts.map +1 -1
package/dist/resources/completions.js +8 -0
package/dist/resources/completions.js.map +1 -1
package/dist/resources/completions.mjs +8 -0
package/dist/resources/completions.mjs.map +1 -1
package/dist/resources/conversations/conversations.d.ts +95 -2
package/dist/resources/conversations/conversations.d.ts.map +1 -1
package/dist/resources/conversations/conversations.js +3 -0
package/dist/resources/conversations/conversations.js.map +1 -1
package/dist/resources/conversations/conversations.mjs +3 -0
package/dist/resources/conversations/conversations.mjs.map +1 -1
package/dist/resources/conversations/items.d.ts +371 -8
package/dist/resources/conversations/items.d.ts.map +1 -1
package/dist/resources/conversations/items.js +3 -0
package/dist/resources/conversations/items.js.map +1 -1
package/dist/resources/conversations/items.mjs +3 -0
package/dist/resources/conversations/items.mjs.map +1 -1
package/dist/resources/embeddings.d.ts +8 -0
package/dist/resources/embeddings.d.ts.map +1 -1
package/dist/resources/embeddings.js +8 -0
package/dist/resources/embeddings.js.map +1 -1
package/dist/resources/embeddings.mjs +8 -0
package/dist/resources/embeddings.mjs.map +1 -1
package/dist/resources/files.d.ts +11 -8
package/dist/resources/files.d.ts.map +1 -1
package/dist/resources/files.js +3 -0
package/dist/resources/files.js.map +1 -1
package/dist/resources/files.mjs +3 -0
package/dist/resources/files.mjs.map +1 -1
package/dist/resources/index.d.ts +1 -4
package/dist/resources/index.d.ts.map +1 -1
package/dist/resources/index.js +1 -7
package/dist/resources/index.js.map +1 -1
package/dist/resources/index.mjs +0 -3
package/dist/resources/index.mjs.map +1 -1
package/dist/resources/inspect.d.ts +3 -0
package/dist/resources/inspect.d.ts.map +1 -1
package/dist/resources/inspect.js +3 -0
package/dist/resources/inspect.js.map +1 -1
package/dist/resources/inspect.mjs +3 -0
package/dist/resources/inspect.mjs.map +1 -1
package/dist/resources/models/index.d.ts +1 -1
package/dist/resources/models/index.d.ts.map +1 -1
package/dist/resources/models/index.js.map +1 -1
package/dist/resources/models/index.mjs.map +1 -1
package/dist/resources/models/models.d.ts +7 -65
package/dist/resources/models/models.d.ts.map +1 -1
package/dist/resources/models/models.js +0 -19
package/dist/resources/models/models.js.map +1 -1
package/dist/resources/models/models.mjs +0 -19
package/dist/resources/models/models.mjs.map +1 -1
package/dist/resources/moderations.d.ts +3 -0
package/dist/resources/moderations.d.ts.map +1 -1
package/dist/resources/moderations.js +3 -0
package/dist/resources/moderations.js.map +1 -1
package/dist/resources/moderations.mjs +3 -0
package/dist/resources/moderations.mjs.map +1 -1
package/dist/resources/prompts/prompts.d.ts +3 -0
package/dist/resources/prompts/prompts.d.ts.map +1 -1
package/dist/resources/prompts/prompts.js +3 -0
package/dist/resources/prompts/prompts.js.map +1 -1
package/dist/resources/prompts/prompts.mjs +3 -0
package/dist/resources/prompts/prompts.mjs.map +1 -1
package/dist/resources/prompts/versions.d.ts +3 -0
package/dist/resources/prompts/versions.d.ts.map +1 -1
package/dist/resources/prompts/versions.js +3 -0
package/dist/resources/prompts/versions.js.map +1 -1
package/dist/resources/prompts/versions.mjs +3 -0
package/dist/resources/prompts/versions.mjs.map +1 -1
package/dist/resources/providers.d.ts +3 -0
package/dist/resources/providers.d.ts.map +1 -1
package/dist/resources/providers.js +3 -0
package/dist/resources/providers.js.map +1 -1
package/dist/resources/providers.mjs +3 -0
package/dist/resources/providers.mjs.map +1 -1
package/dist/resources/responses/input-items.d.ts +102 -3
package/dist/resources/responses/input-items.d.ts.map +1 -1
package/dist/resources/responses/responses.d.ts +582 -11
package/dist/resources/responses/responses.d.ts.map +1 -1
package/dist/resources/responses/responses.js.map +1 -1
package/dist/resources/responses/responses.mjs.map +1 -1
package/dist/resources/routes.d.ts +3 -0
package/dist/resources/routes.d.ts.map +1 -1
package/dist/resources/routes.js +3 -0
package/dist/resources/routes.js.map +1 -1
package/dist/resources/routes.mjs +3 -0
package/dist/resources/routes.mjs.map +1 -1
package/dist/resources/safety.d.ts +14 -11
package/dist/resources/safety.d.ts.map +1 -1
package/dist/resources/safety.js +3 -0
package/dist/resources/safety.js.map +1 -1
package/dist/resources/safety.mjs +3 -0
package/dist/resources/safety.mjs.map +1 -1
package/dist/resources/vector-io.d.ts +4 -4
package/dist/resources/vector-stores/file-batches.d.ts +49 -1
package/dist/resources/vector-stores/file-batches.d.ts.map +1 -1
package/dist/resources/vector-stores/file-batches.js.map +1 -1
package/dist/resources/vector-stores/file-batches.mjs.map +1 -1
package/dist/resources/vector-stores/files.d.ts +100 -4
package/dist/resources/vector-stores/files.d.ts.map +1 -1
package/dist/resources/vector-stores/files.js.map +1 -1
package/dist/resources/vector-stores/files.mjs.map +1 -1
package/dist/resources/vector-stores/vector-stores.d.ts +51 -3
package/dist/resources/vector-stores/vector-stores.d.ts.map +1 -1
package/dist/resources/vector-stores/vector-stores.js.map +1 -1
package/dist/resources/vector-stores/vector-stores.mjs.map +1 -1
package/dist/src/core.ts +10 -21
package/dist/src/index.ts +51 -48
package/{src/resources/alpha/post-training.ts → dist/src/internal/utils/query.ts} +5 -1
package/dist/src/resources/alpha/alpha.ts +0 -20
package/dist/src/resources/alpha/eval/eval.ts +3 -0
package/dist/src/resources/alpha/eval/jobs.ts +3 -0
package/dist/src/resources/alpha/index.ts +0 -8
package/dist/src/resources/alpha/inference.ts +8 -0
package/dist/src/resources/batches.ts +8 -0
package/dist/src/resources/beta/datasets.ts +4 -9
package/dist/src/resources/chat/chat.ts +36 -33
package/dist/src/resources/chat/completions.ts +307 -811
package/dist/src/resources/completions.ts +10 -4
package/dist/src/resources/conversations/conversations.ts +121 -1
package/dist/src/resources/conversations/items.ts +477 -6
package/dist/src/resources/embeddings.ts +8 -0
package/dist/src/resources/files.ts +12 -9
package/dist/src/resources/index.ts +0 -18
package/dist/src/resources/inspect.ts +3 -0
package/dist/src/resources/models/index.ts +0 -2
package/dist/src/resources/models/models.ts +7 -82
package/dist/src/resources/moderations.ts +3 -0
package/dist/src/resources/prompts/prompts.ts +3 -0
package/dist/src/resources/prompts/versions.ts +3 -0
package/dist/src/resources/providers.ts +3 -0
package/dist/src/resources/responses/input-items.ts +128 -2
package/dist/src/resources/responses/responses.ts +706 -7
package/dist/src/resources/routes.ts +3 -0
package/dist/src/resources/safety.ts +15 -12
package/dist/src/resources/vector-io.ts +4 -4
package/dist/src/resources/vector-stores/file-batches.ts +57 -0
package/dist/src/resources/vector-stores/files.ts +117 -3
package/dist/src/resources/vector-stores/vector-stores.ts +59 -2
package/dist/src/streaming.ts +24 -6
package/dist/src/version.ts +1 -1
package/dist/streaming.d.ts.map +1 -1
package/dist/streaming.js +21 -6
package/dist/streaming.js.map +1 -1
package/dist/streaming.mjs +21 -6
package/dist/streaming.mjs.map +1 -1
package/dist/version.d.ts +1 -1
package/dist/version.js +1 -1
package/dist/version.mjs +1 -1
package/package.json +1 -1
package/scripts/mock +21 -10
package/scripts/test +8 -8
package/src/core.ts +10 -21
package/src/index.ts +51 -48
package/{dist/src/resources/alpha/post-training.ts → src/internal/utils/query.ts} +5 -1
package/src/resources/alpha/alpha.ts +0 -20
package/src/resources/alpha/eval/eval.ts +3 -0
package/src/resources/alpha/eval/jobs.ts +3 -0
package/src/resources/alpha/index.ts +0 -8
package/src/resources/alpha/inference.ts +8 -0
package/src/resources/batches.ts +8 -0
package/src/resources/beta/datasets.ts +4 -9
package/src/resources/chat/chat.ts +36 -33
package/src/resources/chat/completions.ts +307 -811
package/src/resources/completions.ts +10 -4
package/src/resources/conversations/conversations.ts +121 -1
package/src/resources/conversations/items.ts +477 -6
package/src/resources/embeddings.ts +8 -0
package/src/resources/files.ts +12 -9
package/src/resources/index.ts +0 -18
package/src/resources/inspect.ts +3 -0
package/src/resources/models/index.ts +0 -2
package/src/resources/models/models.ts +7 -82
package/src/resources/moderations.ts +3 -0
package/src/resources/prompts/prompts.ts +3 -0
package/src/resources/prompts/versions.ts +3 -0
package/src/resources/providers.ts +3 -0
package/src/resources/responses/input-items.ts +128 -2
package/src/resources/responses/responses.ts +706 -7
package/src/resources/routes.ts +3 -0
package/src/resources/safety.ts +15 -12
package/src/resources/vector-io.ts +4 -4
package/src/resources/vector-stores/file-batches.ts +57 -0
package/src/resources/vector-stores/files.ts +117 -3
package/src/resources/vector-stores/vector-stores.ts +59 -2
package/src/streaming.ts +24 -6
package/src/version.ts +1 -1
package/tests/api-resources/beta/datasets.test.ts +4 -10
package/tests/api-resources/chat/completions.test.ts +2 -0
package/tests/api-resources/files.test.ts +2 -2
package/tests/api-resources/models/models.test.ts +0 -39
package/tests/api-resources/responses/responses.test.ts +10 -1
package/tests/api-resources/vector-stores/file-batches.test.ts +1 -1
package/tests/api-resources/vector-stores/files.test.ts +1 -1
package/tests/api-resources/vector-stores/vector-stores.test.ts +1 -1
package/tests/stringifyQuery.test.ts +2 -4
package/dist/resources/alpha/post-training/index.d.ts +0 -3
package/dist/resources/alpha/post-training/index.d.ts.map +0 -1
package/dist/resources/alpha/post-training/index.js +0 -15
package/dist/resources/alpha/post-training/index.js.map +0 -1
package/dist/resources/alpha/post-training/index.mjs +0 -10
package/dist/resources/alpha/post-training/index.mjs.map +0 -1
package/dist/resources/alpha/post-training/job.d.ts +0 -104
package/dist/resources/alpha/post-training/job.d.ts.map +0 -1
package/dist/resources/alpha/post-training/job.js +0 -42
package/dist/resources/alpha/post-training/job.js.map +0 -1
package/dist/resources/alpha/post-training/job.mjs +0 -38
package/dist/resources/alpha/post-training/job.mjs.map +0 -1
package/dist/resources/alpha/post-training/post-training.d.ts +0 -269
package/dist/resources/alpha/post-training/post-training.d.ts.map +0 -1
package/dist/resources/alpha/post-training/post-training.js.map +0 -1
package/dist/resources/alpha/post-training/post-training.mjs +0 -30
package/dist/resources/alpha/post-training/post-training.mjs.map +0 -1
package/dist/resources/alpha/post-training.d.ts +0 -2
package/dist/resources/alpha/post-training.d.ts.map +0 -1
package/dist/resources/alpha/post-training.js +0 -25
package/dist/resources/alpha/post-training.js.map +0 -1
package/dist/resources/alpha/post-training.mjs.map +0 -1
package/dist/resources/tool-runtime.d.ts +0 -152
package/dist/resources/tool-runtime.d.ts.map +0 -1
package/dist/resources/tool-runtime.js +0 -30
package/dist/resources/tool-runtime.js.map +0 -1
package/dist/resources/tool-runtime.mjs +0 -26
package/dist/resources/tool-runtime.mjs.map +0 -1
package/dist/resources/toolgroups.d.ts +0 -91
package/dist/resources/toolgroups.d.ts.map +0 -1
package/dist/resources/toolgroups.js +0 -54
package/dist/resources/toolgroups.js.map +0 -1
package/dist/resources/toolgroups.mjs +0 -50
package/dist/resources/toolgroups.mjs.map +0 -1
package/dist/resources/tools.d.ts +0 -26
package/dist/resources/tools.d.ts.map +0 -1
package/dist/resources/tools.js +0 -30
package/dist/resources/tools.js.map +0 -1
package/dist/resources/tools.mjs +0 -26
package/dist/resources/tools.mjs.map +0 -1
package/dist/src/resources/alpha/post-training/index.ts +0 -17
package/dist/src/resources/alpha/post-training/job.ts +0 -161
package/dist/src/resources/alpha/post-training/post-training.ts +0 -385
package/dist/src/resources/tool-runtime.ts +0 -217
package/dist/src/resources/toolgroups.ts +0 -135
package/dist/src/resources/tools.ts +0 -52
package/src/resources/alpha/post-training/index.ts +0 -17
package/src/resources/alpha/post-training/job.ts +0 -161
package/src/resources/alpha/post-training/post-training.ts +0 -385
package/src/resources/tool-runtime.ts +0 -217
package/src/resources/toolgroups.ts +0 -135
package/src/resources/tools.ts +0 -52
package/tests/api-resources/alpha/post-training/job.test.ts +0 -86
package/tests/api-resources/alpha/post-training/post-training.test.ts +0 -134
package/tests/api-resources/tool-runtime.test.ts +0 -68
package/tests/api-resources/toolgroups.test.ts +0 -91
package/tests/api-resources/tools.test.ts +0 -57

package/src/resources/routes.ts CHANGED Viewed

@@ -11,6 +11,9 @@ import { isRequestOptions } from '../core';
 import * as Core from '../core';
 import * as Shared from './shared';
+/**
+ * APIs for inspecting the Llama Stack service, including health status, available API routes with methods and implementing providers.
+ */
 export class Routes extends APIResource {
   /**
    * List all available API routes with their methods and implementing providers.

package/src/resources/safety.ts CHANGED Viewed

@@ -10,6 +10,9 @@ import { APIResource } from '../resource';
 import * as Core from '../core';
 import * as Shared from './shared';
+/**
+ * OpenAI-compatible Moderations API.
+ */
 export class Safety extends APIResource {
   /**
    * Run a safety shield on messages to check for policy violations.
@@ -122,6 +125,9 @@ export namespace SafetyRunShieldParams {
       }
     }
+    /**
+     * File content part for OpenAI-compatible chat completion messages.
+     */
     export interface OpenAIFile {
       /**
        * File specification.
@@ -222,6 +228,8 @@ export namespace SafetyRunShieldParams {
      * List of tool calls. Each tool call is an OpenAIChatCompletionToolCall object.
      */
     tool_calls?: Array<OpenAIAssistantMessageParamInput.ToolCall> | null;
+    [k: string]: unknown;
   }
   export namespace OpenAIAssistantMessageParamInput {
@@ -247,38 +255,33 @@ export namespace SafetyRunShieldParams {
       /**
        * Unique identifier for the tool call.
        */
-      id?: string | null;
-      /**
-       * Function call details for OpenAI-compatible tool calls.
-       */
-      function?: ToolCall.Function | null;
+      id: string;
       /**
-       * Index of the tool call in the list.
+       * Function call details.
        */
-      index?: number | null;
+      function: ToolCall.Function;
       /**
        * Must be 'function' to identify this as a function call.
        */
-      type?: 'function';
+      type: 'function';
     }
     export namespace ToolCall {
       /**
-       * Function call details for OpenAI-compatible tool calls.
+       * Function call details.
        */
       export interface Function {
         /**
          * Arguments to pass to the function as a JSON string.
          */
-        arguments?: string | null;
+        arguments: string;
         /**
          * Name of the function to call.
          */
-        name?: string | null;
+        name: string;
       }
     }
   }

package/src/resources/vector-io.ts CHANGED Viewed

@@ -50,7 +50,7 @@ export namespace QueryChunksResponse {
      * `ChunkMetadata` is backend metadata for a `Chunk` that is used to store
      * additional information about the chunk that will not be used in the context
      * during inference, but is required for backend functionality. The `ChunkMetadata`
-     * is set during chunk creation in `MemoryToolRuntimeImpl().insert()`and is not
+     * is set during chunk creation in `FileSearchToolRuntimeImpl().insert()`and is not
      * expected to change after. Use `Chunk.metadata` for metadata that will be used in
      * the context during inference.
      */
@@ -79,7 +79,7 @@ export namespace QueryChunksResponse {
      * `ChunkMetadata` is backend metadata for a `Chunk` that is used to store
      * additional information about the chunk that will not be used in the context
      * during inference, but is required for backend functionality. The `ChunkMetadata`
-     * is set during chunk creation in `MemoryToolRuntimeImpl().insert()`and is not
+     * is set during chunk creation in `FileSearchToolRuntimeImpl().insert()`and is not
      * expected to change after. Use `Chunk.metadata` for metadata that will be used in
      * the context during inference.
      */
@@ -222,7 +222,7 @@ export namespace VectorIoInsertParams {
      * `ChunkMetadata` is backend metadata for a `Chunk` that is used to store
      * additional information about the chunk that will not be used in the context
      * during inference, but is required for backend functionality. The `ChunkMetadata`
-     * is set during chunk creation in `MemoryToolRuntimeImpl().insert()`and is not
+     * is set during chunk creation in `FileSearchToolRuntimeImpl().insert()`and is not
      * expected to change after. Use `Chunk.metadata` for metadata that will be used in
      * the context during inference.
      */
@@ -251,7 +251,7 @@ export namespace VectorIoInsertParams {
      * `ChunkMetadata` is backend metadata for a `Chunk` that is used to store
      * additional information about the chunk that will not be used in the context
      * during inference, but is required for backend functionality. The `ChunkMetadata`
-     * is set during chunk creation in `MemoryToolRuntimeImpl().insert()`and is not
+     * is set during chunk creation in `FileSearchToolRuntimeImpl().insert()`and is not
      * expected to change after. Use `Chunk.metadata` for metadata that will be used in
      * the context during inference.
      */

package/src/resources/vector-stores/file-batches.ts CHANGED Viewed

@@ -141,6 +141,7 @@ export interface FileBatchCreateParams {
   chunking_strategy?:
     | FileBatchCreateParams.VectorStoreChunkingStrategyAuto
     | FileBatchCreateParams.VectorStoreChunkingStrategyStatic
+    | FileBatchCreateParams.VectorStoreChunkingStrategyContextual
     | null;
   [k: string]: unknown;
@@ -176,6 +177,62 @@ export namespace FileBatchCreateParams {
       max_chunk_size_tokens?: number;
     }
   }
+  /**
+   * Contextual chunking strategy that uses an LLM to situate chunks within the
+   * document.
+   */
+  export interface VectorStoreChunkingStrategyContextual {
+    /**
+     * Configuration for contextual chunking.
+     */
+    contextual: VectorStoreChunkingStrategyContextual.Contextual;
+    /**
+     * Strategy type identifier.
+     */
+    type?: 'contextual';
+  }
+  export namespace VectorStoreChunkingStrategyContextual {
+    /**
+     * Configuration for contextual chunking.
+     */
+    export interface Contextual {
+      /**
+       * Tokens to overlap between adjacent chunks. Must be less than
+       * max_chunk_size_tokens.
+       */
+      chunk_overlap_tokens?: number;
+      /**
+       * Prompt template for contextual retrieval. Uses WHOLE_DOCUMENT and CHUNK_CONTENT
+       * placeholders wrapped in double curly braces.
+       */
+      context_prompt?: string;
+      /**
+       * Maximum tokens per chunk. Suggested ~700 to allow room for prepended context.
+       */
+      max_chunk_size_tokens?: number;
+      /**
+       * Maximum concurrent LLM calls. Falls back to config default if not provided.
+       */
+      max_concurrency?: number | null;
+      /**
+       * LLM model for generating context. Falls back to
+       * VectorStoresConfig.contextual_retrieval_params.model if not provided.
+       */
+      model_id?: string | null;
+      /**
+       * Timeout per LLM call in seconds. Falls back to config default if not provided.
+       */
+      timeout_seconds?: number | null;
+    }
+  }
 }
 export interface FileBatchListFilesParams extends OpenAICursorPageParams {

package/src/resources/vector-stores/files.ts CHANGED Viewed

@@ -127,7 +127,8 @@ export interface VectorStoreFile {
    */
   chunking_strategy:
     | VectorStoreFile.VectorStoreChunkingStrategyAuto
-    | VectorStoreFile.VectorStoreChunkingStrategyStatic;
+    | VectorStoreFile.VectorStoreChunkingStrategyStatic
+    | VectorStoreFile.VectorStoreChunkingStrategyContextual;
   created_at: number;
@@ -185,6 +186,62 @@ export namespace VectorStoreFile {
     }
   }
+  /**
+   * Contextual chunking strategy that uses an LLM to situate chunks within the
+   * document.
+   */
+  export interface VectorStoreChunkingStrategyContextual {
+    /**
+     * Configuration for contextual chunking.
+     */
+    contextual: VectorStoreChunkingStrategyContextual.Contextual;
+    /**
+     * Strategy type identifier.
+     */
+    type?: 'contextual';
+  }
+  export namespace VectorStoreChunkingStrategyContextual {
+    /**
+     * Configuration for contextual chunking.
+     */
+    export interface Contextual {
+      /**
+       * Tokens to overlap between adjacent chunks. Must be less than
+       * max_chunk_size_tokens.
+       */
+      chunk_overlap_tokens?: number;
+      /**
+       * Prompt template for contextual retrieval. Uses WHOLE_DOCUMENT and CHUNK_CONTENT
+       * placeholders wrapped in double curly braces.
+       */
+      context_prompt?: string;
+      /**
+       * Maximum tokens per chunk. Suggested ~700 to allow room for prepended context.
+       */
+      max_chunk_size_tokens?: number;
+      /**
+       * Maximum concurrent LLM calls. Falls back to config default if not provided.
+       */
+      max_concurrency?: number | null;
+      /**
+       * LLM model for generating context. Falls back to
+       * VectorStoresConfig.contextual_retrieval_params.model if not provided.
+       */
+      model_id?: string | null;
+      /**
+       * Timeout per LLM call in seconds. Falls back to config default if not provided.
+       */
+      timeout_seconds?: number | null;
+    }
+  }
   /**
    * Error information for failed vector store file processing.
    */
@@ -232,7 +289,7 @@ export namespace FileContentResponse {
      * `ChunkMetadata` is backend metadata for a `Chunk` that is used to store
      * additional information about the chunk that will not be used in the context
      * during inference, but is required for backend functionality. The `ChunkMetadata`
-     * is set during chunk creation in `MemoryToolRuntimeImpl().insert()`and is not
+     * is set during chunk creation in `FileSearchToolRuntimeImpl().insert()`and is not
      * expected to change after. Use `Chunk.metadata` for metadata that will be used in
      * the context during inference.
      */
@@ -248,7 +305,7 @@ export namespace FileContentResponse {
      * `ChunkMetadata` is backend metadata for a `Chunk` that is used to store
      * additional information about the chunk that will not be used in the context
      * during inference, but is required for backend functionality. The `ChunkMetadata`
-     * is set during chunk creation in `MemoryToolRuntimeImpl().insert()`and is not
+     * is set during chunk creation in `FileSearchToolRuntimeImpl().insert()`and is not
      * expected to change after. Use `Chunk.metadata` for metadata that will be used in
      * the context during inference.
      */
@@ -291,6 +348,7 @@ export interface FileCreateParams {
   chunking_strategy?:
     | FileCreateParams.VectorStoreChunkingStrategyAuto
     | FileCreateParams.VectorStoreChunkingStrategyStatic
+    | FileCreateParams.VectorStoreChunkingStrategyContextual
     | null;
 }
@@ -324,6 +382,62 @@ export namespace FileCreateParams {
       max_chunk_size_tokens?: number;
     }
   }
+  /**
+   * Contextual chunking strategy that uses an LLM to situate chunks within the
+   * document.
+   */
+  export interface VectorStoreChunkingStrategyContextual {
+    /**
+     * Configuration for contextual chunking.
+     */
+    contextual: VectorStoreChunkingStrategyContextual.Contextual;
+    /**
+     * Strategy type identifier.
+     */
+    type?: 'contextual';
+  }
+  export namespace VectorStoreChunkingStrategyContextual {
+    /**
+     * Configuration for contextual chunking.
+     */
+    export interface Contextual {
+      /**
+       * Tokens to overlap between adjacent chunks. Must be less than
+       * max_chunk_size_tokens.
+       */
+      chunk_overlap_tokens?: number;
+      /**
+       * Prompt template for contextual retrieval. Uses WHOLE_DOCUMENT and CHUNK_CONTENT
+       * placeholders wrapped in double curly braces.
+       */
+      context_prompt?: string;
+      /**
+       * Maximum tokens per chunk. Suggested ~700 to allow room for prepended context.
+       */
+      max_chunk_size_tokens?: number;
+      /**
+       * Maximum concurrent LLM calls. Falls back to config default if not provided.
+       */
+      max_concurrency?: number | null;
+      /**
+       * LLM model for generating context. Falls back to
+       * VectorStoresConfig.contextual_retrieval_params.model if not provided.
+       */
+      model_id?: string | null;
+      /**
+       * Timeout per LLM call in seconds. Falls back to config default if not provided.
+       */
+      timeout_seconds?: number | null;
+    }
+  }
 }
 export interface FileUpdateParams {

package/src/resources/vector-stores/vector-stores.ts CHANGED Viewed

@@ -216,7 +216,7 @@ export namespace VectorStoreSearchResponse {
        * `ChunkMetadata` is backend metadata for a `Chunk` that is used to store
        * additional information about the chunk that will not be used in the context
        * during inference, but is required for backend functionality. The `ChunkMetadata`
-       * is set during chunk creation in `MemoryToolRuntimeImpl().insert()`and is not
+       * is set during chunk creation in `FileSearchToolRuntimeImpl().insert()`and is not
        * expected to change after. Use `Chunk.metadata` for metadata that will be used in
        * the context during inference.
        */
@@ -232,7 +232,7 @@ export namespace VectorStoreSearchResponse {
        * `ChunkMetadata` is backend metadata for a `Chunk` that is used to store
        * additional information about the chunk that will not be used in the context
        * during inference, but is required for backend functionality. The `ChunkMetadata`
-       * is set during chunk creation in `MemoryToolRuntimeImpl().insert()`and is not
+       * is set during chunk creation in `FileSearchToolRuntimeImpl().insert()`and is not
        * expected to change after. Use `Chunk.metadata` for metadata that will be used in
        * the context during inference.
        */
@@ -266,6 +266,7 @@ export interface VectorStoreCreateParams {
   chunking_strategy?:
     | VectorStoreCreateParams.VectorStoreChunkingStrategyAuto
     | VectorStoreCreateParams.VectorStoreChunkingStrategyStatic
+    | VectorStoreCreateParams.VectorStoreChunkingStrategyContextual
     | null;
   expires_after?: { [key: string]: unknown } | null;
@@ -309,6 +310,62 @@ export namespace VectorStoreCreateParams {
       max_chunk_size_tokens?: number;
     }
   }
+  /**
+   * Contextual chunking strategy that uses an LLM to situate chunks within the
+   * document.
+   */
+  export interface VectorStoreChunkingStrategyContextual {
+    /**
+     * Configuration for contextual chunking.
+     */
+    contextual: VectorStoreChunkingStrategyContextual.Contextual;
+    /**
+     * Strategy type identifier.
+     */
+    type?: 'contextual';
+  }
+  export namespace VectorStoreChunkingStrategyContextual {
+    /**
+     * Configuration for contextual chunking.
+     */
+    export interface Contextual {
+      /**
+       * Tokens to overlap between adjacent chunks. Must be less than
+       * max_chunk_size_tokens.
+       */
+      chunk_overlap_tokens?: number;
+      /**
+       * Prompt template for contextual retrieval. Uses WHOLE_DOCUMENT and CHUNK_CONTENT
+       * placeholders wrapped in double curly braces.
+       */
+      context_prompt?: string;
+      /**
+       * Maximum tokens per chunk. Suggested ~700 to allow room for prepended context.
+       */
+      max_chunk_size_tokens?: number;
+      /**
+       * Maximum concurrent LLM calls. Falls back to config default if not provided.
+       */
+      max_concurrency?: number | null;
+      /**
+       * LLM model for generating context. Falls back to
+       * VectorStoresConfig.contextual_retrieval_params.model if not provided.
+       */
+      model_id?: string | null;
+      /**
+       * Timeout per LLM call in seconds. Falls back to config default if not provided.
+       */
+      timeout_seconds?: number | null;
+    }
+  }
 }
 export interface VectorStoreUpdateParams {

package/src/streaming.ts CHANGED Viewed

@@ -9,6 +9,9 @@ import { LlamaStackClientError } from './error';
 import { findDoubleNewlineIndex, LineDecoder } from './internal/decoders/line';
 import { ReadableStreamToAsyncIterable } from './internal/stream-utils';
+import { createResponseHeaders } from './core';
+import { APIError } from './error';
 type Bytes = string | ArrayBuffer | Uint8Array | Buffer | null | undefined;
 export type ServerSentEvent = {
@@ -38,12 +41,27 @@ export class Stream<Item> implements AsyncIterable<Item> {
       let done = false;
       try {
         for await (const sse of _iterSSEMessages(response, controller)) {
-          try {
-            yield JSON.parse(sse.data);
-          } catch (e) {
-            console.error(`Could not parse message into JSON:`, sse.data);
-            console.error(`From chunk:`, sse.raw);
-            throw e;
+          if (done) continue;
+          if (sse.data.startsWith('[DONE]')) {
+            done = true;
+            continue;
+          } else {
+            let data;
+            try {
+              data = JSON.parse(sse.data) as any;
+            } catch (e) {
+              console.error(`Could not parse message into JSON:`, sse.data);
+              console.error(`From chunk:`, sse.raw);
+              throw e;
+            }
+            if (data && data.error) {
+              throw new APIError(undefined, data.error, undefined, createResponseHeaders(response.headers));
+            }
+            yield data;
           }
         }
         done = true;

package/src/version.ts CHANGED Viewed

@@ -4,4 +4,4 @@
 // This source code is licensed under the terms described in the LICENSE file in
 // the root directory of this source tree.
-export const VERSION = '0.6.1'; // x-release-please-version
+export const VERSION = '0.7.1'; // x-release-please-version

package/tests/api-resources/beta/datasets.test.ts CHANGED Viewed

@@ -49,10 +49,7 @@ describe('resource datasets', () => {
   });
   test('appendrows: only required params', async () => {
-    const responsePromise = client.beta.datasets.appendrows('dataset_id', {
-      body_dataset_id: 'dataset_id',
-      rows: [{ foo: 'bar' }],
-    });
+    const responsePromise = client.beta.datasets.appendrows('dataset_id', { rows: [{ foo: 'bar' }] });
     const rawResponse = await responsePromise.asResponse();
     expect(rawResponse).toBeInstanceOf(Response);
     const response = await responsePromise;
@@ -63,10 +60,7 @@ describe('resource datasets', () => {
   });
   test('appendrows: required and optional params', async () => {
-    const response = await client.beta.datasets.appendrows('dataset_id', {
-      body_dataset_id: 'dataset_id',
-      rows: [{ foo: 'bar' }],
-    });
+    const response = await client.beta.datasets.appendrows('dataset_id', { rows: [{ foo: 'bar' }] });
   });
   test('iterrows', async () => {
@@ -100,7 +94,7 @@ describe('resource datasets', () => {
   test('register: only required params', async () => {
     const responsePromise = client.beta.datasets.register({
-      purpose: 'post-training/messages',
+      purpose: 'eval/question-answer',
       source: { uri: 'uri', type: 'uri' },
     });
     const rawResponse = await responsePromise.asResponse();
@@ -114,7 +108,7 @@ describe('resource datasets', () => {
   test('register: required and optional params', async () => {
     const response = await client.beta.datasets.register({
-      purpose: 'post-training/messages',
+      purpose: 'eval/question-answer',
       source: { uri: 'uri', type: 'uri' },
       dataset_id: 'dataset_id',
       metadata: { foo: 'bar' },

package/tests/api-resources/chat/completions.test.ts CHANGED Viewed

@@ -46,10 +46,12 @@ describe('resource completions', () => {
       n: 1,
       parallel_tool_calls: true,
       presence_penalty: -2,
+      prompt_cache_key: 'prompt_cache_key',
       reasoning_effort: 'none',
       response_format: { type: 'text' },
       safety_identifier: 'safety_identifier',
       seed: 0,
+      service_tier: 'auto',
       stop: 'string',
       stream: false,
       stream_options: { foo: 'bar' },

package/tests/api-resources/files.test.ts CHANGED Viewed

@@ -14,7 +14,7 @@ const client = new LlamaStackClient({ baseURL: process.env['TEST_API_BASE_URL']
 describe('resource files', () => {
   test('create: only required params', async () => {
     const responsePromise = client.files.create({
-      file: await toFile(Buffer.from('# my file contents'), 'README.md'),
+      file: await toFile(Buffer.from('Example data'), 'README.md'),
       purpose: 'assistants',
     });
     const rawResponse = await responsePromise.asResponse();
@@ -28,7 +28,7 @@ describe('resource files', () => {
   test('create: required and optional params', async () => {
     const response = await client.files.create({
-      file: await toFile(Buffer.from('# my file contents'), 'README.md'),
+      file: await toFile(Buffer.from('Example data'), 'README.md'),
       purpose: 'assistants',
       expires_after: { anchor: 'created_at', seconds: 3600 },
     });

package/tests/api-resources/models/models.test.ts CHANGED Viewed

@@ -47,43 +47,4 @@ describe('resource models', () => {
       LlamaStackClient.NotFoundError,
     );
   });
-  test('register: only required params', async () => {
-    const responsePromise = client.models.register({ model_id: 'model_id' });
-    const rawResponse = await responsePromise.asResponse();
-    expect(rawResponse).toBeInstanceOf(Response);
-    const response = await responsePromise;
-    expect(response).not.toBeInstanceOf(Response);
-    const dataAndResponse = await responsePromise.withResponse();
-    expect(dataAndResponse.data).toBe(response);
-    expect(dataAndResponse.response).toBe(rawResponse);
-  });
-  test('register: required and optional params', async () => {
-    const response = await client.models.register({
-      model_id: 'model_id',
-      metadata: { foo: 'bar' },
-      model_type: 'llm',
-      provider_id: 'provider_id',
-      provider_model_id: 'provider_model_id',
-    });
-  });
-  test('unregister', async () => {
-    const responsePromise = client.models.unregister('model_id');
-    const rawResponse = await responsePromise.asResponse();
-    expect(rawResponse).toBeInstanceOf(Response);
-    const response = await responsePromise;
-    expect(response).not.toBeInstanceOf(Response);
-    const dataAndResponse = await responsePromise.withResponse();
-    expect(dataAndResponse.data).toBe(response);
-    expect(dataAndResponse.response).toBe(rawResponse);
-  });
-  test('unregister: request options instead of params are passed correctly', async () => {
-    // ensure the request options are being passed correctly by passing an invalid HTTP method in order to cause an error
-    await expect(client.models.unregister('model_id', { path: '/_stainless_unknown_path' })).rejects.toThrow(
-      LlamaStackClient.NotFoundError,
-    );
-  });
 });

package/tests/api-resources/responses/responses.test.ts CHANGED Viewed

@@ -27,7 +27,9 @@ describe('resource responses', () => {
     const response = await client.responses.create({
       input: 'string',
       model: 'model',
+      background: true,
       conversation: 'conversation',
+      frequency_penalty: -2,
       guardrails: ['string'],
       include: ['web_search_call.action.sources'],
       instructions: 'instructions',
@@ -36,16 +38,20 @@ describe('resource responses', () => {
       max_tool_calls: 1,
       metadata: { foo: 'string' },
       parallel_tool_calls: true,
+      presence_penalty: -2,
       previous_response_id: 'previous_response_id',
       prompt: {
         id: 'id',
         variables: { foo: { text: 'text', type: 'input_text' } },
         version: 'version',
       },
-      reasoning: { effort: 'none' },
+      prompt_cache_key: 'prompt_cache_key',
+      reasoning: { effort: 'none', summary: 'auto' },
       safety_identifier: 'safety_identifier',
+      service_tier: 'auto',
       store: true,
       stream: false,
+      stream_options: { include_obfuscation: true },
       temperature: 0,
       text: {
         format: {
@@ -58,6 +64,9 @@ describe('resource responses', () => {
       },
       tool_choice: 'auto',
       tools: [{ search_context_size: 'S?oC"high', type: 'web_search' }],
+      top_logprobs: 0,
+      top_p: 0,
+      truncation: 'auto',
     });
   });

package/tests/api-resources/vector-stores/file-batches.test.ts CHANGED Viewed

@@ -103,7 +103,7 @@ describe('resource fileBatches', () => {
           after: 'after',
           before: 'before',
           filter: 'filter',
-          limit: 0,
+          limit: 1,
           order: 'order',
         },
         { path: '/_stainless_unknown_path' },

package/tests/api-resources/vector-stores/files.test.ts CHANGED Viewed

@@ -95,7 +95,7 @@ describe('resource files', () => {
           after: 'after',
           before: 'before',
           filter: 'completed',
-          limit: 0,
+          limit: 1,
           order: 'order',
         },
         { path: '/_stainless_unknown_path' },

package/tests/api-resources/vector-stores/vector-stores.test.ts CHANGED Viewed

@@ -77,7 +77,7 @@ describe('resource vectorStores', () => {
         {
           after: 'after',
           before: 'before',
-          limit: 0,
+          limit: 1,
           order: 'order',
         },
         { path: '/_stainless_unknown_path' },