npm - @ai-sdk/amazon-bedrock - Versions diffs - 5.0.0-beta.14 → 5.0.0-beta.16 - Mend

@ai-sdk/amazon-bedrock 5.0.0-beta.14 → 5.0.0-beta.16

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (17) hide show

package/CHANGELOG.md +12 -0
package/dist/anthropic/index.js +19 -1
package/dist/anthropic/index.js.map +1 -1
package/dist/anthropic/index.mjs +19 -1
package/dist/anthropic/index.mjs.map +1 -1
package/dist/index.d.mts +6 -0
package/dist/index.d.ts +6 -0
package/dist/index.js +18 -2
package/dist/index.js.map +1 -1
package/dist/index.mjs +18 -2
package/dist/index.mjs.map +1 -1
package/docs/08-amazon-bedrock.mdx +31 -0
package/package.json +1 -1
package/src/anthropic/bedrock-anthropic-fetch.ts +26 -0
package/src/bedrock-api-types.ts +3 -0
package/src/bedrock-chat-language-model.ts +6 -0
package/src/bedrock-chat-options.ts +10 -0

package/docs/08-amazon-bedrock.mdx CHANGED Viewed

@@ -514,6 +514,37 @@ console.log(amazonResult.text); // text response
 See [AI SDK UI: Chatbot](/docs/ai-sdk-ui/chatbot#reasoning) for more details
 on how to integrate reasoning into your chatbot.
+## Service Tiers
+Amazon Bedrock supports selecting an inference service tier per request via the `serviceTier` provider option.
+```ts
+import {
+  bedrock,
+  type AmazonBedrockLanguageModelOptions,
+} from '@ai-sdk/amazon-bedrock';
+import { generateText } from 'ai';
+const result = await generateText({
+  model: bedrock('us.anthropic.claude-sonnet-4-20250514-v1:0'),
+  prompt: 'Summarize this support ticket backlog.',
+  providerOptions: {
+    bedrock: {
+      serviceTier: 'priority',
+    } satisfies AmazonBedrockLanguageModelOptions,
+  },
+});
+```
+Supported values are:
+- `reserved`
+- `priority`
+- `default`
+- `flex`
+See the [Amazon Bedrock service tiers documentation](https://docs.aws.amazon.com/bedrock/latest/userguide/service-tiers-inference.html) for model availability and behavior.
 ## Extended Context Window
 Claude Sonnet 4 models on Amazon Bedrock support an extended context window of up to 1 million tokens when using the `context-1m-2025-08-07` beta feature.

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@ai-sdk/amazon-bedrock",
-  "version": "5.0.0-beta.14",
+  "version": "5.0.0-beta.16",
   "license": "Apache-2.0",
   "sideEffects": false,
   "main": "./dist/index.js",

package/src/anthropic/bedrock-anthropic-fetch.ts CHANGED Viewed

@@ -3,14 +3,40 @@ import {
   FetchFunction,
   safeParseJSON,
 } from '@ai-sdk/provider-utils';
+import { z } from 'zod/v4';
 import { createBedrockEventStreamDecoder } from '../bedrock-event-stream-decoder';
+const bedrockErrorSchema = z.looseObject({
+  message: z.string().optional(),
+});
 export function createBedrockAnthropicFetch(
   baseFetch: FetchFunction,
 ): FetchFunction {
   return async (url, options) => {
     const response = await baseFetch(url, options);
+    // Transform Bedrock error responses into Anthropic error format
+    // so that anthropicFailedResponseHandler can extract the message.
+    if (!response.ok) {
+      const text = await response.text();
+      const parsed = await safeParseJSON({ text, schema: bedrockErrorSchema });
+      const message =
+        parsed.success && parsed.value.message ? parsed.value.message : text;
+      const anthropicError = JSON.stringify({
+        type: 'error',
+        error: { type: 'error', message },
+      });
+      return new Response(anthropicError, {
+        status: response.status,
+        statusText: response.statusText,
+        headers: response.headers,
+      });
+    }
     const contentType = response.headers.get('content-type');
     if (
       contentType?.includes('application/vnd.amazon.eventstream') &&

package/src/bedrock-api-types.ts CHANGED Viewed

@@ -13,6 +13,9 @@ export interface BedrockConverseInput {
   };
   additionalModelRequestFields?: Record<string, unknown>;
   additionalModelResponseFieldPaths?: string[];
+  serviceTier?: {
+    type: string;
+  };
   guardrailConfig?:
     | BedrockGuardrailConfiguration
     | BedrockGuardrailStreamConfiguration

package/src/bedrock-chat-language-model.ts CHANGED Viewed

@@ -383,6 +383,7 @@ export class BedrockChatLanguageModel implements LanguageModelV4 {
     const {
       reasoningConfig: _,
       additionalModelRequestFields: __,
+      serviceTier: ___,
       ...filteredBedrockOptions
     } = providerOptions?.bedrock || {};
@@ -402,6 +403,11 @@ export class BedrockChatLanguageModel implements LanguageModelV4 {
         ...(Object.keys(inferenceConfig).length > 0 && {
           inferenceConfig,
         }),
+        ...(bedrockOptions.serviceTier != null && {
+          serviceTier: {
+            type: bedrockOptions.serviceTier,
+          },
+        }),
         ...filteredBedrockOptions,
         ...(toolConfig.tools !== undefined && toolConfig.tools.length > 0
           ? { toolConfig }

package/src/bedrock-chat-options.ts CHANGED Viewed

@@ -122,6 +122,16 @@ export const amazonBedrockLanguageModelOptions = z.object({
    * Anthropic beta features to enable
    */
   anthropicBeta: z.array(z.string()).optional(),
+  /**
+   * Service tier for the request.
+   * @see https://docs.aws.amazon.com/bedrock/latest/userguide/service-tiers-inference.html
+   *
+   * - 'reserved': Uses provisioned throughput capacity
+   * - 'priority': Prioritizes low-latency inference when capacity is available
+   * - 'default': Standard on-demand tier
+   * - 'flex': Lower-cost tier for flexible latency workloads
+   */
+  serviceTier: z.enum(['reserved', 'priority', 'default', 'flex']).optional(),
 });
 export type AmazonBedrockLanguageModelOptions = z.infer<