RubyGems - liter_llm - Versions diffs - 1.0.0.pre.rc.6 - Mend

liter_llm 1.0.0.pre.rc.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (78) hide show

checksums.yaml +7 -0
data/README.md +239 -0
data/ext/liter_llm_rb/extconf.rb +65 -0
data/ext/liter_llm_rb/native/.cargo/config.toml +23 -0
data/ext/liter_llm_rb/native/Cargo.lock +3713 -0
data/ext/liter_llm_rb/native/Cargo.toml +32 -0
data/ext/liter_llm_rb/native/build.rs +15 -0
data/ext/liter_llm_rb/native/src/lib.rs +1079 -0
data/lib/liter_llm.rb +8 -0
data/sig/liter_llm.rbs +416 -0
data/vendor/Cargo.toml +54 -0
data/vendor/liter-llm/Cargo.toml +92 -0
data/vendor/liter-llm/README.md +252 -0
data/vendor/liter-llm/schemas/pricing.json +40 -0
data/vendor/liter-llm/schemas/providers.json +1662 -0
data/vendor/liter-llm/src/auth/azure_ad.rs +264 -0
data/vendor/liter-llm/src/auth/bedrock_sts.rs +353 -0
data/vendor/liter-llm/src/auth/mod.rs +68 -0
data/vendor/liter-llm/src/auth/vertex_oauth.rs +353 -0
data/vendor/liter-llm/src/client/config.rs +351 -0
data/vendor/liter-llm/src/client/managed.rs +622 -0
data/vendor/liter-llm/src/client/mod.rs +864 -0
data/vendor/liter-llm/src/cost.rs +212 -0
data/vendor/liter-llm/src/error.rs +190 -0
data/vendor/liter-llm/src/http/eventstream.rs +860 -0
data/vendor/liter-llm/src/http/mod.rs +12 -0
data/vendor/liter-llm/src/http/request.rs +438 -0
data/vendor/liter-llm/src/http/retry.rs +72 -0
data/vendor/liter-llm/src/http/streaming.rs +289 -0
data/vendor/liter-llm/src/lib.rs +37 -0
data/vendor/liter-llm/src/provider/anthropic.rs +2250 -0
data/vendor/liter-llm/src/provider/azure.rs +579 -0
data/vendor/liter-llm/src/provider/bedrock.rs +1543 -0
data/vendor/liter-llm/src/provider/cohere.rs +654 -0
data/vendor/liter-llm/src/provider/custom.rs +404 -0
data/vendor/liter-llm/src/provider/google_ai.rs +281 -0
data/vendor/liter-llm/src/provider/mistral.rs +188 -0
data/vendor/liter-llm/src/provider/mod.rs +616 -0
data/vendor/liter-llm/src/provider/vertex.rs +1504 -0
data/vendor/liter-llm/src/tests.rs +1425 -0
data/vendor/liter-llm/src/tokenizer.rs +281 -0
data/vendor/liter-llm/src/tower/budget.rs +599 -0
data/vendor/liter-llm/src/tower/cache.rs +502 -0
data/vendor/liter-llm/src/tower/cache_opendal.rs +270 -0
data/vendor/liter-llm/src/tower/cooldown.rs +231 -0
data/vendor/liter-llm/src/tower/cost.rs +404 -0
data/vendor/liter-llm/src/tower/fallback.rs +121 -0
data/vendor/liter-llm/src/tower/health.rs +219 -0
data/vendor/liter-llm/src/tower/hooks.rs +369 -0
data/vendor/liter-llm/src/tower/mod.rs +77 -0
data/vendor/liter-llm/src/tower/rate_limit.rs +300 -0
data/vendor/liter-llm/src/tower/router.rs +436 -0
data/vendor/liter-llm/src/tower/service.rs +181 -0
data/vendor/liter-llm/src/tower/tests.rs +539 -0
data/vendor/liter-llm/src/tower/tests_common.rs +252 -0
data/vendor/liter-llm/src/tower/tracing.rs +209 -0
data/vendor/liter-llm/src/tower/types.rs +170 -0
data/vendor/liter-llm/src/types/audio.rs +52 -0
data/vendor/liter-llm/src/types/batch.rs +77 -0
data/vendor/liter-llm/src/types/chat.rs +214 -0
data/vendor/liter-llm/src/types/common.rs +244 -0
data/vendor/liter-llm/src/types/embedding.rs +84 -0
data/vendor/liter-llm/src/types/files.rs +58 -0
data/vendor/liter-llm/src/types/image.rs +40 -0
data/vendor/liter-llm/src/types/mod.rs +27 -0
data/vendor/liter-llm/src/types/models.rs +21 -0
data/vendor/liter-llm/src/types/moderation.rs +80 -0
data/vendor/liter-llm/src/types/ocr.rs +87 -0
data/vendor/liter-llm/src/types/rerank.rs +46 -0
data/vendor/liter-llm/src/types/responses.rs +55 -0
data/vendor/liter-llm/src/types/search.rs +45 -0
data/vendor/liter-llm/tests/contract.rs +332 -0
data/vendor/liter-llm-ffi/Cargo.toml +30 -0
data/vendor/liter-llm-ffi/build.rs +66 -0
data/vendor/liter-llm-ffi/cbindgen.toml +60 -0
data/vendor/liter-llm-ffi/liter_llm.h +850 -0
data/vendor/liter-llm-ffi/src/lib.rs +2488 -0
metadata +286 -0

data/vendor/liter-llm/src/provider/bedrock.rs ADDED Viewed

@@ -0,0 +1,1543 @@
+use std::borrow::Cow;
+#[cfg(feature = "bedrock")]
+use crate::error::LiterLlmError;
+use crate::error::Result;
+use crate::provider::{Provider, StreamFormat};
+use crate::types::ChatCompletionChunk;
+/// Default AWS region for Bedrock when none is specified.
+const DEFAULT_REGION: &str = "us-east-1";
+/// Map reasoning effort levels to budget_tokens for Claude-on-Bedrock extended thinking.
+fn reasoning_effort_to_budget_tokens(effort: &str) -> u64 {
+    match effort {
+        "low" => 1024,
+        "medium" => 4096,
+        "high" => 16384,
+        _ => 4096, // default to medium
+    }
+}
+/// Extract a document format from a MIME type string.
+///
+/// E.g. `"application/pdf"` → `"pdf"`, `"text/csv"` → `"csv"`.
+fn format_from_media_type(media_type: &str) -> &str {
+    // Use the subtype portion after the slash.
+    media_type.split('/').nth(1).unwrap_or("pdf")
+}
+/// Percent-encode a model ID for use in a URL path segment.
+///
+/// Bedrock model IDs can contain colons and slashes that must be encoded.
+fn percent_encode_model(model: &str) -> String {
+    let mut encoded = String::with_capacity(model.len());
+    for byte in model.bytes() {
+        match byte {
+            // Unreserved characters per RFC 3986 §2.3 — safe to pass through.
+            b'A'..=b'Z' | b'a'..=b'z' | b'0'..=b'9' | b'-' | b'_' | b'.' | b'~' => {
+                encoded.push(byte as char);
+            }
+            other => {
+                encoded.push('%');
+                // RFC 3986 §2.1 requires uppercase hex digits.
+                let hi = char::from_digit(u32::from(other >> 4), 16).unwrap_or('0');
+                let lo = char::from_digit(u32::from(other & 0xf), 16).unwrap_or('0');
+                encoded.push(hi.to_ascii_uppercase());
+                encoded.push(lo.to_ascii_uppercase());
+            }
+        }
+    }
+    encoded
+}
+/// AWS Bedrock provider.
+///
+/// Differences from the OpenAI-compatible baseline:
+/// - Routes `bedrock/` prefixed model names to the Bedrock runtime endpoint.
+/// - The model prefix is stripped before the model ID is sent in the request.
+/// - When the `bedrock` feature is enabled, every request is signed with
+///   AWS Signature Version 4 using credentials from the environment
+///   (`AWS_ACCESS_KEY_ID`, `AWS_SECRET_ACCESS_KEY`, `AWS_SESSION_TOKEN`).
+/// - When the `bedrock` feature is disabled, the provider is usable with a
+///   `base_url` override (e.g. in tests against a mock server) without any
+///   signing.
+///
+/// # Region resolution
+///
+/// The region is resolved in priority order:
+/// 1. Explicit value passed to [`BedrockProvider::with_region`].
+/// 2. `AWS_DEFAULT_REGION` environment variable.
+/// 3. `AWS_REGION` environment variable.
+/// 4. Hard-coded default: `us-east-1`.
+///
+/// # Configuration
+///
+/// ```rust,ignore
+/// let config = ClientConfigBuilder::new("unused-for-sigv4")
+///     .build();
+/// let client = DefaultClient::new(config, Some("bedrock/anthropic.claude-3-sonnet-20240229-v1:0"))?;
+/// ```
+pub struct BedrockProvider {
+    #[allow(dead_code)] // used by region() accessor and in sigv4_sign
+    region: String,
+    /// Cached base URL: `https://bedrock-runtime.{region}.amazonaws.com`.
+    base_url: String,
+    /// Cached cross-region prefix from `BEDROCK_CROSS_REGION` env var at
+    /// construction time (e.g. `Some("us.")`) so we avoid reading the
+    /// environment on every request.
+    cross_region_prefix: Option<String>,
+}
+impl BedrockProvider {
+    /// Construct with the given AWS region.
+    #[must_use]
+    pub fn new(region: impl Into<String>) -> Self {
+        let region = region.into();
+        let base_url = format!("https://bedrock-runtime.{region}.amazonaws.com");
+        let cross_region_prefix = std::env::var("BEDROCK_CROSS_REGION")
+            .ok()
+            .filter(|v| !v.is_empty())
+            .map(|v| format!("{v}."));
+        Self {
+            region,
+            base_url,
+            cross_region_prefix,
+        }
+    }
+    /// Construct using region from the environment, falling back to `us-east-1`.
+    ///
+    /// Reads `AWS_DEFAULT_REGION` then `AWS_REGION`.
+    #[must_use]
+    pub fn from_env() -> Self {
+        let region = std::env::var("AWS_DEFAULT_REGION")
+            .or_else(|_| std::env::var("AWS_REGION"))
+            .unwrap_or_else(|_| DEFAULT_REGION.to_owned());
+        Self::new(region)
+    }
+    /// Return the AWS region this provider is configured for.
+    #[must_use]
+    #[allow(dead_code)] // useful for consumers of the library
+    pub fn region(&self) -> &str {
+        &self.region
+    }
+}
+impl Provider for BedrockProvider {
+    fn name(&self) -> &str {
+        "bedrock"
+    }
+    /// Base URL for the Bedrock runtime service.
+    ///
+    /// When a `base_url` override is set in [`ClientConfig`] (as in tests),
+    /// the override takes precedence and this value is never used.
+    fn base_url(&self) -> &str {
+        &self.base_url
+    }
+    /// Bedrock uses SigV4 signing rather than a static authorization header.
+    ///
+    /// Returns `None` so the HTTP layer skips adding an `Authorization` header.
+    /// Actual signing headers are injected by [`BedrockProvider::signing_headers`]
+    /// when the `bedrock` feature is enabled.
+    fn auth_header<'a>(&'a self, _api_key: &'a str) -> Option<(Cow<'static, str>, Cow<'a, str>)> {
+        None
+    }
+    fn matches_model(&self, model: &str) -> bool {
+        model.starts_with("bedrock/")
+    }
+    fn strip_model_prefix<'m>(&self, model: &'m str) -> &'m str {
+        model.strip_prefix("bedrock/").unwrap_or(model)
+    }
+    /// Validate that the provider is usable in the current environment.
+    ///
+    /// When the `bedrock` feature is enabled, checks that AWS credentials are
+    /// available in the environment (`AWS_ACCESS_KEY_ID` at minimum).  Without
+    /// credentials, every real Bedrock request will be rejected with a 403.
+    ///
+    /// When the `bedrock` feature is disabled (e.g. in tests with `base_url`
+    /// override), validation is skipped so callers can connect to a mock server
+    /// without real AWS credentials.
+    fn validate(&self) -> Result<()> {
+        #[cfg(feature = "bedrock")]
+        {
+            if std::env::var("AWS_ACCESS_KEY_ID").is_err() {
+                return Err(LiterLlmError::BadRequest {
+                    message: "AWS Bedrock requires AWS credentials. \
+                              Set AWS_ACCESS_KEY_ID and AWS_SECRET_ACCESS_KEY (and optionally \
+                              AWS_SESSION_TOKEN) in the environment."
+                        .into(),
+                });
+            }
+        }
+        Ok(())
+    }
+    /// Bedrock uses AWS EventStream binary framing, not SSE.
+    fn stream_format(&self) -> StreamFormat {
+        StreamFormat::AwsEventStream
+    }
+    /// Build the full URL for a Bedrock Converse API request.
+    ///
+    /// Chat completions map to `/model/{encoded_model}/converse`.
+    /// Embeddings map to `/model/{encoded_model}/invoke`.
+    /// All other paths are passed through unchanged.
+    ///
+    /// When the `BEDROCK_CROSS_REGION` environment variable is set, the
+    /// cross-region inference profile prefix is prepended to the model ID.
+    /// For example, with `BEDROCK_CROSS_REGION=us`, model
+    /// `anthropic.claude-3-sonnet-20240229-v1:0` becomes
+    /// `us.anthropic.claude-3-sonnet-20240229-v1:0`.
+    fn build_url(&self, endpoint_path: &str, model: &str) -> String {
+        let base = self.base_url();
+        let effective_model = self.apply_cross_region_prefix(model);
+        let encoded_model = percent_encode_model(&effective_model);
+        if endpoint_path.contains("chat/completions") {
+            format!("{base}/model/{encoded_model}/converse")
+        } else if endpoint_path.contains("embeddings") {
+            format!("{base}/model/{encoded_model}/invoke")
+        } else {
+            format!("{base}{endpoint_path}")
+        }
+    }
+    /// Build the streaming URL: `/model/{id}/converse-stream`.
+    fn build_stream_url(&self, endpoint_path: &str, model: &str) -> String {
+        let base = self.base_url();
+        let effective_model = self.apply_cross_region_prefix(model);
+        let encoded_model = percent_encode_model(&effective_model);
+        if endpoint_path.contains("chat/completions") {
+            format!("{base}/model/{encoded_model}/converse-stream")
+        } else {
+            // Non-chat streaming falls back to the regular URL.
+            self.build_url(endpoint_path, model)
+        }
+    }
+    /// Convert an OpenAI-style chat request to Bedrock Converse API format.
+    ///
+    /// Key differences from the OpenAI format:
+    /// - System messages are extracted to a top-level `system` array.
+    /// - Messages use `content` arrays with typed blocks (`text`, `toolUse`, `toolResult`).
+    /// - Generation parameters live in `inferenceConfig`.
+    /// - Tools are described in `toolConfig.tools[].toolSpec`.
+    fn transform_request(&self, body: &mut serde_json::Value) -> Result<()> {
+        use serde_json::json;
+        // Take ownership of the messages array to avoid cloning.
+        let messages = body
+            .as_object_mut()
+            .and_then(|o| o.remove("messages"))
+            .and_then(|v| match v {
+                serde_json::Value::Array(arr) => Some(arr),
+                _ => None,
+            })
+            .unwrap_or_default();
+        let mut system_parts = vec![];
+        let mut converse_messages = vec![];
+        for msg in &messages {
+            let role = msg.get("role").and_then(|r| r.as_str()).unwrap_or("");
+            let content = msg.get("content");
+            match role {
+                "system" | "developer" => {
+                    if let Some(text) = content.and_then(|c| c.as_str()) {
+                        system_parts.push(json!({"text": text}));
+                    } else if let Some(array) = content.and_then(|c| c.as_array()) {
+                        // System content may be a list of typed blocks; extract text parts.
+                        for part in array {
+                            if let Some(text) = part.get("text").and_then(|t| t.as_str()) {
+                                system_parts.push(json!({"text": text}));
+                            }
+                        }
+                    }
+                }
+                "user" => {
+                    let parts = if let Some(text) = content.and_then(|c| c.as_str()) {
+                        vec![json!({"text": text})]
+                    } else if let Some(array) = content.and_then(|c| c.as_array()) {
+                        // Multimodal content: iterate parts and translate each block.
+                        array
+                            .iter()
+                            .filter_map(|part| {
+                                let part_type = part.get("type").and_then(|t| t.as_str()).unwrap_or("");
+                                match part_type {
+                                    "text" => {
+                                        let text = part.get("text").and_then(|t| t.as_str()).unwrap_or("");
+                                        Some(json!({"text": text}))
+                                    }
+                                    "image_url" => {
+                                        // Map OpenAI image_url to Bedrock image block.
+                                        let url = part.pointer("/image_url/url").and_then(|u| u.as_str()).unwrap_or("");
+                                        if let Some(data_part) = url.strip_prefix("data:") {
+                                            // data:{media_type};base64,{data}
+                                            let mut iter = data_part.splitn(2, ';');
+                                            let media_type = iter.next().unwrap_or("image/jpeg");
+                                            let b64 = iter.next().and_then(|s| s.strip_prefix("base64,")).unwrap_or("");
+                                            Some(json!({
+                                                "image": {
+                                                    "format": media_type.split('/').nth(1).unwrap_or("jpeg"),
+                                                    "source": {"bytes": b64}
+                                                }
+                                            }))
+                                        } else {
+                                            // Plain URL — not directly supported by Bedrock;
+                                            // include as text so the message is not silently dropped.
+                                            Some(json!({"text": url}))
+                                        }
+                                    }
+                                    "document" => {
+                                        // Map ContentPart::Document to Bedrock document block.
+                                        let data =
+                                            part.pointer("/document/data").and_then(|d| d.as_str()).unwrap_or("");
+                                        let media_type = part
+                                            .pointer("/document/media_type")
+                                            .and_then(|m| m.as_str())
+                                            .unwrap_or("application/pdf");
+                                        let format = format_from_media_type(media_type);
+                                        Some(json!({
+                                            "document": {
+                                                "name": "doc",
+                                                "format": format,
+                                                "source": {"bytes": data}
+                                            }
+                                        }))
+                                    }
+                                    _ => None,
+                                }
+                            })
+                            .collect()
+                    } else {
+                        // Fallback: represent unknown content as an empty text block.
+                        vec![json!({"text": ""})]
+                    };
+                    converse_messages.push(json!({"role": "user", "content": parts}));
+                }
+                "assistant" => {
+                    let mut parts = vec![];
+                    if let Some(text) = content.and_then(|c| c.as_str())
+                        && !text.is_empty()
+                    {
+                        parts.push(json!({"text": text}));
+                    }
+                    // Convert OpenAI tool_calls to Bedrock toolUse blocks.
+                    if let Some(tool_calls) = msg.get("tool_calls").and_then(|t| t.as_array()) {
+                        for tc in tool_calls {
+                            let input: serde_json::Value = tc
+                                .pointer("/function/arguments")
+                                .and_then(|a| a.as_str())
+                                .and_then(|s| serde_json::from_str(s).ok())
+                                .unwrap_or_else(|| json!({}));
+                            parts.push(json!({
+                                "toolUse": {
+                                    "toolUseId": tc.get("id"),
+                                    "name": tc.pointer("/function/name"),
+                                    "input": input
+                                }
+                            }));
+                        }
+                    }
+                    if parts.is_empty() {
+                        parts.push(json!({"text": ""}));
+                    }
+                    converse_messages.push(json!({"role": "assistant", "content": parts}));
+                }
+                "tool" => {
+                    let tool_call_id = msg.get("tool_call_id").and_then(|t| t.as_str()).unwrap_or("");
+                    let result_text = content.and_then(|c| c.as_str()).unwrap_or("");
+                    // Determine status: treat explicit error markers as failures.
+                    let is_error = msg.get("is_error").and_then(|v| v.as_bool()).unwrap_or(false);
+                    let status = if is_error { "error" } else { "success" };
+                    converse_messages.push(json!({
+                        "role": "user",
+                        "content": [{
+                            "toolResult": {
+                                "toolUseId": tool_call_id,
+                                "content": [{"text": result_text}],
+                                "status": status
+                            }
+                        }]
+                    }));
+                }
+                _ => {}
+            }
+        }
+        // Build inferenceConfig from OpenAI generation parameters.
+        let mut inference_config = json!({});
+        if let Some(max_tokens) = body.get("max_tokens").or_else(|| body.get("max_completion_tokens")) {
+            inference_config["maxTokens"] = max_tokens.clone();
+        }
+        if let Some(temp) = body.get("temperature") {
+            inference_config["temperature"] = temp.clone();
+        }
+        if let Some(top_p) = body.get("top_p") {
+            inference_config["topP"] = top_p.clone();
+        }
+        if let Some(stop) = body.get("stop") {
+            let sequences = if let Some(s) = stop.as_str() {
+                vec![json!(s)]
+            } else {
+                stop.as_array().cloned().unwrap_or_default()
+            };
+            inference_config["stopSequences"] = json!(sequences);
+        }
+        // Build toolConfig if tools are present.
+        let tool_config = body.get("tools").and_then(|tools| {
+            tools.as_array().map(|arr| {
+                let bedrock_tools: Vec<serde_json::Value> = arr
+                    .iter()
+                    .map(|t| {
+                        let parameters = t
+                            .pointer("/function/parameters")
+                            .cloned()
+                            .unwrap_or_else(|| json!({"type": "object"}));
+                        json!({
+                            "toolSpec": {
+                                "name": t.pointer("/function/name"),
+                                "description": t.pointer("/function/description"),
+                                "inputSchema": {"json": parameters}
+                            }
+                        })
+                    })
+                    .collect();
+                json!({"tools": bedrock_tools})
+            })
+        });
+        // ── Extended thinking / reasoning effort ────────────────────────────
+        // When reasoning_effort is set, map to Bedrock's additionalModelRequestFields
+        // for Claude-on-Bedrock extended thinking.
+        let mut additional_model_fields: Option<serde_json::Value> = None;
+        if let Some(effort) = body.get("reasoning_effort").and_then(|e| e.as_str()) {
+            let budget_tokens = reasoning_effort_to_budget_tokens(effort);
+            additional_model_fields = Some(json!({
+                "thinking": {
+                    "type": "enabled",
+                    "budget_tokens": budget_tokens
+                }
+            }));
+        }
+        // ── Response format → system instruction ────────────────────────────
+        // Bedrock/Claude doesn't have native JSON mode. When response_format is
+        // json_schema or json_object, add a system instruction for JSON output.
+        if let Some(response_format) = body.get("response_format") {
+            let rf_type = response_format.get("type").and_then(|t| t.as_str()).unwrap_or("");
+            match rf_type {
+                "json_schema" => {
+                    let schema = response_format.get("json_schema").and_then(|js| js.get("schema"));
+                    let schema_str = schema
+                        .map(|s| serde_json::to_string_pretty(s).unwrap_or_default())
+                        .unwrap_or_default();
+                    let instruction = if schema_str.is_empty() {
+                        "You MUST respond with valid JSON only. No other text.".to_owned()
+                    } else {
+                        format!(
+                            "You MUST respond with valid JSON only that conforms to this schema:\n```json\n{schema_str}\n```\nNo other text outside the JSON."
+                        )
+                    };
+                    system_parts.push(json!({"text": instruction}));
+                }
+                "json_object" => {
+                    system_parts.push(json!({"text": "You MUST respond with valid JSON only. No other text."}));
+                }
+                _ => {}
+            }
+        }
+        // ── Guardrails ──────────────────────────────────────────────────────
+        // Extract guardrailConfig from extra_body if present.
+        let guardrail_config = body.get("extra_body").and_then(|eb| eb.get("guardrailConfig")).cloned();
+        // Assemble the Bedrock Converse request body.
+        let mut new_body = json!({
+            "messages": converse_messages,
+        });
+        if !system_parts.is_empty() {
+            new_body["system"] = json!(system_parts);
+        }
+        if let Some(obj) = inference_config.as_object()
+            && !obj.is_empty()
+        {
+            new_body["inferenceConfig"] = inference_config;
+        }
+        if let Some(tc) = tool_config {
+            new_body["toolConfig"] = tc;
+        }
+        if let Some(amf) = additional_model_fields {
+            new_body["additionalModelRequestFields"] = amf;
+        }
+        if let Some(gc) = guardrail_config {
+            new_body["guardrailConfig"] = gc;
+        }
+        *body = new_body;
+        Ok(())
+    }
+    /// Normalize a Bedrock Converse API response to OpenAI chat completion format.
+    ///
+    /// Bedrock wraps the assistant's message in `output.message.content[]` blocks.
+    /// Stop reasons use Bedrock terminology (`end_turn`, `tool_use`, etc.) and are
+    /// mapped to the OpenAI `finish_reason` set.
+    ///
+    /// **Known limitation:** The `model` field in the normalized response is
+    /// always `""`.  Bedrock does not include the model name in its response
+    /// body — the model is only present in the request URL path.  Threading
+    /// the model through would require a signature change to `transform_response`.
+    fn transform_response(&self, body: &mut serde_json::Value) -> Result<()> {
+        use serde_json::json;
+        let stop_reason = body.get("stopReason").and_then(|s| s.as_str()).unwrap_or("end_turn");
+        let usage = body.get("usage").cloned();
+        // Content blocks live under output.message.content[].
+        let content_blocks = body
+            .pointer("/output/message/content")
+            .and_then(|c| c.as_array())
+            .cloned()
+            .unwrap_or_default();
+        // Collect text and toolUse blocks separately.
+        let text: String = content_blocks
+            .iter()
+            .filter_map(|b| b.get("text").and_then(|t| t.as_str()))
+            .collect::<Vec<_>>()
+            .join("");
+        let tool_calls: Vec<serde_json::Value> = content_blocks
+            .iter()
+            .filter_map(|b| {
+                b.get("toolUse").map(|tu| {
+                    let arguments = serde_json::to_string(tu.get("input").unwrap_or(&json!({}))).unwrap_or_default();
+                    json!({
+                        "id": tu.get("toolUseId"),
+                        "type": "function",
+                        "function": {
+                            "name": tu.get("name"),
+                            "arguments": arguments
+                        }
+                    })
+                })
+            })
+            .collect();
+        let finish_reason = match stop_reason {
+            "end_turn" => "stop",
+            "tool_use" => "tool_calls",
+            "max_tokens" => "length",
+            "stop_sequence" => "stop",
+            "content_filtered" | "guardrail_intervened" => "content_filter",
+            _ => "stop",
+        };
+        let input_tokens = usage
+            .as_ref()
+            .and_then(|u| u.get("inputTokens"))
+            .and_then(|v| v.as_u64())
+            .unwrap_or(0);
+        let output_tokens = usage
+            .as_ref()
+            .and_then(|u| u.get("outputTokens"))
+            .and_then(|v| v.as_u64())
+            .unwrap_or(0);
+        let response_id = body
+            .get("requestId")
+            .or_else(|| body.get("conversationId"))
+            .cloned()
+            .unwrap_or_else(|| json!("bedrock-resp"));
+        let content_value: serde_json::Value = if text.is_empty() { json!(null) } else { json!(text) };
+        let mut message = json!({"role": "assistant", "content": content_value});
+        if !tool_calls.is_empty() {
+            message["tool_calls"] = json!(tool_calls);
+        }
+        *body = json!({
+            "id": response_id,
+            "object": "chat.completion",
+            "created": super::unix_timestamp_secs(),
+            "model": "",
+            "choices": [{
+                "index": 0,
+                "message": message,
+                "finish_reason": finish_reason
+            }],
+            "usage": {
+                "prompt_tokens": input_tokens,
+                "completion_tokens": output_tokens,
+                "total_tokens": input_tokens + output_tokens
+            }
+        });
+        Ok(())
+    }
+    /// Compute AWS SigV4 signing headers for the request.
+    ///
+    /// When the `bedrock` feature is enabled, derives the `Authorization`,
+    /// `x-amz-date`, and (when a session token is present) `x-amz-security-token`
+    /// headers from the current request parameters and AWS credentials.
+    ///
+    /// When the `bedrock` feature is disabled, returns an empty vector so
+    /// requests work against override base-URLs (e.g. mock servers in tests).
+    fn signing_headers(&self, method: &str, url: &str, body: &[u8]) -> Vec<(String, String)> {
+        #[cfg(feature = "bedrock")]
+        {
+            sigv4_sign(method, url, body, &self.region).unwrap_or_default()
+        }
+        #[cfg(not(feature = "bedrock"))]
+        {
+            let _ = (method, url, body);
+            vec![]
+        }
+    }
+}
+/// Parse a Bedrock ConverseStream EventStream event into a `ChatCompletionChunk`.
+///
+/// Bedrock ConverseStream events:
+/// - `messageStart` → role delta
+/// - `contentBlockStart` → tool_use start (with toolUseId and name)
+/// - `contentBlockDelta` → text delta or tool_use input delta
+/// - `contentBlockStop` → (ignored)
+/// - `messageStop` → finish_reason
+/// - `metadata` → usage (emitted as a final chunk with empty delta)
+///
+/// Returns `Ok(None)` for events that don't map to a chunk (e.g. `contentBlockStop`).
+///
+/// **Known limitation:** The `id` field is hardcoded to `"bedrock-stream"` and
+/// `model` is always `""` on every chunk.  Bedrock's ConverseStream protocol does
+/// not include a request/response ID or model name in its event payloads, and
+/// this parser is stateless so it cannot carry forward values from the original
+/// request.  This differs from the OpenAI format where every chunk includes the
+/// real `id` and `model`.
+pub(crate) fn parse_bedrock_stream_event(event_type: &str, payload: &str) -> Result<Option<ChatCompletionChunk>> {
+    use crate::error::LiterLlmError;
+    use serde_json::json;
+    let v: serde_json::Value = serde_json::from_str(payload).map_err(|e| LiterLlmError::Streaming {
+        message: format!("Bedrock stream event parse error: {e}"),
+    })?;
+    let chunk_from_json = |chunk_json: serde_json::Value| -> Result<ChatCompletionChunk> {
+        serde_json::from_value(chunk_json).map_err(|e| LiterLlmError::Streaming {
+            message: format!("Bedrock chunk deserialization error: {e}"),
+        })
+    };
+    match event_type {
+        "messageStart" => {
+            let role = v.get("role").and_then(|r| r.as_str()).unwrap_or("assistant");
+            chunk_from_json(json!({
+                "id": "bedrock-stream",
+                "object": "chat.completion.chunk",
+                "created": 0,
+                "model": "",
+                "choices": [{
+                    "index": 0,
+                    "delta": {"role": role},
+                    "finish_reason": null
+                }]
+            }))
+            .map(Some)
+        }
+        "contentBlockStart" => {
+            let index = v.get("contentBlockIndex").and_then(|i| i.as_u64()).unwrap_or(0);
+            // Check if this is a tool_use start.
+            if let Some(tool_use) = v.pointer("/start/toolUse") {
+                let tool_use_id = tool_use.get("toolUseId").and_then(|t| t.as_str()).unwrap_or("");
+                let name = tool_use.get("name").and_then(|n| n.as_str()).unwrap_or("");
+                chunk_from_json(json!({
+                    "id": "bedrock-stream",
+                    "object": "chat.completion.chunk",
+                    "created": 0,
+                    "model": "",
+                    "choices": [{
+                        "index": 0,
+                        "delta": {
+                            "tool_calls": [{
+                                "index": index,
+                                "id": tool_use_id,
+                                "type": "function",
+                                "function": {"name": name, "arguments": ""}
+                            }]
+                        },
+                        "finish_reason": null
+                    }]
+                }))
+                .map(Some)
+            } else {
+                // Text content block start — no delta content yet.
+                Ok(None)
+            }
+        }
+        "contentBlockDelta" => {
+            let index = v.get("contentBlockIndex").and_then(|i| i.as_u64()).unwrap_or(0);
+            // Text delta.
+            if let Some(text) = v.pointer("/delta/text").and_then(|t| t.as_str()) {
+                return chunk_from_json(json!({
+                    "id": "bedrock-stream",
+                    "object": "chat.completion.chunk",
+                    "created": 0,
+                    "model": "",
+                    "choices": [{
+                        "index": 0,
+                        "delta": {"content": text},
+                        "finish_reason": null
+                    }]
+                }))
+                .map(Some);
+            }
+            // Tool use input delta.
+            if let Some(input_json) = v.pointer("/delta/toolUse/input").and_then(|i| i.as_str()) {
+                return chunk_from_json(json!({
+                    "id": "bedrock-stream",
+                    "object": "chat.completion.chunk",
+                    "created": 0,
+                    "model": "",
+                    "choices": [{
+                        "index": 0,
+                        "delta": {
+                            "tool_calls": [{
+                                "index": index,
+                                "function": {"arguments": input_json}
+                            }]
+                        },
+                        "finish_reason": null
+                    }]
+                }))
+                .map(Some);
+            }
+            // Unrecognized delta shape — log so callers know data was skipped.
+            #[cfg(feature = "tracing")]
+            tracing::debug!(
+                content_block_index = index,
+                "Bedrock contentBlockDelta with unrecognized delta shape; skipping"
+            );
+            Ok(None)
+        }
+        "contentBlockStop" => Ok(None),
+        "messageStop" => {
+            let stop_reason = v.get("stopReason").and_then(|s| s.as_str()).unwrap_or("end_turn");
+            let finish_reason = match stop_reason {
+                "end_turn" => "stop",
+                "tool_use" => "tool_calls",
+                "max_tokens" => "length",
+                "stop_sequence" => "stop",
+                "content_filtered" | "guardrail_intervened" => "content_filter",
+                _ => "stop",
+            };
+            chunk_from_json(json!({
+                "id": "bedrock-stream",
+                "object": "chat.completion.chunk",
+                "created": 0,
+                "model": "",
+                "choices": [{
+                    "index": 0,
+                    "delta": {},
+                    "finish_reason": finish_reason
+                }]
+            }))
+            .map(Some)
+        }
+        "metadata" => {
+            // Emit usage as a final chunk with empty choices.
+            let input_tokens = v.pointer("/usage/inputTokens").and_then(|t| t.as_u64()).unwrap_or(0);
+            let output_tokens = v.pointer("/usage/outputTokens").and_then(|t| t.as_u64()).unwrap_or(0);
+            chunk_from_json(json!({
+                "id": "bedrock-stream",
+                "object": "chat.completion.chunk",
+                "created": 0,
+                "model": "",
+                "choices": [],
+                "usage": {
+                    "prompt_tokens": input_tokens,
+                    "completion_tokens": output_tokens,
+                    "total_tokens": input_tokens + output_tokens
+                }
+            }))
+            .map(Some)
+        }
+        _ => {
+            // Unknown event type — skip silently.
+            Ok(None)
+        }
+    }
+}
+/// Apply the cross-region inference profile prefix using the value cached at
+/// construction time from the `BEDROCK_CROSS_REGION` environment variable.
+///
+/// When the prefix is set (e.g. `"us."`), the model ID
+/// `anthropic.claude-3-sonnet-20240229-v1:0` becomes
+/// `us.anthropic.claude-3-sonnet-20240229-v1:0`.
+///
+/// If the model already starts with the cross-region prefix, it is returned
+/// unchanged to avoid double-prefixing.
+impl BedrockProvider {
+    fn apply_cross_region_prefix(&self, model: &str) -> String {
+        match &self.cross_region_prefix {
+            Some(prefix) => {
+                if model.starts_with(prefix.as_str()) {
+                    model.to_owned()
+                } else {
+                    format!("{prefix}{model}")
+                }
+            }
+            None => model.to_owned(),
+        }
+    }
+}
+/// Legacy free function kept for existing tests. Reads the env var directly.
+///
+/// Production code uses [`BedrockProvider::apply_cross_region_prefix`] which
+/// reads the env var once at construction time.
+#[cfg(test)]
+fn apply_cross_region_prefix(model: &str) -> String {
+    match std::env::var("BEDROCK_CROSS_REGION") {
+        Ok(region) if !region.is_empty() => {
+            let prefix = format!("{region}.");
+            if model.starts_with(&prefix) {
+                model.to_owned()
+            } else {
+                format!("{prefix}{model}")
+            }
+        }
+        _ => model.to_owned(),
+    }
+}
+/// Compute AWS SigV4 signing headers using the `aws-sigv4` crate.
+///
+/// Reads credentials from the standard AWS environment variables:
+/// - `AWS_ACCESS_KEY_ID` (required)
+/// - `AWS_SECRET_ACCESS_KEY` (required)
+/// - `AWS_SESSION_TOKEN` (optional, for temporary credentials)
+///
+/// Returns a vector of `(header-name, header-value)` pairs to inject into the
+/// outgoing HTTP request.
+#[cfg(feature = "bedrock")]
+fn sigv4_sign(method: &str, url: &str, body: &[u8], region: &str) -> Result<Vec<(String, String)>> {
+    use aws_credential_types::Credentials;
+    use aws_sigv4::http_request::{SignableBody, SignableRequest, SigningSettings, sign};
+    use aws_sigv4::sign::v4::SigningParams;
+    let access_key = std::env::var("AWS_ACCESS_KEY_ID").map_err(|_| LiterLlmError::BadRequest {
+        message: "AWS_ACCESS_KEY_ID environment variable is required for Bedrock requests".into(),
+    })?;
+    let secret_key = std::env::var("AWS_SECRET_ACCESS_KEY").map_err(|_| LiterLlmError::BadRequest {
+        message: "AWS_SECRET_ACCESS_KEY environment variable is required for Bedrock requests".into(),
+    })?;
+    let session_token = std::env::var("AWS_SESSION_TOKEN").ok();
+    let credentials = Credentials::new(
+        access_key,
+        secret_key,
+        session_token,
+        None, // expiry
+        "env",
+    );
+    let identity = credentials.into();
+    let signing_settings = SigningSettings::default();
+    let now = std::time::SystemTime::now();
+    let params = SigningParams::builder()
+        .identity(&identity)
+        .region(region)
+        .name("bedrock")
+        .time(now)
+        .settings(signing_settings)
+        .build()
+        .map_err(|e| LiterLlmError::BadRequest {
+            message: format!("failed to build SigV4 signing params: {e}"),
+        })?;
+    // Build a signable request from the method, URL, and body.
+    let signable = SignableRequest::new(
+        method,
+        url,
+        std::iter::empty::<(&str, &str)>(),
+        SignableBody::Bytes(body),
+    )
+    .map_err(|e| LiterLlmError::BadRequest {
+        message: format!("failed to create signable request: {e}"),
+    })?;
+    let signing_output = sign(signable, &params.into()).map_err(|e| LiterLlmError::BadRequest {
+        message: format!("SigV4 signing failed: {e}"),
+    })?;
+    let instructions = signing_output.output();
+    let signed_headers: Vec<(String, String)> = instructions
+        .headers()
+        .map(|(name, value)| (name.to_owned(), value.to_owned()))
+        .collect();
+    Ok(signed_headers)
+}
+// ── Unit tests ────────────────────────────────────────────────────────────────
+#[cfg(test)]
+mod tests {
+    use serde_json::json;
+    use serial_test::serial;
+    use super::*;
+    use crate::provider::Provider;
+    use crate::types::chat::FinishReason;
+    fn provider() -> BedrockProvider {
+        BedrockProvider::new("us-east-1")
+    }
+    // ── build_url ─────────────────────────────────────────────────────────────
+    #[test]
+    fn build_url_chat_completions() {
+        let p = provider();
+        let url = p.build_url("/chat/completions", "anthropic.claude-3-sonnet-20240229-v1:0");
+        // Colon must be uppercase-encoded per RFC 3986 §2.1.
+        assert_eq!(
+            url,
+            "https://bedrock-runtime.us-east-1.amazonaws.com/model/anthropic.claude-3-sonnet-20240229-v1%3A0/converse"
+        );
+    }
+    #[test]
+    fn build_url_embeddings() {
+        let p = provider();
+        let url = p.build_url("/embeddings", "amazon.titan-embed-text-v1");
+        assert_eq!(
+            url,
+            "https://bedrock-runtime.us-east-1.amazonaws.com/model/amazon.titan-embed-text-v1/invoke"
+        );
+    }
+    #[test]
+    fn build_url_other_path() {
+        let p = provider();
+        let url = p.build_url("/models", "any-model");
+        assert_eq!(url, "https://bedrock-runtime.us-east-1.amazonaws.com/models");
+    }
+    // ── percent_encode_model ──────────────────────────────────────────────────
+    #[test]
+    fn percent_encode_model_colon() {
+        let encoded = percent_encode_model("anthropic.claude-3-sonnet-20240229-v1:0");
+        // RFC 3986 §2.1 requires uppercase hex digits.
+        assert!(
+            encoded.contains("%3A"),
+            "colon should be percent-encoded with uppercase hex: {encoded}"
+        );
+        assert!(!encoded.contains("%3a"), "lowercase hex must not appear: {encoded}");
+        assert!(!encoded.contains(':'), "raw colon should not remain: {encoded}");
+    }
+    #[test]
+    fn percent_encode_model_safe_chars() {
+        let encoded = percent_encode_model("amazon.titan-embed-text-v1");
+        assert_eq!(encoded, "amazon.titan-embed-text-v1");
+    }
+    // ── transform_request ─────────────────────────────────────────────────────
+    #[test]
+    fn transform_request_basic_chat() {
+        let p = provider();
+        let mut body = json!({
+            "model": "anthropic.claude-3-sonnet",
+            "messages": [
+                {"role": "system", "content": "You are helpful."},
+                {"role": "user", "content": "Hello!"}
+            ],
+            "max_tokens": 100,
+            "temperature": 0.7
+        });
+        p.transform_request(&mut body).unwrap();
+        // System messages extracted to top-level array.
+        assert_eq!(body["system"][0]["text"], "You are helpful.");
+        // User message converted to content blocks.
+        assert_eq!(body["messages"][0]["role"], "user");
+        assert_eq!(body["messages"][0]["content"][0]["text"], "Hello!");
+        // Generation params in inferenceConfig.
+        assert_eq!(body["inferenceConfig"]["maxTokens"], 100);
+        assert_eq!(body["inferenceConfig"]["temperature"], 0.7);
+    }
+    #[test]
+    fn transform_request_with_tool_calls() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [
+                {"role": "user", "content": "What is the weather?"},
+                {
+                    "role": "assistant",
+                    "content": null,
+                    "tool_calls": [{
+                        "id": "call_abc",
+                        "type": "function",
+                        "function": {"name": "get_weather", "arguments": "{\"city\":\"Berlin\"}"}
+                    }]
+                },
+                {
+                    "role": "tool",
+                    "tool_call_id": "call_abc",
+                    "content": "Sunny, 22°C"
+                }
+            ]
+        });
+        p.transform_request(&mut body).unwrap();
+        let messages = body["messages"].as_array().unwrap();
+        assert_eq!(messages.len(), 3);
+        // Assistant message has toolUse block.
+        let assistant = &messages[1];
+        assert_eq!(assistant["role"], "assistant");
+        let tool_use = &assistant["content"][0]["toolUse"];
+        assert_eq!(tool_use["toolUseId"], "call_abc");
+        assert_eq!(tool_use["name"], "get_weather");
+        assert_eq!(tool_use["input"]["city"], "Berlin");
+        // Tool result converted to user message with toolResult block.
+        let tool_result_msg = &messages[2];
+        assert_eq!(tool_result_msg["role"], "user");
+        let tool_result = &tool_result_msg["content"][0]["toolResult"];
+        assert_eq!(tool_result["toolUseId"], "call_abc");
+        assert_eq!(tool_result["status"], "success");
+    }
+    #[test]
+    fn transform_request_tools_schema() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "hi"}],
+            "tools": [{
+                "type": "function",
+                "function": {
+                    "name": "search",
+                    "description": "Search the web",
+                    "parameters": {"type": "object", "properties": {"query": {"type": "string"}}}
+                }
+            }]
+        });
+        p.transform_request(&mut body).unwrap();
+        let tools = body["toolConfig"]["tools"].as_array().unwrap();
+        assert_eq!(tools.len(), 1);
+        let spec = &tools[0]["toolSpec"];
+        assert_eq!(spec["name"], "search");
+        assert_eq!(spec["description"], "Search the web");
+        assert_eq!(spec["inputSchema"]["json"]["type"], "object");
+    }
+    // ── transform_response ────────────────────────────────────────────────────
+    #[test]
+    fn transform_response_basic() {
+        let p = provider();
+        let mut body = json!({
+            "requestId": "req-123",
+            "stopReason": "end_turn",
+            "output": {
+                "message": {
+                    "role": "assistant",
+                    "content": [{"text": "Hello, world!"}]
+                }
+            },
+            "usage": {
+                "inputTokens": 10,
+                "outputTokens": 5
+            }
+        });
+        p.transform_response(&mut body).unwrap();
+        assert_eq!(body["object"], "chat.completion");
+        assert_eq!(body["id"], "req-123");
+        assert_eq!(body["choices"][0]["message"]["content"], "Hello, world!");
+        assert_eq!(body["choices"][0]["finish_reason"], "stop");
+        assert_eq!(body["usage"]["prompt_tokens"], 10);
+        assert_eq!(body["usage"]["completion_tokens"], 5);
+        assert_eq!(body["usage"]["total_tokens"], 15);
+    }
+    #[test]
+    fn transform_response_tool_calls() {
+        let p = provider();
+        let mut body = json!({
+            "stopReason": "tool_use",
+            "output": {
+                "message": {
+                    "role": "assistant",
+                    "content": [
+                        {"toolUse": {
+                            "toolUseId": "call_xyz",
+                            "name": "get_weather",
+                            "input": {"city": "Berlin"}
+                        }}
+                    ]
+                }
+            },
+            "usage": {"inputTokens": 20, "outputTokens": 10}
+        });
+        p.transform_response(&mut body).unwrap();
+        assert_eq!(body["choices"][0]["finish_reason"], "tool_calls");
+        let tool_calls = body["choices"][0]["message"]["tool_calls"].as_array().unwrap();
+        assert_eq!(tool_calls.len(), 1);
+        assert_eq!(tool_calls[0]["id"], "call_xyz");
+        assert_eq!(tool_calls[0]["function"]["name"], "get_weather");
+        let args: serde_json::Value =
+            serde_json::from_str(tool_calls[0]["function"]["arguments"].as_str().unwrap()).unwrap();
+        assert_eq!(args["city"], "Berlin");
+    }
+    #[test]
+    fn transform_response_finish_reason_mapping() {
+        let p = provider();
+        for (bedrock_reason, expected_oai_reason) in [
+            ("end_turn", "stop"),
+            ("tool_use", "tool_calls"),
+            ("max_tokens", "length"),
+            ("stop_sequence", "stop"),
+            ("content_filtered", "content_filter"),
+            ("guardrail_intervened", "content_filter"),
+            ("unknown_future_reason", "stop"),
+        ] {
+            let mut body = json!({
+                "stopReason": bedrock_reason,
+                "output": {"message": {"role": "assistant", "content": [{"text": ""}]}},
+                "usage": {"inputTokens": 0, "outputTokens": 0}
+            });
+            p.transform_response(&mut body).unwrap();
+            assert_eq!(
+                body["choices"][0]["finish_reason"], expected_oai_reason,
+                "bedrock stopReason '{bedrock_reason}' should map to '{expected_oai_reason}'"
+            );
+        }
+    }
+    // ── model prefix / matching ───────────────────────────────────────────────
+    #[test]
+    fn strip_model_prefix() {
+        let p = provider();
+        assert_eq!(p.strip_model_prefix("bedrock/anthropic.claude-3"), "anthropic.claude-3");
+        assert_eq!(p.strip_model_prefix("anthropic.claude-3"), "anthropic.claude-3");
+    }
+    #[test]
+    fn matches_model() {
+        let p = provider();
+        assert!(p.matches_model("bedrock/anthropic.claude-3"));
+        assert!(!p.matches_model("anthropic.claude-3"));
+        assert!(!p.matches_model("gpt-4"));
+    }
+    // ── stream_format ─────────────────────────────────────────────────────────
+    #[test]
+    fn stream_format_is_eventstream() {
+        let p = provider();
+        assert_eq!(p.stream_format(), StreamFormat::AwsEventStream);
+    }
+    // ── build_stream_url ──────────────────────────────────────────────────────
+    #[test]
+    fn build_stream_url_chat_completions() {
+        let p = provider();
+        let url = p.build_stream_url("/chat/completions", "anthropic.claude-3-sonnet-20240229-v1:0");
+        assert_eq!(
+            url,
+            "https://bedrock-runtime.us-east-1.amazonaws.com/model/anthropic.claude-3-sonnet-20240229-v1%3A0/converse-stream"
+        );
+    }
+    #[test]
+    fn build_stream_url_non_chat_falls_back() {
+        let p = provider();
+        let url = p.build_stream_url("/embeddings", "amazon.titan-embed-text-v1");
+        assert_eq!(
+            url,
+            "https://bedrock-runtime.us-east-1.amazonaws.com/model/amazon.titan-embed-text-v1/invoke"
+        );
+    }
+    // ── parse_bedrock_stream_event ────────────────────────────────────────────
+    #[test]
+    fn parse_stream_event_message_start() {
+        let chunk = parse_bedrock_stream_event("messageStart", r#"{"role":"assistant"}"#)
+            .unwrap()
+            .unwrap();
+        assert_eq!(chunk.choices[0].delta.role.as_deref(), Some("assistant"));
+    }
+    #[test]
+    fn parse_stream_event_text_delta() {
+        let chunk = parse_bedrock_stream_event(
+            "contentBlockDelta",
+            r#"{"contentBlockIndex":0,"delta":{"text":"Hello world"}}"#,
+        )
+        .unwrap()
+        .unwrap();
+        assert_eq!(chunk.choices[0].delta.content.as_deref(), Some("Hello world"));
+    }
+    #[test]
+    fn parse_stream_event_tool_use_start() {
+        let chunk = parse_bedrock_stream_event(
+            "contentBlockStart",
+            r#"{"contentBlockIndex":0,"start":{"toolUse":{"toolUseId":"call_123","name":"get_weather"}}}"#,
+        )
+        .unwrap()
+        .unwrap();
+        let tc = &chunk.choices[0].delta.tool_calls.as_ref().unwrap()[0];
+        assert_eq!(tc.id.as_deref(), Some("call_123"));
+        assert_eq!(tc.function.as_ref().unwrap().name.as_deref(), Some("get_weather"));
+    }
+    #[test]
+    fn parse_stream_event_tool_use_input_delta() {
+        let chunk = parse_bedrock_stream_event(
+            "contentBlockDelta",
+            r#"{"contentBlockIndex":0,"delta":{"toolUse":{"input":"{\"city\":\"Berlin\"}"}}}"#,
+        )
+        .unwrap()
+        .unwrap();
+        let tc = &chunk.choices[0].delta.tool_calls.as_ref().unwrap()[0];
+        assert_eq!(
+            tc.function.as_ref().unwrap().arguments.as_deref(),
+            Some("{\"city\":\"Berlin\"}")
+        );
+    }
+    #[test]
+    fn parse_stream_event_message_stop() {
+        let chunk = parse_bedrock_stream_event("messageStop", r#"{"stopReason":"end_turn"}"#)
+            .unwrap()
+            .unwrap();
+        assert_eq!(chunk.choices[0].finish_reason, Some(FinishReason::Stop));
+    }
+    #[test]
+    fn parse_stream_event_metadata_usage() {
+        let chunk = parse_bedrock_stream_event("metadata", r#"{"usage":{"inputTokens":42,"outputTokens":10}}"#)
+            .unwrap()
+            .unwrap();
+        let usage = chunk.usage.unwrap();
+        assert_eq!(usage.prompt_tokens, 42);
+        assert_eq!(usage.completion_tokens, 10);
+    }
+    #[test]
+    fn parse_stream_event_content_block_stop_returns_none() {
+        let result = parse_bedrock_stream_event("contentBlockStop", r#"{"contentBlockIndex":0}"#).unwrap();
+        assert!(result.is_none());
+    }
+    #[test]
+    fn parse_stream_event_unknown_returns_none() {
+        let result = parse_bedrock_stream_event("futureEventType", r#"{}"#).unwrap();
+        assert!(result.is_none());
+    }
+    // ── Extended thinking / reasoning effort ─────────────────────────────────
+    #[test]
+    fn transform_request_reasoning_effort_low() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "Think step by step."}],
+            "reasoning_effort": "low",
+            "max_tokens": 1000
+        });
+        p.transform_request(&mut body).unwrap();
+        let amf = &body["additionalModelRequestFields"];
+        assert_eq!(amf["thinking"]["type"], "enabled");
+        assert_eq!(amf["thinking"]["budget_tokens"], 1024);
+    }
+    #[test]
+    fn transform_request_reasoning_effort_medium() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "Think."}],
+            "reasoning_effort": "medium"
+        });
+        p.transform_request(&mut body).unwrap();
+        assert_eq!(body["additionalModelRequestFields"]["thinking"]["budget_tokens"], 4096);
+    }
+    #[test]
+    fn transform_request_reasoning_effort_high() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "Think hard."}],
+            "reasoning_effort": "high"
+        });
+        p.transform_request(&mut body).unwrap();
+        assert_eq!(body["additionalModelRequestFields"]["thinking"]["budget_tokens"], 16384);
+    }
+    #[test]
+    fn transform_request_no_reasoning_effort_omits_amf() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "hi"}]
+        });
+        p.transform_request(&mut body).unwrap();
+        assert!(body.get("additionalModelRequestFields").is_none());
+    }
+    // ── Document handling ────────────────────────────────────────────────────
+    #[test]
+    fn transform_request_document_content_part() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{
+                "role": "user",
+                "content": [
+                    {"type": "text", "text": "Summarize this document."},
+                    {
+                        "type": "document",
+                        "document": {
+                            "data": "JVBERi0xLjQ=",
+                            "media_type": "application/pdf"
+                        }
+                    }
+                ]
+            }]
+        });
+        p.transform_request(&mut body).unwrap();
+        let content = body["messages"][0]["content"].as_array().unwrap();
+        assert_eq!(content.len(), 2);
+        // First part: text
+        assert_eq!(content[0]["text"], "Summarize this document.");
+        // Second part: document
+        let doc = &content[1]["document"];
+        assert_eq!(doc["name"], "doc");
+        assert_eq!(doc["format"], "pdf");
+        assert_eq!(doc["source"]["bytes"], "JVBERi0xLjQ=");
+    }
+    #[test]
+    fn transform_request_document_csv_format() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{
+                "role": "user",
+                "content": [
+                    {
+                        "type": "document",
+                        "document": {
+                            "data": "Y29sMSxjb2wy",
+                            "media_type": "text/csv"
+                        }
+                    }
+                ]
+            }]
+        });
+        p.transform_request(&mut body).unwrap();
+        let doc = &body["messages"][0]["content"][0]["document"];
+        assert_eq!(doc["format"], "csv");
+    }
+    // ── Guardrails ───────────────────────────────────────────────────────────
+    #[test]
+    fn transform_request_guardrails() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "hello"}],
+            "extra_body": {
+                "guardrailConfig": {
+                    "guardrailIdentifier": "my-guardrail-id",
+                    "guardrailVersion": "DRAFT",
+                    "trace": "enabled"
+                }
+            }
+        });
+        p.transform_request(&mut body).unwrap();
+        let gc = &body["guardrailConfig"];
+        assert_eq!(gc["guardrailIdentifier"], "my-guardrail-id");
+        assert_eq!(gc["guardrailVersion"], "DRAFT");
+        assert_eq!(gc["trace"], "enabled");
+    }
+    #[test]
+    fn transform_request_no_guardrails_omits_config() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "hello"}]
+        });
+        p.transform_request(&mut body).unwrap();
+        assert!(body.get("guardrailConfig").is_none());
+    }
+    // ── Response format / structured output ──────────────────────────────────
+    #[test]
+    fn transform_request_json_object_response_format() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "Give me JSON."}],
+            "response_format": {"type": "json_object"}
+        });
+        p.transform_request(&mut body).unwrap();
+        // Should have a system instruction for JSON output.
+        let system = body["system"].as_array().unwrap();
+        let has_json_instruction = system
+            .iter()
+            .any(|s| s["text"].as_str().unwrap_or("").contains("valid JSON"));
+        assert!(has_json_instruction, "should inject JSON instruction in system");
+    }
+    #[test]
+    fn transform_request_json_schema_response_format() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "Give me structured data."}],
+            "response_format": {
+                "type": "json_schema",
+                "json_schema": {
+                    "name": "my_schema",
+                    "schema": {
+                        "type": "object",
+                        "properties": {
+                            "name": {"type": "string"}
+                        }
+                    }
+                }
+            }
+        });
+        p.transform_request(&mut body).unwrap();
+        let system = body["system"].as_array().unwrap();
+        let json_instruction = system
+            .iter()
+            .find(|s| s["text"].as_str().unwrap_or("").contains("valid JSON"))
+            .unwrap();
+        let text = json_instruction["text"].as_str().unwrap();
+        assert!(
+            text.contains("conforms to this schema"),
+            "should include schema reference: {text}"
+        );
+        assert!(text.contains("\"name\""), "should include the schema content: {text}");
+    }
+    #[test]
+    fn transform_request_text_response_format_no_injection() {
+        let p = provider();
+        let mut body = json!({
+            "messages": [{"role": "user", "content": "hello"}],
+            "response_format": {"type": "text"}
+        });
+        p.transform_request(&mut body).unwrap();
+        // No system instruction should be added for plain text format.
+        assert!(body.get("system").is_none());
+    }
+    // ── Cross-region inference ───────────────────────────────────────────────
+    #[test]
+    #[serial]
+    fn apply_cross_region_prefix_when_set() {
+        // SAFETY: env vars are process-global; `#[serial]` ensures no parallel mutation.
+        unsafe { std::env::set_var("BEDROCK_CROSS_REGION", "us") };
+        let result = super::apply_cross_region_prefix("anthropic.claude-3-sonnet-20240229-v1:0");
+        assert_eq!(result, "us.anthropic.claude-3-sonnet-20240229-v1:0");
+        unsafe { std::env::remove_var("BEDROCK_CROSS_REGION") };
+    }
+    #[test]
+    #[serial]
+    fn apply_cross_region_prefix_no_double_prefix() {
+        // SAFETY: env vars are process-global; `#[serial]` ensures no parallel mutation.
+        unsafe { std::env::set_var("BEDROCK_CROSS_REGION", "eu") };
+        let result = super::apply_cross_region_prefix("eu.anthropic.claude-3-sonnet-20240229-v1:0");
+        assert_eq!(
+            result, "eu.anthropic.claude-3-sonnet-20240229-v1:0",
+            "should not double-prefix"
+        );
+        unsafe { std::env::remove_var("BEDROCK_CROSS_REGION") };
+    }
+    #[test]
+    #[serial]
+    fn apply_cross_region_prefix_unset() {
+        // SAFETY: env vars are process-global; `#[serial]` ensures no parallel mutation.
+        unsafe { std::env::remove_var("BEDROCK_CROSS_REGION") };
+        let result = super::apply_cross_region_prefix("anthropic.claude-3-sonnet-20240229-v1:0");
+        assert_eq!(result, "anthropic.claude-3-sonnet-20240229-v1:0");
+    }
+    // ── Helper function tests ────────────────────────────────────────────────
+    #[test]
+    fn reasoning_effort_budget_tokens() {
+        assert_eq!(super::reasoning_effort_to_budget_tokens("low"), 1024);
+        assert_eq!(super::reasoning_effort_to_budget_tokens("medium"), 4096);
+        assert_eq!(super::reasoning_effort_to_budget_tokens("high"), 16384);
+        assert_eq!(super::reasoning_effort_to_budget_tokens("unknown"), 4096);
+    }
+    #[test]
+    fn format_from_media_type_extraction() {
+        assert_eq!(super::format_from_media_type("application/pdf"), "pdf");
+        assert_eq!(super::format_from_media_type("text/csv"), "csv");
+        assert_eq!(
+            super::format_from_media_type("application/vnd.openxmlformats-officedocument.wordprocessingml.document"),
+            "vnd.openxmlformats-officedocument.wordprocessingml.document"
+        );
+        assert_eq!(super::format_from_media_type("pdf"), "pdf"); // fallback
+    }
+}