npm - ai-functions - Versions diffs - 2.1.3 → 2.4.0 - Mend

ai-functions 2.1.3 → 2.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (284) hide show

package/.turbo/turbo-build.log +1 -1
package/CHANGELOG.md +90 -1
package/README.md +38 -0
package/dist/ai-promise.d.ts +3 -3
package/dist/ai-promise.d.ts.map +1 -1
package/dist/ai-promise.js +135 -64
package/dist/ai-promise.js.map +1 -1
package/dist/ai-schemas.d.ts +56 -0
package/dist/ai-schemas.d.ts.map +1 -0
package/dist/ai-schemas.js +53 -0
package/dist/ai-schemas.js.map +1 -0
package/dist/ai.d.ts +16 -242
package/dist/ai.d.ts.map +1 -1
package/dist/ai.js +51 -858
package/dist/ai.js.map +1 -1
package/dist/batch/anthropic.d.ts +6 -4
package/dist/batch/anthropic.d.ts.map +1 -1
package/dist/batch/anthropic.js +83 -145
package/dist/batch/anthropic.js.map +1 -1
package/dist/batch/bedrock.d.ts +8 -30
package/dist/batch/bedrock.d.ts.map +1 -1
package/dist/batch/bedrock.js +155 -338
package/dist/batch/bedrock.js.map +1 -1
package/dist/batch/cloudflare.d.ts +8 -20
package/dist/batch/cloudflare.d.ts.map +1 -1
package/dist/batch/cloudflare.js +68 -189
package/dist/batch/cloudflare.js.map +1 -1
package/dist/batch/google.d.ts +6 -20
package/dist/batch/google.d.ts.map +1 -1
package/dist/batch/google.js +70 -238
package/dist/batch/google.js.map +1 -1
package/dist/batch/index.d.ts +4 -1
package/dist/batch/index.d.ts.map +1 -1
package/dist/batch/index.js +4 -1
package/dist/batch/index.js.map +1 -1
package/dist/batch/memory.d.ts +1 -1
package/dist/batch/memory.d.ts.map +1 -1
package/dist/batch/memory.js +14 -10
package/dist/batch/memory.js.map +1 -1
package/dist/batch/openai.d.ts +11 -14
package/dist/batch/openai.d.ts.map +1 -1
package/dist/batch/openai.js +52 -156
package/dist/batch/openai.js.map +1 -1
package/dist/batch/provider.d.ts +111 -0
package/dist/batch/provider.d.ts.map +1 -0
package/dist/batch/provider.js +233 -0
package/dist/batch/provider.js.map +1 -0
package/dist/batch-map.d.ts.map +1 -1
package/dist/batch-map.js +23 -17
package/dist/batch-map.js.map +1 -1
package/dist/batch-queue.d.ts +65 -0
package/dist/batch-queue.d.ts.map +1 -1
package/dist/batch-queue.js +169 -14
package/dist/batch-queue.js.map +1 -1
package/dist/budget.d.ts.map +1 -1
package/dist/budget.js +27 -14
package/dist/budget.js.map +1 -1
package/dist/cache.d.ts +23 -0
package/dist/cache.d.ts.map +1 -1
package/dist/cache.js +36 -15
package/dist/cache.js.map +1 -1
package/dist/context.d.ts +26 -8
package/dist/context.d.ts.map +1 -1
package/dist/context.js +64 -62
package/dist/context.js.map +1 -1
package/dist/digital-objects-registry.d.ts +229 -0
package/dist/digital-objects-registry.d.ts.map +1 -0
package/dist/digital-objects-registry.js +617 -0
package/dist/digital-objects-registry.js.map +1 -0
package/dist/embeddings.d.ts +2 -2
package/dist/embeddings.d.ts.map +1 -1
package/dist/errors.d.ts +22 -0
package/dist/errors.d.ts.map +1 -0
package/dist/errors.js +35 -0
package/dist/errors.js.map +1 -0
package/dist/eval/runner.d.ts +8 -0
package/dist/eval/runner.d.ts.map +1 -1
package/dist/eval/runner.js +41 -35
package/dist/eval/runner.js.map +1 -1
package/dist/eval-log/in-memory.d.ts +34 -0
package/dist/eval-log/in-memory.d.ts.map +1 -0
package/dist/eval-log/in-memory.js +84 -0
package/dist/eval-log/in-memory.js.map +1 -0
package/dist/eval-log/index.d.ts +29 -0
package/dist/eval-log/index.d.ts.map +1 -0
package/dist/eval-log/index.js +39 -0
package/dist/eval-log/index.js.map +1 -0
package/dist/eval-log/types.d.ts +101 -0
package/dist/eval-log/types.d.ts.map +1 -0
package/dist/eval-log/types.js +16 -0
package/dist/eval-log/types.js.map +1 -0
package/dist/function-registry.d.ts +176 -0
package/dist/function-registry.d.ts.map +1 -0
package/dist/function-registry.js +685 -0
package/dist/function-registry.js.map +1 -0
package/dist/generate.d.ts +9 -3
package/dist/generate.d.ts.map +1 -1
package/dist/generate.js +18 -18
package/dist/generate.js.map +1 -1
package/dist/index.d.ts +18 -11
package/dist/index.d.ts.map +1 -1
package/dist/index.js +35 -18
package/dist/index.js.map +1 -1
package/dist/logger.d.ts +118 -0
package/dist/logger.d.ts.map +1 -0
package/dist/logger.js +187 -0
package/dist/logger.js.map +1 -0
package/dist/middleware/budget.d.ts +84 -0
package/dist/middleware/budget.d.ts.map +1 -0
package/dist/middleware/budget.js +110 -0
package/dist/middleware/budget.js.map +1 -0
package/dist/middleware/cache.d.ts +103 -0
package/dist/middleware/cache.d.ts.map +1 -0
package/dist/middleware/cache.js +228 -0
package/dist/middleware/cache.js.map +1 -0
package/dist/middleware/embed-cache.d.ts +99 -0
package/dist/middleware/embed-cache.d.ts.map +1 -0
package/dist/middleware/embed-cache.js +128 -0
package/dist/middleware/embed-cache.js.map +1 -0
package/dist/middleware/index.d.ts +11 -0
package/dist/middleware/index.d.ts.map +1 -0
package/dist/middleware/index.js +11 -0
package/dist/middleware/index.js.map +1 -0
package/dist/middleware/trace.d.ts +103 -0
package/dist/middleware/trace.d.ts.map +1 -0
package/dist/middleware/trace.js +176 -0
package/dist/middleware/trace.js.map +1 -0
package/dist/primitives.d.ts +120 -1
package/dist/primitives.d.ts.map +1 -1
package/dist/primitives.js +398 -26
package/dist/primitives.js.map +1 -1
package/dist/retry.d.ts +66 -1
package/dist/retry.d.ts.map +1 -1
package/dist/retry.js +115 -8
package/dist/retry.js.map +1 -1
package/dist/sandbox.d.ts +36 -0
package/dist/sandbox.d.ts.map +1 -0
package/dist/sandbox.js +44 -0
package/dist/sandbox.js.map +1 -0
package/dist/schema.js +2 -2
package/dist/schema.js.map +1 -1
package/dist/telemetry.d.ts +128 -0
package/dist/telemetry.d.ts.map +1 -0
package/dist/telemetry.js +285 -0
package/dist/telemetry.js.map +1 -0
package/dist/template.d.ts.map +1 -1
package/dist/template.js +6 -1
package/dist/template.js.map +1 -1
package/dist/tool-orchestration.d.ts +66 -4
package/dist/tool-orchestration.d.ts.map +1 -1
package/dist/tool-orchestration.js +123 -23
package/dist/tool-orchestration.js.map +1 -1
package/dist/type-guards.d.ts +28 -0
package/dist/type-guards.d.ts.map +1 -0
package/dist/type-guards.js +29 -0
package/dist/type-guards.js.map +1 -0
package/dist/types.d.ts +155 -19
package/dist/types.d.ts.map +1 -1
package/dist/types.js +36 -1
package/dist/types.js.map +1 -1
package/dist/wrap-for-v3.d.ts +80 -0
package/dist/wrap-for-v3.d.ts.map +1 -0
package/dist/wrap-for-v3.js +89 -0
package/dist/wrap-for-v3.js.map +1 -0
package/examples/00-quickstart.ts +232 -0
package/examples/01-rag-chatbot.ts +212 -0
package/examples/02-multi-agent-research.ts +290 -0
package/examples/03-email-classification.ts +379 -0
package/examples/04-content-moderation.ts +400 -0
package/examples/05-document-extraction.ts +455 -0
package/examples/06-streaming-chat-nextjs.ts +437 -0
package/examples/07-cloudflare-worker.ts +483 -0
package/examples/08-batch-processing.ts +491 -0
package/examples/09-budget-constrained.ts +527 -0
package/examples/10-tool-orchestration.ts +565 -0
package/examples/11-retry-resilience.ts +403 -0
package/examples/12-caching-strategies.ts +422 -0
package/examples/README.md +145 -0
package/package.json +29 -25
package/src/ai-promise.ts +226 -140
package/src/ai-schemas.ts +122 -0
package/src/ai.ts +71 -1176
package/src/batch/anthropic.ts +96 -161
package/src/batch/bedrock.ts +203 -454
package/src/batch/cloudflare.ts +99 -282
package/src/batch/google.ts +91 -297
package/src/batch/index.ts +4 -1
package/src/batch/memory.ts +15 -10
package/src/batch/openai.ts +65 -193
package/src/batch/provider.ts +336 -0
package/src/batch-map.ts +29 -24
package/src/batch-queue.ts +200 -11
package/src/budget.ts +31 -18
package/src/cache.ts +45 -17
package/src/context.ts +106 -77
package/src/digital-objects-registry.ts +750 -0
package/src/errors.ts +37 -0
package/src/eval/runner.ts +60 -36
package/src/eval-log/in-memory.ts +90 -0
package/src/eval-log/index.ts +46 -0
package/src/eval-log/types.ts +110 -0
package/src/function-registry.ts +874 -0
package/src/generate.ts +33 -28
package/src/index.ts +122 -21
package/src/logger.ts +232 -0
package/src/middleware/budget.ts +171 -0
package/src/middleware/cache.ts +299 -0
package/src/middleware/embed-cache.ts +195 -0
package/src/middleware/index.ts +23 -0
package/src/middleware/trace.ts +248 -0
package/src/primitives.ts +589 -62
package/src/retry.ts +144 -18
package/src/sandbox.ts +52 -0
package/src/schema.ts +8 -8
package/src/telemetry.ts +403 -0
package/src/template.ts +8 -4
package/src/tool-orchestration.ts +213 -48
package/src/type-guards.ts +31 -0
package/src/types.ts +186 -27
package/src/wrap-for-v3.ts +105 -0
package/test/ai-promise.test.ts +1080 -0
package/test/ai-proxy.test.ts +1 -1
package/test/batch-autosubmit-errors.test.ts +49 -37
package/test/batch-blog-posts.test.ts +87 -129
package/test/core-functions.test.ts +183 -579
package/test/decide.test.ts +154 -322
package/test/define.test.ts +211 -8
package/test/digital-objects-registry.test.ts +760 -0
package/test/embedding-cache-middleware.test.ts +140 -0
package/test/fill-template.test.ts +89 -0
package/test/generate-core.test.ts +140 -229
package/test/implicit-batch.test.ts +22 -65
package/test/retry-policy-integration.test.ts +117 -0
package/test/sandbox-execution.test.ts +155 -0
package/test/schema.test.ts +55 -19
package/test/template.test.ts +1164 -0
package/test/tool-orchestration.test.ts +270 -0
package/test/wrap-for-v3.test.ts +612 -0
package/vitest.config.js +6 -0
package/vitest.config.ts +20 -0
package/LICENSE +0 -21
package/dist/rpc/auth.d.ts +0 -69
package/dist/rpc/auth.d.ts.map +0 -1
package/dist/rpc/auth.js +0 -136
package/dist/rpc/auth.js.map +0 -1
package/dist/rpc/client.d.ts +0 -62
package/dist/rpc/client.d.ts.map +0 -1
package/dist/rpc/client.js +0 -103
package/dist/rpc/client.js.map +0 -1
package/dist/rpc/deferred.d.ts +0 -60
package/dist/rpc/deferred.d.ts.map +0 -1
package/dist/rpc/deferred.js +0 -96
package/dist/rpc/deferred.js.map +0 -1
package/dist/rpc/index.d.ts +0 -22
package/dist/rpc/index.d.ts.map +0 -1
package/dist/rpc/index.js +0 -38
package/dist/rpc/index.js.map +0 -1
package/dist/rpc/local.d.ts +0 -42
package/dist/rpc/local.d.ts.map +0 -1
package/dist/rpc/local.js +0 -50
package/dist/rpc/local.js.map +0 -1
package/dist/rpc/server.d.ts +0 -165
package/dist/rpc/server.d.ts.map +0 -1
package/dist/rpc/server.js +0 -405
package/dist/rpc/server.js.map +0 -1
package/dist/rpc/session.d.ts +0 -32
package/dist/rpc/session.d.ts.map +0 -1
package/dist/rpc/session.js +0 -43
package/dist/rpc/session.js.map +0 -1
package/dist/rpc/transport.d.ts +0 -306
package/dist/rpc/transport.d.ts.map +0 -1
package/dist/rpc/transport.js +0 -731
package/dist/rpc/transport.js.map +0 -1
package/src/batch/anthropic.js +0 -256
package/src/batch/bedrock.js +0 -584
package/src/batch/cloudflare.js +0 -287
package/src/batch/google.js +0 -359
package/src/batch/index.js +0 -30
package/src/batch/memory.js +0 -187
package/src/batch/openai.js +0 -402
package/src/eval/index.js +0 -7
package/src/eval/models.js +0 -119
package/src/eval/runner.js +0 -147
package/test/schema.test.js +0 -96

package/src/batch/bedrock.ts CHANGED Viewed

@@ -1,30 +1,34 @@
 /**
  * AWS Bedrock Batch Inference Adapter
  *
- * Implements batch processing using AWS Bedrock's batch inference API.
- * Bedrock batch inference provides cost-effective processing for large workloads.
+ * Bedrock has a true batch inference API (S3-driven) and a runtime invoke API.
+ * The "batch" adapter here uses concurrent runtime invocations as a fallback
+ * (no S3 setup required); `createBedrockBatchJob` is exported separately for
+ * callers who want to drive the real S3-based batch flow directly.
  *
  * @see https://docs.aws.amazon.com/bedrock/latest/userguide/batch-inference.html
  *
  * @packageDocumentation
  */
+import { getLogger } from '../logger.js'
 import {
+  LocalJobStore,
+  processConcurrently,
   registerBatchAdapter,
   registerFlexAdapter,
+  tryParseJson,
   type BatchAdapter,
-  type FlexAdapter,
   type BatchItem,
   type BatchJob,
   type BatchQueueOptions,
   type BatchResult,
   type BatchSubmitResult,
-  type BatchStatus,
-} from '../batch-queue.js'
-import { schema as convertSchema } from '../schema.js'
+  type FlexAdapter,
+} from './provider.js'
 // ============================================================================
-// Types
+// Provider-specific types
 // ============================================================================
 interface BedrockBatchRequest {
@@ -38,50 +42,8 @@ interface BedrockBatchRequest {
   }
 }
-interface BedrockBatchResponse {
-  recordId: string
-  modelOutput?: {
-    content: Array<{ type: string; text?: string }>
-    usage: {
-      input_tokens: number
-      output_tokens: number
-    }
-    stop_reason: string
-  }
-  error?: {
-    errorCode: string
-    errorMessage: string
-  }
-}
-interface BedrockBatchJobStatus {
-  jobArn: string
-  jobName: string
-  status: 'Submitted' | 'InProgress' | 'Completed' | 'Failed' | 'Stopping' | 'Stopped'
-  modelId: string
-  inputDataConfig: {
-    s3InputDataConfig: {
-      s3Uri: string
-    }
-  }
-  outputDataConfig: {
-    s3OutputDataConfig: {
-      s3Uri: string
-    }
-  }
-  creationTime: string
-  lastModifiedTime: string
-  endTime?: string
-  failureMessage?: string
-  statistics?: {
-    inputRecordCount: number
-    outputRecordCount: number
-    errorCount: number
-  }
-}
 // ============================================================================
-// AWS Configuration
+// AWS configuration
 // ============================================================================
 let awsRegion: string | undefined
@@ -91,13 +53,10 @@ let awsSessionToken: string | undefined
 let s3Bucket: string | undefined
 let roleArn: string | undefined
-// AI Gateway configuration (optional - for routing through Cloudflare AI Gateway)
 let gatewayUrl: string | undefined
 let gatewayToken: string | undefined
-/**
- * Configure AWS credentials and settings
- */
+/** Configure AWS credentials and settings. */
 export function configureAWSBedrock(options: {
   region?: string
   accessKeyId?: string
@@ -120,19 +79,29 @@ export function configureAWSBedrock(options: {
   if (options.gatewayToken) gatewayToken = options.gatewayToken
 }
-function getConfig() {
-  const region = awsRegion || process.env.AWS_REGION || process.env.AWS_DEFAULT_REGION || 'us-east-1'
-  const accessKeyId = awsAccessKeyId || process.env.AWS_ACCESS_KEY_ID
-  const secretAccessKey = awsSecretAccessKey || process.env.AWS_SECRET_ACCESS_KEY
-  const sessionToken = awsSessionToken || process.env.AWS_SESSION_TOKEN
-  const bucket = s3Bucket || process.env.BEDROCK_BATCH_S3_BUCKET
-  const role = roleArn || process.env.BEDROCK_BATCH_ROLE_ARN
+interface BedrockConfig {
+  region: string
+  accessKeyId: string
+  secretAccessKey: string
+  sessionToken?: string | undefined
+  bucket: string
+  role: string | undefined
+  gatewayUrl: string | undefined
+  gatewayToken: string | undefined
+}
+function getConfig(): BedrockConfig {
+  const region =
+    awsRegion || process.env['AWS_REGION'] || process.env['AWS_DEFAULT_REGION'] || 'us-east-1'
+  const accessKeyId = awsAccessKeyId || process.env['AWS_ACCESS_KEY_ID']
+  const secretAccessKey = awsSecretAccessKey || process.env['AWS_SECRET_ACCESS_KEY']
+  const sessionToken = awsSessionToken || process.env['AWS_SESSION_TOKEN']
+  const bucket = s3Bucket || process.env['BEDROCK_BATCH_S3_BUCKET']
+  const role = roleArn || process.env['BEDROCK_BATCH_ROLE_ARN']
-  // Check for AI Gateway configuration
-  const gwUrl = gatewayUrl || process.env.AI_GATEWAY_URL
-  const gwToken = gatewayToken || process.env.AI_GATEWAY_TOKEN
+  const gwUrl = gatewayUrl || process.env['AI_GATEWAY_URL']
+  const gwToken = gatewayToken || process.env['AI_GATEWAY_TOKEN']
-  // If using gateway, we don't need AWS credentials
   if (gwUrl && gwToken) {
     return {
       region,
@@ -147,30 +116,38 @@ function getConfig() {
   }
   if (!accessKeyId || !secretAccessKey) {
-    throw new Error('AWS credentials not configured. Set AWS_ACCESS_KEY_ID and AWS_SECRET_ACCESS_KEY, or use AI_GATEWAY_URL and AI_GATEWAY_TOKEN')
+    throw new Error(
+      'AWS credentials not configured. Set AWS_ACCESS_KEY_ID and AWS_SECRET_ACCESS_KEY, or use AI_GATEWAY_URL and AI_GATEWAY_TOKEN'
+    )
   }
   if (!bucket) {
     throw new Error('S3 bucket for Bedrock batch not configured. Set BEDROCK_BATCH_S3_BUCKET')
   }
-  return { region, accessKeyId, secretAccessKey, sessionToken, bucket, role, gatewayUrl: undefined, gatewayToken: undefined }
+  return {
+    region,
+    accessKeyId,
+    secretAccessKey,
+    sessionToken,
+    bucket,
+    role,
+    gatewayUrl: undefined,
+    gatewayToken: undefined,
+  }
 }
 // ============================================================================
-// AWS Signature V4 (Simplified)
+// AWS SigV4 (delegated to optional @smithy/signature-v4 if available)
 // ============================================================================
 async function signRequest(
   method: string,
   url: string,
   body: string,
-  config: ReturnType<typeof getConfig>,
+  config: BedrockConfig,
   service: string
 ): Promise<Headers> {
-  // In production, use @aws-sdk/signature-v4 or similar
-  // This is a simplified implementation for demonstration
   const headers = new Headers({
     'Content-Type': 'application/json',
     'X-Amz-Date': new Date().toISOString().replace(/[:-]|\.\d{3}/g, ''),
@@ -180,21 +157,14 @@ async function signRequest(
     headers.set('X-Amz-Security-Token', config.sessionToken)
   }
-  // For actual implementation, compute proper AWS Signature V4
-  // This requires crypto operations that vary by environment
-  // Fallback: Use AWS SDK if available
   try {
-    // Dynamic import to avoid build-time dependency
+    // Optional dependency — present in production, absent in dev/test.
     // @ts-expect-error - Optional dependency
     const signatureV4Module = await import('@smithy/signature-v4')
     // @ts-expect-error - Optional dependency
     const sha256Module = await import('@aws-crypto/sha256-js')
-    const SignatureV4 = signatureV4Module.SignatureV4
-    const Sha256 = sha256Module.Sha256
-    const signer = new SignatureV4({
+    const signer = new signatureV4Module.SignatureV4({
       service,
       region: config.region,
       credentials: {
@@ -202,7 +172,7 @@ async function signRequest(
         secretAccessKey: config.secretAccessKey,
         sessionToken: config.sessionToken,
       },
-      sha256: Sha256,
+      sha256: sha256Module.Sha256,
     })
     const signedRequest = await signer.sign({
@@ -215,301 +185,232 @@ async function signRequest(
     return new Headers(signedRequest.headers as Record<string, string>)
   } catch {
-    // AWS SDK not available - return basic headers
-    // In production, the SDK should always be available
-    console.warn('AWS SDK not available for request signing. Install @smithy/signature-v4 and @aws-crypto/sha256-js')
+    getLogger().warn(
+      'AWS SDK not available for request signing. Install @smithy/signature-v4 and @aws-crypto/sha256-js'
+    )
     return headers
   }
 }
 // ============================================================================
-// In-memory job tracking
+// Local job tracking
 // ============================================================================
-const pendingJobs = new Map<string, {
-  items: BatchItem[]
-  options: BatchQueueOptions
-  jobArn?: string
-  results: BatchResult[]
-  status: BatchStatus
-  createdAt: Date
-  completedAt?: Date
-}>()
-let jobCounter = 0
+const jobs = new LocalJobStore('bedrock_batch')
 // ============================================================================
-// Bedrock Batch Adapter
+// Bedrock batch adapter (BatchProvider port)
 // ============================================================================
-/**
- * AWS Bedrock batch adapter
- *
- * Bedrock batch inference:
- * 1. Uploads input JSONL to S3
- * 2. Creates a batch inference job
- * 3. Results are written to S3
- * 4. Download and parse results
- *
- * Note: This requires S3 bucket access and proper IAM roles.
- */
 const bedrockAdapter: BatchAdapter = {
   async submit(items: BatchItem[], options: BatchQueueOptions): Promise<BatchSubmitResult> {
     const config = getConfig()
-    const jobId = `bedrock_batch_${++jobCounter}_${Date.now()}`
-    // Default to Claude on Bedrock
     const model = options.model || 'anthropic.claude-3-sonnet-20240229-v1:0'
-    // Store job state
-    pendingJobs.set(jobId, {
-      items,
-      options,
-      results: [],
-      status: 'pending',
-      createdAt: new Date(),
-    })
-    // For true Bedrock batch processing:
-    // 1. Create JSONL file with requests
-    // 2. Upload to S3
-    // 3. Create batch inference job via Bedrock API
-    // 4. Poll for completion
-    // 5. Download and parse results from S3
-    // For now, we implement a concurrent processing approach
-    // (similar to Cloudflare) that works without S3 setup
-    const completion = processBedrockRequestsConcurrently(jobId, items, config, model, options)
+    const { id, state } = jobs.create(items, options)
+    // Drive the job state machine in the background.
+    const completion = (async () => {
+      state.status = 'in_progress'
+      const results = await processConcurrently(
+        items,
+        (item) => processBedrockItem(item, config, model),
+        {
+          concurrency: 5, // Bedrock has stricter rate limits.
+          delayBetweenWaves: 1000,
+          onWaveComplete: (partial) => {
+            state.results = partial
+          },
+        }
+      )
+      state.results = results
+      state.status = results.every((r) => r.status === 'completed') ? 'completed' : 'failed'
+      state.completedAt = new Date()
+      return results
+    })()
     const job: BatchJob = {
-      id: jobId,
+      id,
       provider: 'bedrock',
       status: 'pending',
       totalItems: items.length,
       completedItems: 0,
       failedItems: 0,
-      createdAt: new Date(),
-      webhookUrl: options.webhookUrl,
+      createdAt: state.createdAt,
+      ...(options.webhookUrl !== undefined && { webhookUrl: options.webhookUrl }),
     }
     return { job, completion }
   },
   async getStatus(batchId: string): Promise<BatchJob> {
-    const job = pendingJobs.get(batchId)
-    if (!job) {
-      throw new Error(`Batch not found: ${batchId}`)
-    }
-    const completedItems = job.results.filter((r) => r.status === 'completed').length
-    const failedItems = job.results.filter((r) => r.status === 'failed').length
-    return {
-      id: batchId,
-      provider: 'bedrock',
-      status: job.status,
-      totalItems: job.items.length,
-      completedItems,
-      failedItems,
-      createdAt: job.createdAt,
-      completedAt: job.completedAt,
-    }
+    return jobs.snapshot(batchId, 'bedrock')
   },
   async cancel(batchId: string): Promise<void> {
-    const job = pendingJobs.get(batchId)
-    if (job) {
-      job.status = 'cancelled'
-      // If we have a Bedrock job ARN, cancel it
-      if (job.jobArn) {
-        const config = getConfig()
-        const url = `https://bedrock.${config.region}.amazonaws.com/model-invocation-job/${encodeURIComponent(job.jobArn)}/stop`
-        try {
-          await fetch(url, {
-            method: 'POST',
-            headers: await signRequest('POST', url, '', config, 'bedrock'),
-          })
-        } catch (error) {
-          console.warn('Failed to cancel Bedrock job:', error)
-        }
+    if (!jobs.has(batchId)) return
+    const state = jobs.get(batchId)
+    state.status = 'cancelled'
+    const jobArn = state.meta?.['jobArn'] as string | undefined
+    if (jobArn) {
+      const config = getConfig()
+      const url = `https://bedrock.${
+        config.region
+      }.amazonaws.com/model-invocation-job/${encodeURIComponent(jobArn)}/stop`
+      try {
+        await fetch(url, {
+          method: 'POST',
+          headers: await signRequest('POST', url, '', config, 'bedrock'),
+        })
+      } catch (error) {
+        getLogger().warn('Failed to cancel Bedrock job:', error)
       }
     }
   },
   async getResults(batchId: string): Promise<BatchResult[]> {
-    const job = pendingJobs.get(batchId)
-    if (!job) {
-      throw new Error(`Batch not found: ${batchId}`)
-    }
-    return job.results
+    return jobs.get(batchId).results
   },
   async waitForCompletion(batchId: string, pollInterval = 5000): Promise<BatchResult[]> {
-    const job = pendingJobs.get(batchId)
-    if (!job) {
-      throw new Error(`Batch not found: ${batchId}`)
-    }
-    while (job.status !== 'completed' && job.status !== 'failed' && job.status !== 'cancelled') {
-      await new Promise((resolve) => setTimeout(resolve, pollInterval))
-    }
-    return job.results
+    return jobs.waitForCompletion(batchId, pollInterval)
   },
 }
 // ============================================================================
-// Processing (Concurrent Mode)
+// Per-item processing
 // ============================================================================
-/**
- * Process Bedrock requests concurrently
- * This is a fallback when true batch inference isn't configured
- */
-async function processBedrockRequestsConcurrently(
-  jobId: string,
-  items: BatchItem[],
-  config: ReturnType<typeof getConfig>,
-  model: string,
-  options: BatchQueueOptions
-): Promise<BatchResult[]> {
-  const job = pendingJobs.get(jobId)
-  if (!job) {
-    throw new Error(`Job not found: ${jobId}`)
+async function processBedrockItem(
+  item: BatchItem,
+  config: BedrockConfig,
+  model: string
+): Promise<BatchResult> {
+  if (config.gatewayUrl && config.gatewayToken) {
+    return processBedrockItemViaGateway(item, config, model)
   }
-  job.status = 'in_progress'
-  // Process with concurrency limit
-  const CONCURRENCY = 5 // Bedrock has stricter rate limits
-  const results: BatchResult[] = []
-  for (let i = 0; i < items.length; i += CONCURRENCY) {
-    const batch = items.slice(i, i + CONCURRENCY)
-    const batchResults = await Promise.all(
-      batch.map(async (item) => {
-        try {
-          return await processBedrockItem(item, config, model)
-        } catch (error) {
-          return {
-            id: item.id,
-            customId: item.id,
-            status: 'failed' as const,
-            error: error instanceof Error ? error.message : 'Unknown error',
-          }
-        }
-      })
-    )
+  const url = `https://bedrock-runtime.${config.region}.amazonaws.com/model/${encodeURIComponent(
+    model
+  )}/invoke`
-    results.push(...batchResults)
-    job.results = results
+  const body = buildBedrockRequestBody(item, model)
+  const bodyStr = JSON.stringify(body)
+  const headers = await signRequest('POST', url, bodyStr, config, 'bedrock')
-    // Respect rate limits
-    if (i + CONCURRENCY < items.length) {
-      await new Promise((resolve) => setTimeout(resolve, 1000))
-    }
+  const response = await fetch(url, { method: 'POST', headers, body: bodyStr })
+  if (!response.ok) {
+    const error = await response.text()
+    throw new Error(`Bedrock API error: ${response.status} ${error}`)
   }
-  job.status = results.every((r) => r.status === 'completed') ? 'completed' : 'failed'
-  job.completedAt = new Date()
-  return results
+  return parseBedrockResponse(item, await response.json())
 }
-async function processBedrockItem(
+/**
+ * Process a Bedrock item via Cloudflare AI Gateway.
+ *
+ * Note: AI Gateway routes the request but doesn't handle authentication —
+ * Bedrock still requires AWS SigV4 signing.
+ * @see https://developers.cloudflare.com/ai-gateway/usage/providers/bedrock/
+ */
+async function processBedrockItemViaGateway(
   item: BatchItem,
-  config: ReturnType<typeof getConfig>,
+  config: BedrockConfig,
   model: string
 ): Promise<BatchResult> {
-  // Check if using AI Gateway
-  if (config.gatewayUrl && config.gatewayToken) {
-    return processBedrockItemViaGateway(item, config, model)
+  const url = `${config.gatewayUrl}/aws-bedrock/bedrock-runtime/${
+    config.region
+  }/model/${encodeURIComponent(model)}/invoke`
+  const body: Record<string, unknown> = {
+    anthropic_version: 'bedrock-2023-05-31',
+    max_tokens: item.options?.maxTokens || 4096,
+    messages: [{ role: 'user', content: item.prompt }],
+    ...(item.options?.system !== undefined && { system: item.options.system }),
+    ...(item.options?.temperature !== undefined && { temperature: item.options.temperature }),
   }
-  const url = `https://bedrock-runtime.${config.region}.amazonaws.com/model/${encodeURIComponent(model)}/invoke`
+  const bodyStr = JSON.stringify(body)
-  // Build the request body based on the model type
-  let body: Record<string, unknown>
+  if (!config.accessKeyId || !config.secretAccessKey) {
+    throw new Error(
+      'Bedrock via AI Gateway still requires AWS credentials for SigV4 signing. ' +
+        'Set AWS_ACCESS_KEY_ID and AWS_SECRET_ACCESS_KEY.'
+    )
+  }
+  const headers = await signRequest('POST', url, bodyStr, config, 'bedrock')
+  headers.set('cf-aig-authorization', `Bearer ${config.gatewayToken}`)
+  const response = await fetch(url, { method: 'POST', headers, body: bodyStr })
+  if (!response.ok) {
+    const error = await response.text()
+    throw new Error(`Bedrock via Gateway error: ${response.status} ${error}`)
+  }
+  return parseBedrockResponse(item, await response.json())
+}
+/** Build the Bedrock invoke body for the model family. */
+function buildBedrockRequestBody(item: BatchItem, model: string): Record<string, unknown> {
   if (model.includes('anthropic')) {
-    // Anthropic models on Bedrock
-    body = {
+    return {
       anthropic_version: 'bedrock-2023-05-31',
       max_tokens: item.options?.maxTokens || 4096,
       messages: [{ role: 'user', content: item.prompt }],
-      system: item.options?.system,
-      temperature: item.options?.temperature,
+      ...(item.options?.system !== undefined && { system: item.options.system }),
+      ...(item.options?.temperature !== undefined && { temperature: item.options.temperature }),
     }
-  } else if (model.includes('amazon')) {
-    // Amazon Titan models
-    body = {
+  }
+  if (model.includes('amazon')) {
+    return {
       inputText: item.prompt,
       textGenerationConfig: {
         maxTokenCount: item.options?.maxTokens || 4096,
         temperature: item.options?.temperature || 0.7,
       },
     }
-  } else if (model.includes('meta')) {
-    // Meta Llama models
-    body = {
+  }
+  if (model.includes('meta')) {
+    return {
       prompt: item.prompt,
       max_gen_len: item.options?.maxTokens || 4096,
       temperature: item.options?.temperature || 0.7,
     }
-  } else if (model.includes('mistral')) {
-    // Mistral models
-    body = {
+  }
+  if (model.includes('mistral')) {
+    return {
       prompt: `<s>[INST] ${item.prompt} [/INST]`,
       max_tokens: item.options?.maxTokens || 4096,
       temperature: item.options?.temperature || 0.7,
     }
-  } else {
-    // Generic format (Claude-style)
-    body = {
-      anthropic_version: 'bedrock-2023-05-31',
-      max_tokens: item.options?.maxTokens || 4096,
-      messages: [{ role: 'user', content: item.prompt }],
-      temperature: item.options?.temperature,
-    }
   }
-  const bodyStr = JSON.stringify(body)
-  const headers = await signRequest('POST', url, bodyStr, config, 'bedrock')
-  const response = await fetch(url, {
-    method: 'POST',
-    headers,
-    body: bodyStr,
-  })
-  if (!response.ok) {
-    const error = await response.text()
-    throw new Error(`Bedrock API error: ${response.status} ${error}`)
+  // Default: Claude-style.
+  return {
+    anthropic_version: 'bedrock-2023-05-31',
+    max_tokens: item.options?.maxTokens || 4096,
+    messages: [{ role: 'user', content: item.prompt }],
+    ...(item.options?.temperature !== undefined && { temperature: item.options.temperature }),
   }
+}
-  const data = await response.json() as {
-    // Anthropic format
+/** Parse a Bedrock invoke response across model families. */
+function parseBedrockResponse(item: BatchItem, raw: unknown): BatchResult {
+  const data = raw as {
     content?: Array<{ type: string; text?: string }>
     usage?: { input_tokens: number; output_tokens: number }
-    // Titan format
     results?: Array<{ outputText: string; tokenCount: number }>
-    // Llama/Mistral format
     generation?: string
     generation_token_count?: number
     prompt_token_count?: number
   }
-  // Extract content based on model response format
   let content: string | undefined
   let usage: { promptTokens: number; completionTokens: number; totalTokens: number } | undefined
   if (data.content) {
-    // Anthropic format
-    const textContent = data.content.find((c) => c.type === 'text')
-    content = textContent?.text
+    content = data.content.find((c) => c.type === 'text')?.text
     if (data.usage) {
       usage = {
         promptTokens: data.usage.input_tokens,
@@ -518,15 +419,13 @@ async function processBedrockItem(
       }
     }
   } else if (data.results?.[0]) {
-    // Titan format
     content = data.results[0].outputText
     usage = {
-      promptTokens: 0, // Titan doesn't return this
+      promptTokens: 0,
       completionTokens: data.results[0].tokenCount || 0,
       totalTokens: data.results[0].tokenCount || 0,
     }
   } else if (data.generation) {
-    // Llama/Mistral format
     content = data.generation
     if (data.generation_token_count !== undefined) {
       usage = {
@@ -537,123 +436,22 @@ async function processBedrockItem(
     }
   }
-  let result: unknown = content
-  // Try to parse JSON if schema was provided
-  if (item.schema && content) {
-    try {
-      result = JSON.parse(content)
-    } catch {
-      // Keep as string
-    }
-  }
-  return {
-    id: item.id,
-    customId: item.id,
-    status: 'completed',
-    result,
-    usage,
-  }
-}
-/**
- * Process a Bedrock item via Cloudflare AI Gateway
- *
- * NOTE: Unlike OpenAI and Google, Bedrock via AI Gateway still requires AWS Signature V4 signing.
- * The gateway routes the request but doesn't handle authentication.
- * @see https://developers.cloudflare.com/ai-gateway/usage/providers/bedrock/
- *
- * Gateway URL format: {gateway_url}/aws-bedrock/bedrock-runtime/{region}/model/{model}/invoke
- */
-async function processBedrockItemViaGateway(
-  item: BatchItem,
-  config: ReturnType<typeof getConfig>,
-  model: string
-): Promise<BatchResult> {
-  // AI Gateway URL for Bedrock - requires full path including region
-  // Format: {gateway_url}/aws-bedrock/bedrock-runtime/{region}/model/{model}/invoke
-  const url = `${config.gatewayUrl}/aws-bedrock/bedrock-runtime/${config.region}/model/${encodeURIComponent(model)}/invoke`
-  // Build the request body (Anthropic format for Claude models)
-  const body: Record<string, unknown> = {
-    anthropic_version: 'bedrock-2023-05-31',
-    max_tokens: item.options?.maxTokens || 4096,
-    messages: [{ role: 'user', content: item.prompt }],
-    system: item.options?.system,
-    temperature: item.options?.temperature,
-  }
-  const bodyStr = JSON.stringify(body)
-  // NOTE: Bedrock via Gateway still requires AWS SigV4 signing
-  // We need both the gateway token AND AWS credentials
-  if (!config.accessKeyId || !config.secretAccessKey) {
-    throw new Error(
-      'Bedrock via AI Gateway still requires AWS credentials for SigV4 signing. ' +
-      'Set AWS_ACCESS_KEY_ID and AWS_SECRET_ACCESS_KEY.'
-    )
-  }
-  const headers = await signRequest('POST', url, bodyStr, config, 'bedrock')
-  headers.set('cf-aig-authorization', `Bearer ${config.gatewayToken}`)
-  const response = await fetch(url, {
-    method: 'POST',
-    headers,
-    body: bodyStr,
-  })
-  if (!response.ok) {
-    const error = await response.text()
-    throw new Error(`Bedrock via Gateway error: ${response.status} ${error}`)
-  }
-  const data = await response.json() as {
-    content?: Array<{ type: string; text?: string }>
-    usage?: { input_tokens: number; output_tokens: number }
-  }
-  // Extract content (Anthropic format)
-  const textContent = data.content?.find((c) => c.type === 'text')
-  let content = textContent?.text
-  let usage: { promptTokens: number; completionTokens: number; totalTokens: number } | undefined
-  if (data.usage) {
-    usage = {
-      promptTokens: data.usage.input_tokens,
-      completionTokens: data.usage.output_tokens,
-      totalTokens: data.usage.input_tokens + data.usage.output_tokens,
-    }
-  }
-  let result: unknown = content
-  // Try to parse JSON if schema was provided
-  if (item.schema && content) {
-    try {
-      result = JSON.parse(content)
-    } catch {
-      // Keep as string
-    }
-  }
   return {
     id: item.id,
     customId: item.id,
     status: 'completed',
-    result,
-    usage,
+    result: tryParseJson(content, !!item.schema),
+    ...(usage && { usage }),
   }
 }
 // ============================================================================
-// True Batch Inference (S3-based)
+// True S3-based batch inference (separate from the BatchProvider adapter)
 // ============================================================================
 /**
- * Create and submit a true Bedrock batch inference job
- * This requires S3 bucket access and proper IAM setup
+ * Create and submit a true Bedrock batch inference job.
+ * Requires S3 bucket access and proper IAM setup.
  */
 export async function createBedrockBatchJob(
   items: BatchItem[],
@@ -667,7 +465,6 @@ export async function createBedrockBatchJob(
 ): Promise<{ jobArn: string }> {
   const config = getConfig()
-  // Build JSONL content
   const jsonlLines = items.map((item) => {
     const request: BedrockBatchRequest = {
       recordId: item.id,
@@ -675,8 +472,10 @@ export async function createBedrockBatchJob(
         anthropic_version: 'bedrock-2023-05-31',
         max_tokens: item.options?.maxTokens || 4096,
         messages: [{ role: 'user', content: item.prompt }],
-        system: item.options?.system,
-        temperature: item.options?.temperature,
+        ...(item.options?.system !== undefined && { system: item.options.system }),
+        ...(item.options?.temperature !== undefined && {
+          temperature: item.options.temperature,
+        }),
       },
     }
     return JSON.stringify(request)
@@ -685,8 +484,6 @@ export async function createBedrockBatchJob(
   const inputKey = `${options.s3InputPrefix || 'bedrock-batch/input'}/${options.jobName}.jsonl`
   const outputPrefix = `${options.s3OutputPrefix || 'bedrock-batch/output'}/${options.jobName}/`
-  // Upload to S3
-  // In production, use @aws-sdk/client-s3
   const s3Url = `https://${config.bucket}.s3.${config.region}.amazonaws.com/${inputKey}`
   const content = jsonlLines.join('\n')
@@ -700,21 +497,16 @@ export async function createBedrockBatchJob(
     throw new Error(`Failed to upload to S3: ${s3Response.status}`)
   }
-  // Create batch inference job
   const jobUrl = `https://bedrock.${config.region}.amazonaws.com/model-invocation-job`
   const jobBody = JSON.stringify({
     jobName: options.jobName,
     modelId: model,
     roleArn: options.roleArn,
     inputDataConfig: {
-      s3InputDataConfig: {
-        s3Uri: `s3://${config.bucket}/${inputKey}`,
-      },
+      s3InputDataConfig: { s3Uri: `s3://${config.bucket}/${inputKey}` },
     },
     outputDataConfig: {
-      s3OutputDataConfig: {
-        s3Uri: `s3://${config.bucket}/${outputPrefix}`,
-      },
+      s3OutputDataConfig: { s3Uri: `s3://${config.bucket}/${outputPrefix}` },
     },
   })
@@ -729,70 +521,27 @@ export async function createBedrockBatchJob(
     throw new Error(`Failed to create Bedrock batch job: ${jobResponse.status} ${error}`)
   }
-  const jobData = await jobResponse.json() as { jobArn: string }
+  const jobData = (await jobResponse.json()) as { jobArn: string }
   return jobData
 }
 // ============================================================================
-// Register Adapter
-// ============================================================================
-// ============================================================================
-// Bedrock Flex Adapter
+// Bedrock flex adapter (FlexAdapter port)
 // ============================================================================
-/**
- * AWS Bedrock Flex Adapter
- *
- * Flex processing uses concurrent requests for medium-sized batches (5-500 items).
- * This provides a balance between:
- * - Immediate execution (fast but full price, <5 items)
- * - Full batch inference (50% discount but 24hr turnaround, 500+ items)
- *
- * Flex tier uses concurrent API calls with rate limiting, providing results
- * in minutes rather than hours while still benefiting from efficient processing.
- */
 const bedrockFlexAdapter: FlexAdapter = {
   async submitFlex(items: BatchItem[], options: { model?: string }): Promise<BatchResult[]> {
     const config = getConfig()
     const model = options.model || 'anthropic.claude-3-sonnet-20240229-v1:0'
-    const CONCURRENCY = 8 // Bedrock has stricter rate limits than OpenAI
-    const results: BatchResult[] = []
-    // Process items concurrently with rate limiting
-    for (let i = 0; i < items.length; i += CONCURRENCY) {
-      const batch = items.slice(i, i + CONCURRENCY)
-      const batchResults = await Promise.all(
-        batch.map(async (item) => {
-          try {
-            return await processBedrockItem(item, config, model)
-          } catch (error) {
-            return {
-              id: item.id,
-              customId: item.id,
-              status: 'failed' as const,
-              error: error instanceof Error ? error.message : 'Unknown error',
-            }
-          }
-        })
-      )
-      results.push(...batchResults)
-      // Add delay between batches to respect rate limits
-      if (i + CONCURRENCY < items.length) {
-        await new Promise((resolve) => setTimeout(resolve, 500))
-      }
-    }
-    return results
+    return processConcurrently(items, (item) => processBedrockItem(item, config, model), {
+      concurrency: 8,
+      delayBetweenWaves: 500,
+    })
   },
 }
 // ============================================================================
-// Register Adapters
+// Register adapters
 // ============================================================================
 registerBatchAdapter('bedrock', bedrockAdapter)