npm - @providerprotocol/ai - Versions diffs - 0.0.34 → 0.0.36 - Mend

@providerprotocol/ai 0.0.34 → 0.0.36

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (136) hide show

package/README.md +546 -3
package/dist/anthropic/index.d.ts +2 -1
package/dist/anthropic/index.js +151 -145
package/dist/anthropic/index.js.map +1 -1
package/dist/cerebras/index.d.ts +392 -0
package/dist/cerebras/index.js +648 -0
package/dist/cerebras/index.js.map +1 -0
package/dist/chunk-2YXFLRQ6.js +49 -0
package/dist/chunk-2YXFLRQ6.js.map +1 -0
package/dist/chunk-4OGB7JZA.js +157 -0
package/dist/chunk-4OGB7JZA.js.map +1 -0
package/dist/chunk-4RX4VQCB.js +31 -0
package/dist/chunk-4RX4VQCB.js.map +1 -0
package/dist/chunk-5IWHCXKN.js +30 -0
package/dist/chunk-5IWHCXKN.js.map +1 -0
package/dist/{chunk-3C7O2RNO.js → chunk-A2IM7PGT.js} +6 -4
package/dist/{chunk-3C7O2RNO.js.map → chunk-A2IM7PGT.js.map} +1 -1
package/dist/{chunk-3D6XGGVG.js → chunk-ARVM24K2.js} +2 -2
package/dist/{chunk-4J6OFUKX.js → chunk-AY55T37A.js} +70 -162
package/dist/chunk-AY55T37A.js.map +1 -0
package/dist/{chunk-ILR2D5PN.js → chunk-BRP5XJ6Q.js} +2 -86
package/dist/chunk-BRP5XJ6Q.js.map +1 -0
package/dist/chunk-C4JP64VW.js +298 -0
package/dist/chunk-C4JP64VW.js.map +1 -0
package/dist/chunk-COS4ON4G.js +111 -0
package/dist/chunk-COS4ON4G.js.map +1 -0
package/dist/chunk-CRP6Y7NF.js +31 -0
package/dist/chunk-CRP6Y7NF.js.map +1 -0
package/dist/chunk-EPB3GQNL.js +118 -0
package/dist/chunk-EPB3GQNL.js.map +1 -0
package/dist/chunk-ETBFOLQN.js +34 -0
package/dist/chunk-ETBFOLQN.js.map +1 -0
package/dist/chunk-I53CI6ZZ.js +142 -0
package/dist/chunk-I53CI6ZZ.js.map +1 -0
package/dist/chunk-IDZOVWP3.js +29 -0
package/dist/chunk-IDZOVWP3.js.map +1 -0
package/dist/chunk-JA3UZALR.js +88 -0
package/dist/chunk-JA3UZALR.js.map +1 -0
package/dist/{chunk-WAKD3OO5.js → chunk-N5DX5JW3.js} +31 -31
package/dist/chunk-N5DX5JW3.js.map +1 -0
package/dist/chunk-OIEWDFQU.js +97 -0
package/dist/chunk-OIEWDFQU.js.map +1 -0
package/dist/{chunk-TOJCZMVU.js → chunk-PMK5LZ5Z.js} +40 -40
package/dist/chunk-PMK5LZ5Z.js.map +1 -0
package/dist/{chunk-6S222DHN.js → chunk-RJGTRQ47.js} +20 -1
package/dist/chunk-RJGTRQ47.js.map +1 -0
package/dist/chunk-UFFJDYCE.js +94 -0
package/dist/chunk-UFFJDYCE.js.map +1 -0
package/dist/chunk-VGKZIGVI.js +222 -0
package/dist/chunk-VGKZIGVI.js.map +1 -0
package/dist/{chunk-KUPF5KHT.js → chunk-Y5H7C5J4.js} +2 -2
package/dist/{embedding-D2BYIehX.d.ts → embedding-BXA72PlJ.d.ts} +1 -1
package/dist/google/index.d.ts +2 -1
package/dist/google/index.js +202 -199
package/dist/google/index.js.map +1 -1
package/dist/groq/index.d.ts +410 -0
package/dist/groq/index.js +649 -0
package/dist/groq/index.js.map +1 -0
package/dist/http/index.d.ts +3 -2
package/dist/http/index.js +5 -4
package/dist/image-stream-CCgwB7ve.d.ts +11 -0
package/dist/index.d.ts +8 -118
package/dist/index.js +520 -769
package/dist/index.js.map +1 -1
package/dist/{llm-BQJZj3cD.d.ts → llm-ByUFPcFH.d.ts} +12 -1632
package/dist/middleware/logging/index.d.ts +76 -0
package/dist/middleware/logging/index.js +74 -0
package/dist/middleware/logging/index.js.map +1 -0
package/dist/middleware/parsed-object/index.d.ts +45 -0
package/dist/middleware/parsed-object/index.js +73 -0
package/dist/middleware/parsed-object/index.js.map +1 -0
package/dist/middleware/pubsub/index.d.ts +97 -0
package/dist/middleware/pubsub/index.js +160 -0
package/dist/middleware/pubsub/index.js.map +1 -0
package/dist/middleware/pubsub/server/express/index.d.ts +66 -0
package/dist/middleware/pubsub/server/express/index.js +11 -0
package/dist/middleware/pubsub/server/express/index.js.map +1 -0
package/dist/middleware/pubsub/server/fastify/index.d.ts +67 -0
package/dist/middleware/pubsub/server/fastify/index.js +11 -0
package/dist/middleware/pubsub/server/fastify/index.js.map +1 -0
package/dist/middleware/pubsub/server/h3/index.d.ts +70 -0
package/dist/middleware/pubsub/server/h3/index.js +11 -0
package/dist/middleware/pubsub/server/h3/index.js.map +1 -0
package/dist/middleware/pubsub/server/index.d.ts +78 -0
package/dist/middleware/pubsub/server/index.js +34 -0
package/dist/middleware/pubsub/server/index.js.map +1 -0
package/dist/middleware/pubsub/server/webapi/index.d.ts +63 -0
package/dist/middleware/pubsub/server/webapi/index.js +11 -0
package/dist/middleware/pubsub/server/webapi/index.js.map +1 -0
package/dist/ollama/index.d.ts +2 -1
package/dist/ollama/index.js +48 -45
package/dist/ollama/index.js.map +1 -1
package/dist/openai/index.d.ts +2 -1
package/dist/openai/index.js +319 -313
package/dist/openai/index.js.map +1 -1
package/dist/openrouter/index.d.ts +2 -1
package/dist/openrouter/index.js +381 -385
package/dist/openrouter/index.js.map +1 -1
package/dist/proxy/index.d.ts +10 -914
package/dist/proxy/index.js +275 -1007
package/dist/proxy/index.js.map +1 -1
package/dist/proxy/server/express/index.d.ts +161 -0
package/dist/proxy/server/express/index.js +24 -0
package/dist/proxy/server/express/index.js.map +1 -0
package/dist/proxy/server/fastify/index.d.ts +162 -0
package/dist/proxy/server/fastify/index.js +24 -0
package/dist/proxy/server/fastify/index.js.map +1 -0
package/dist/proxy/server/h3/index.d.ts +189 -0
package/dist/proxy/server/h3/index.js +28 -0
package/dist/proxy/server/h3/index.js.map +1 -0
package/dist/proxy/server/index.d.ts +151 -0
package/dist/proxy/server/index.js +48 -0
package/dist/proxy/server/index.js.map +1 -0
package/dist/proxy/server/webapi/index.d.ts +278 -0
package/dist/proxy/server/webapi/index.js +32 -0
package/dist/proxy/server/webapi/index.js.map +1 -0
package/dist/responses/index.d.ts +650 -0
package/dist/responses/index.js +930 -0
package/dist/responses/index.js.map +1 -0
package/dist/{retry-8Ch-WWgX.d.ts → retry-BDMo4AVu.d.ts} +1 -1
package/dist/stream-S7nwQRqM.d.ts +1643 -0
package/dist/types-CE4B7pno.d.ts +96 -0
package/dist/utils/index.d.ts +53 -0
package/dist/utils/index.js +7 -0
package/dist/utils/index.js.map +1 -0
package/dist/xai/index.d.ts +2 -1
package/dist/xai/index.js +310 -310
package/dist/xai/index.js.map +1 -1
package/package.json +82 -4
package/dist/chunk-4J6OFUKX.js.map +0 -1
package/dist/chunk-6S222DHN.js.map +0 -1
package/dist/chunk-ILR2D5PN.js.map +0 -1
package/dist/chunk-TOJCZMVU.js.map +0 -1
package/dist/chunk-WAKD3OO5.js.map +0 -1
/package/dist/{chunk-3D6XGGVG.js.map → chunk-ARVM24K2.js.map} +0 -0
/package/dist/{chunk-KUPF5KHT.js.map → chunk-Y5H7C5J4.js.map} +0 -0

package/README.md CHANGED Viewed

@@ -26,9 +26,12 @@ console.log(turn.response.text);
 | Google | `@providerprotocol/ai/google` | ✓ | ✓ | ✓ |
 | xAI | `@providerprotocol/ai/xai` | ✓ | | ✓ |
 | Ollama | `@providerprotocol/ai/ollama` | ✓ | ✓ | |
-| OpenRouter | `@providerprotocol/ai/openrouter` | ✓ | ✓ | |
+| OpenRouter | `@providerprotocol/ai/openrouter` | ✓ | ✓ | ✓ |
+| Groq | `@providerprotocol/ai/groq` | ✓ | | |
+| Cerebras | `@providerprotocol/ai/cerebras` | ✓ | | |
+| OpenResponses | `@providerprotocol/ai/responses` | ✓ | | |
-API keys are loaded automatically from environment variables (`ANTHROPIC_API_KEY`, `OPENAI_API_KEY`, etc.).
+API keys are loaded automatically from environment variables (`ANTHROPIC_API_KEY`, `OPENAI_API_KEY`, `GROQ_API_KEY`, `CEREBRAS_API_KEY`, etc.).
 ## LLM
@@ -44,6 +47,12 @@ for await (const event of stream) {
 const turn = await stream.turn;
 ```
+Stream results are PromiseLike, so you can also await the stream directly to auto-drain:
+```typescript
+const turn = await claude.stream('Count to 5');
+```
 **Stream Control:**
 ```typescript
@@ -63,6 +72,7 @@ for await (const event of stream) {
 |-------|-------------|
 | `text_delta` | Incremental text output |
 | `reasoning_delta` | Incremental reasoning/thinking output |
+| `object_delta` | Incremental structured output JSON |
 | `tool_call_delta` | Tool call arguments being streamed |
 | `tool_execution_start` | Tool execution has started |
 | `tool_execution_end` | Tool execution has completed |
@@ -123,12 +133,36 @@ console.log(turn.data); // { name: 'John', age: 30 }
 ### Multimodal Input
 ```typescript
-import { Image } from '@providerprotocol/ai';
+import { Image, Document, Audio, Video } from '@providerprotocol/ai';
+// Images
 const img = await Image.fromPath('./photo.png');
 const turn = await claude.generate([img, 'What is in this image?']);
+// Documents (PDF, text)
+const doc = await Document.fromPath('./report.pdf', 'Annual Report');
+const docTurn = await claude.generate([doc.toBlock(), 'Summarize this document']);
+// Audio (Google, OpenRouter)
+const audio = await Audio.fromPath('./recording.mp3');
+const audioTurn = await gemini.generate([audio.toBlock(), 'Transcribe this audio']);
+// Video (Google, OpenRouter)
+const video = await Video.fromPath('./clip.mp4');
+const videoTurn = await gemini.generate([video.toBlock(), 'Describe this video']);
 ```
+**Multimodal Support by Provider:**
+| Provider | Image | Document | Audio | Video |
+|----------|:-----:|:--------:|:-----:|:-----:|
+| Anthropic | ✓ | PDF, Text | | |
+| OpenAI | ✓ | PDF, Text | | |
+| Google | ✓ | PDF, Text | ✓ | ✓ |
+| OpenRouter | ✓ | PDF, Text | ✓ | ✓ |
+| xAI | ✓ | | | |
+| Groq | ✓ | | | |
 ## Anthropic Beta Features
 Anthropic provides beta features through the `betas` export. Enable them at the model level:
@@ -168,21 +202,164 @@ const thinker = llm({
 | `interleavedThinking` | Claude can think between tool calls |
 | `devFullThinking` | Developer mode for full thinking visibility |
 | `effort` | Control response thoroughness vs efficiency (Opus 4.5) |
+| `computerUseLegacy` | Computer use for Claude 3.x models |
 | `computerUse` | Mouse, keyboard, screenshot control (Claude 4) |
+| `computerUseOpus` | Computer use with extra commands (Opus 4.5) |
 | `codeExecution` | Python/Bash sandbox execution |
 | `tokenEfficientTools` | Up to 70% token reduction for tool calls |
 | `fineGrainedToolStreaming` | Stream tool args without buffering |
+| `maxTokens35Sonnet` | 8,192 output tokens for Claude 3.5 Sonnet |
 | `output128k` | 128K token output length |
 | `context1m` | 1 million token context window (Sonnet 4) |
 | `promptCaching` | Reduced latency and costs via caching |
 | `extendedCacheTtl` | 1-hour cache TTL (vs 5-minute default) |
+| `contextManagement` | Automatic tool call clearing for context |
+| `modelContextWindowExceeded` | Handle exceeded context windows |
 | `advancedToolUse` | Tool Search, Programmatic Tool Calling |
 | `mcpClient` | Connect to remote MCP servers |
+| `mcpClientLatest` | Updated MCP client |
 | `filesApi` | Upload and manage files |
 | `pdfs` | PDF document support |
+| `tokenCounting` | Token counting endpoint |
 | `messageBatches` | Async batch processing at 50% cost |
 | `skills` | Agent Skills (PowerPoint, Excel, Word, PDF) |
+## Anthropic Built-in Tools
+Use Anthropic's built-in tools directly with the `tools` export:
+```typescript
+import { anthropic, betas, tools } from '@providerprotocol/ai/anthropic';
+import { llm } from '@providerprotocol/ai';
+// Web search with optional user location
+const model = llm({
+  model: anthropic('claude-sonnet-4-20250514'),
+  params: {
+    tools: [tools.webSearch({ max_results: 5 })],
+  },
+});
+// Computer use (requires beta)
+const computerModel = llm({
+  model: anthropic('claude-sonnet-4-20250514', {
+    betas: [betas.computerUse],
+  }),
+  params: {
+    tools: [tools.computer({ display_width: 1920, display_height: 1080, display_number: 1 })],
+  },
+});
+// Code execution (requires beta)
+const codeModel = llm({
+  model: anthropic('claude-sonnet-4-20250514', {
+    betas: [betas.codeExecution],
+  }),
+  params: {
+    tools: [tools.codeExecution()],
+  },
+});
+```
+**Available Built-in Tools:**
+| Tool | Description |
+|------|-------------|
+| `tools.webSearch()` | Search the web with optional max results and location |
+| `tools.computer()` | Mouse, keyboard, and screenshot control |
+| `tools.textEditor()` | Edit text files programmatically |
+| `tools.bash()` | Execute bash commands |
+| `tools.codeExecution()` | Run code in a sandboxed environment |
+| `tools.toolSearch()` | Search through available tools |
+## Reasoning / Extended Thinking
+Access model reasoning and extended thinking across providers with a unified API.
+### Anthropic
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { anthropic } from '@providerprotocol/ai/anthropic';
+const claude = llm({
+  model: anthropic('claude-sonnet-4-20250514'),
+  params: {
+    max_tokens: 16000,
+    thinking: {
+      type: 'enabled',
+      budget_tokens: 5000,
+    },
+  },
+});
+const turn = await claude.generate('Solve this complex problem...');
+console.log(turn.response.reasoning); // Reasoning blocks
+```
+### OpenAI
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { openai } from '@providerprotocol/ai/openai';
+const gpt = llm({
+  model: openai('o3-mini'),
+  params: {
+    max_output_tokens: 4000,
+    reasoning: {
+      effort: 'medium',
+      summary: 'detailed',
+    },
+  },
+});
+```
+### Google Gemini
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { google } from '@providerprotocol/ai/google';
+const gemini = llm({
+  model: google('gemini-2.5-flash'),
+  params: {
+    maxOutputTokens: 4000,
+    thinkingConfig: {
+      thinkingBudget: -1, // Dynamic
+      includeThoughts: true,
+    },
+  },
+});
+```
+### Cerebras
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { cerebras } from '@providerprotocol/ai/cerebras';
+const model = llm({
+  model: cerebras('gpt-oss-120b'),
+  params: {
+    reasoning_effort: 'high',
+    reasoning_format: 'parsed',
+  },
+});
+```
+### Streaming Reasoning
+All providers emit `ReasoningDelta` events during streaming:
+```typescript
+for await (const event of stream) {
+  if (event.type === 'reasoning_delta') {
+    process.stdout.write(event.delta.text);
+  }
+}
+```
 ## Embeddings
 ```typescript
@@ -414,6 +591,161 @@ localStorage.setItem('conversation', JSON.stringify(json));
 const restored = Thread.fromJSON(JSON.parse(localStorage.getItem('conversation')));
 ```
+## Middleware
+Compose request/response/stream transformations with the middleware system. Middleware is imported from dedicated entry points.
+### Parsed Object Middleware
+Automatically parse streaming JSON from structured output and tool call events:
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { anthropic } from '@providerprotocol/ai/anthropic';
+import { parsedObjectMiddleware } from '@providerprotocol/ai/middleware/parsed-object';
+const model = llm({
+  model: anthropic('claude-sonnet-4-20250514'),
+  structure: {
+    type: 'object',
+    properties: {
+      city: { type: 'string' },
+      country: { type: 'string' },
+      population: { type: 'number' },
+    },
+    required: ['city', 'country', 'population'],
+  },
+  middleware: [parsedObjectMiddleware()],
+});
+for await (const event of model.stream('What is the capital of France?')) {
+  if (event.type === 'object_delta') {
+    // Access incrementally parsed structured data
+    console.log(event.delta.parsed);
+    // { city: "Par" } -> { city: "Paris" } -> { city: "Paris", country: "Fr" } -> ...
+  }
+}
+```
+### Logging Middleware
+Add visibility into request lifecycle:
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { anthropic } from '@providerprotocol/ai/anthropic';
+import { loggingMiddleware } from '@providerprotocol/ai/middleware/logging';
+const model = llm({
+  model: anthropic('claude-sonnet-4-20250514'),
+  middleware: [loggingMiddleware({ level: 'debug' })],
+});
+// Logs: [PP] [anthropic] Starting llm request (streaming)
+// Logs: [PP] [anthropic] Completed in 1234ms
+const result = await model.generate('Hello');
+```
+### Pub-Sub Middleware (Stream Resumption)
+Enable reconnecting clients to catch up on missed events during active generation. The middleware buffers events, publishes them to subscribers, and removes streams on completion/abort/error.
+If a stream never reaches those hooks (for example, a process crash), the adapter may retain the entry. Custom adapters should invoke `onComplete` when `remove()` runs so subscriber streams can terminate.
+Streams are created lazily on first `append()` or `subscribe()` call.
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { anthropic } from '@providerprotocol/ai/anthropic';
+import { pubsubMiddleware, memoryAdapter } from '@providerprotocol/ai/middleware/pubsub';
+import { webapi } from '@providerprotocol/ai/middleware/pubsub/server';
+// Create a shared adapter instance
+const adapter = memoryAdapter({ maxStreams: 1000 });
+// Server route handling both new requests and reconnections
+Bun.serve({
+  port: 3000,
+  async fetch(req) {
+    const { messages, streamId } = await req.json();
+    const exists = await adapter.exists(streamId);
+    if (!exists) {
+      // Start background generation (fire and forget)
+      // Stream is created lazily on first append()
+      const model = llm({
+        model: anthropic('claude-sonnet-4-20250514'),
+        middleware: [pubsubMiddleware({ adapter, streamId })],
+      });
+      model.stream(messages).then(turn => { /* save to DB */ });
+    }
+    // Both new and reconnect: subscribe to events
+    return new Response(webapi.createSubscriberStream(streamId, adapter), {
+      headers: { 'Content-Type': 'text/event-stream' },
+    });
+  },
+});
+```
+**Framework Adapters:**
+```typescript
+// Express
+import { express } from '@providerprotocol/ai/middleware/pubsub/server';
+app.post('/api/ai/reconnect', (req, res) => {
+  const { streamId } = req.body;
+  express.streamSubscriber(streamId, adapter, res);
+});
+// Fastify
+import { fastify } from '@providerprotocol/ai/middleware/pubsub/server';
+app.post('/api/ai/reconnect', (request, reply) => {
+  const { streamId } = request.body;
+  return fastify.streamSubscriber(streamId, adapter, reply);
+});
+// H3/Nuxt
+import { h3 } from '@providerprotocol/ai/middleware/pubsub/server';
+export default defineEventHandler(async (event) => {
+  const { streamId } = await readBody(event);
+  return h3.streamSubscriber(streamId, adapter, event);
+});
+```
+**Custom Adapters:**
+Implement `PubSubAdapter` for custom backends (Redis, etc.):
+```typescript
+import type { PubSubAdapter } from '@providerprotocol/ai/middleware/pubsub';
+const redisAdapter: PubSubAdapter = {
+  async exists(streamId) { /* check if stream exists */ },
+  async append(streamId, event) { /* append event, create lazily */ },
+  async getEvents(streamId) { /* return events or [] */ },
+  subscribe(streamId, onEvent, onComplete) { /* subscribe to live events */ },
+  publish(streamId, event) { /* broadcast to subscribers */ },
+  async remove(streamId) { /* notify onComplete then delete */ },
+};
+```
+### Combining Middleware
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { anthropic } from '@providerprotocol/ai/anthropic';
+import { loggingMiddleware } from '@providerprotocol/ai/middleware/logging';
+import { parsedObjectMiddleware } from '@providerprotocol/ai/middleware/parsed-object';
+const model = llm({
+  model: anthropic('claude-sonnet-4-20250514'),
+  structure: mySchema,
+  middleware: [
+    loggingMiddleware({ level: 'info' }),
+    parsedObjectMiddleware(),
+  ],
+});
+```
 ## Error Handling
 All errors are normalized to `UPPError` with consistent error codes:
@@ -561,6 +893,74 @@ export default defineEventHandler(async (event) => {
 - Request/response logging, content filtering
 - Double-layer retry: client retries to proxy, server retries to AI provider
+## OpenAI API Modes
+OpenAI supports two API endpoints. The Responses API is the default and recommended approach:
+```typescript
+import { openai } from '@providerprotocol/ai/openai';
+// Responses API (default, recommended)
+openai('gpt-4o')
+// Chat Completions API (legacy)
+openai('gpt-4o', { api: 'completions' })
+```
+The Responses API supports built-in tools and stateful conversations. Use completions for backward compatibility.
+## OpenAI Built-in Tools
+With the Responses API, use OpenAI's built-in tools directly:
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { openai, tools } from '@providerprotocol/ai/openai';
+// Web search
+const model = llm({
+  model: openai('gpt-4o'),
+  params: {
+    tools: [tools.webSearch()],
+  },
+});
+// File search with vector stores
+const researchModel = llm({
+  model: openai('gpt-4o'),
+  params: {
+    tools: [tools.fileSearch({ vector_store_ids: ['vs_abc123'] })],
+  },
+});
+// Code interpreter
+const codeModel = llm({
+  model: openai('gpt-4o'),
+  params: {
+    tools: [tools.codeInterpreter()],
+  },
+});
+// Image generation
+const creativeModel = llm({
+  model: openai('gpt-4o'),
+  params: {
+    tools: [tools.imageGeneration()],
+  },
+});
+```
+**Available Built-in Tools:**
+| Tool | Description |
+|------|-------------|
+| `tools.webSearch()` | Search the web with optional user location |
+| `tools.fileSearch()` | Search uploaded files in vector stores |
+| `tools.codeInterpreter()` | Execute code in a sandboxed environment |
+| `tools.computer()` | Computer use with display configuration |
+| `tools.imageGeneration()` | Generate images via DALL-E |
+| `tools.mcp()` | Connect to MCP servers |
 ## xAI API Modes
 xAI supports multiple API compatibility modes:
@@ -578,6 +978,119 @@ xai('grok-3-fast', { api: 'responses' })
 xai('grok-3-fast', { api: 'messages' })
 ```
+## Groq
+Fast inference with Llama, Gemma, and Mixtral models:
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { groq } from '@providerprotocol/ai/groq';
+const model = llm({
+  model: groq('llama-3.3-70b-versatile'),
+  params: { max_tokens: 1000 },
+});
+const turn = await model.generate('Hello!');
+```
+**With web search:**
+```typescript
+const searchModel = llm({
+  model: groq('llama-3.3-70b-versatile'),
+  params: {
+    search_settings: { mode: 'auto' },
+  },
+});
+```
+**With RAG documents:**
+```typescript
+const ragModel = llm({
+  model: groq('llama-3.3-70b-versatile'),
+  params: {
+    documents: [
+      { title: 'Doc 1', content: 'Document content here...' },
+      { title: 'Doc 2', content: 'More content...' },
+    ],
+    citation_options: { include: true },
+  },
+});
+```
+**Capabilities:** Streaming, tool calling, structured output, image input (Llama 4 preview), web search, RAG with citations.
+**Environment:** `GROQ_API_KEY`
+## Cerebras
+Ultra-fast inference with Llama, Qwen, and GPT-OSS models:
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { cerebras } from '@providerprotocol/ai/cerebras';
+const model = llm({
+  model: cerebras('llama-3.3-70b'),
+  params: { max_completion_tokens: 1000 },
+});
+const turn = await model.generate('Hello!');
+```
+**With reasoning (GPT-OSS):**
+```typescript
+const model = llm({
+  model: cerebras('gpt-oss-120b'),
+  params: {
+    reasoning_effort: 'high',
+    reasoning_format: 'parsed',
+  },
+});
+```
+**Capabilities:** Streaming, tool calling, structured output, reasoning parameters.
+**Environment:** `CEREBRAS_API_KEY`
+## OpenResponses Provider
+Connect to any server implementing the [OpenResponses specification](https://www.openresponses.org):
+```typescript
+import { llm } from '@providerprotocol/ai';
+import { responses } from '@providerprotocol/ai/responses';
+// Using with OpenAI
+const model = llm({
+  model: responses('gpt-5.2', {
+    host: 'https://api.openai.com/v1',
+    apiKeyEnv: 'OPENAI_API_KEY',
+  }),
+  params: { max_output_tokens: 1000 },
+});
+// Using with OpenRouter
+const routerModel = llm({
+  model: responses('openai/gpt-4o', {
+    host: 'https://openrouter.ai/api/v1',
+    apiKeyEnv: 'OPENROUTER_API_KEY',
+  }),
+});
+// Using with self-hosted server
+const localModel = llm({
+  model: responses('llama-3.3-70b', {
+    host: 'http://localhost:8080/v1',
+  }),
+});
+```
+**Capabilities:** Full multimodal support, streaming, tool calling, structured output, reasoning summaries.
 ## Alternative Import Style
 Use the `ai` namespace for a grouped import style:
@@ -607,6 +1120,14 @@ import type {
   StreamEvent,
   StreamResult,
+  // Content blocks
+  TextBlock,
+  ImageBlock,
+  ReasoningBlock,
+  DocumentBlock,
+  AudioBlock,
+  VideoBlock,
   // Modality results
   EmbeddingResult,
   ImageResult,
@@ -620,9 +1141,31 @@ import type {
   KeyStrategy,
   RetryStrategy,
   LLMCapabilities,
+  // Middleware
+  Middleware,
+  MiddlewareContext,
+  StreamContext,
 } from '@providerprotocol/ai';
 ```
+**Type-Safe Enums:**
+```typescript
+import {
+  StreamEventType,
+  ErrorCode,
+  ContentBlockType,
+  MessageRole,
+  ModalityType,
+} from '@providerprotocol/ai';
+// Use instead of magic strings
+if (event.type === StreamEventType.TextDelta) { ... }
+if (error.code === ErrorCode.RateLimited) { ... }
+if (block.type === ContentBlockType.Text) { ... }
+```
 ### Custom Providers
 Build custom providers with `createProvider`:

package/dist/anthropic/index.d.ts CHANGED Viewed

@@ -1,4 +1,5 @@
-import { P as Provider } from '../llm-BQJZj3cD.js';
+import { d as Provider } from '../llm-ByUFPcFH.js';
+import '../stream-S7nwQRqM.js';
 /**
  * @fileoverview Anthropic API type definitions.