npm - @blockrun/llm - Versions diffs - 0.3.0 → 1.1.0 - Mend

@blockrun/llm 0.3.0 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

package/README.md +123 -24
package/dist/{chunk-S7BEMV6T.js → chunk-KRDGCX7W.js} +25914 -25839
package/dist/{esm-EBZAIN5N.js → esm-PTFDM6PE.js} +159 -6
package/dist/index.cjs +36985 -37
package/dist/index.d.cts +179 -1
package/dist/index.d.ts +179 -1
package/dist/{index.esm-WP2DIBSK.js → index.esm-SXKIFLA7.js} +3 -2
package/dist/index.js +421 -1
package/package.json +71 -70
package/dist/chunk-2ESYSVXG.js +0 -48

package/README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 # @blockrun/llm
-Pay-per-request access to GPT-4o, Claude 4, Gemini 2.5, and more via x402 micropayments on Base and Solana.
+Pay-per-request access to GPT-4o, Claude 4, Gemini 3.1, and more via x402 micropayments on Base and Solana.
 **Networks:**
 - **Base Mainnet:** Chain ID 8453 - Production with real USDC
@@ -35,13 +35,44 @@ That's it. The SDK handles x402 payment automatically.
 ## Quick Start (Solana)
 ```typescript
-import { LLMClient } from '@blockrun/llm';
+import { SolanaLLMClient } from '@blockrun/llm';
-const client = new LLMClient({ network: 'solana' });  // Uses BLOCKRUN_SOLANA_KEY
-const response = await client.chat('openai/gpt-4o', 'Hello!');
+// SOLANA_WALLET_KEY env var (bs58-encoded Solana secret key)
+const client = new SolanaLLMClient();
+const response = await client.chat('openai/gpt-4o', 'gm Solana');
+console.log(response);
 ```
-For Solana, set `BLOCKRUN_SOLANA_KEY` environment variable with your base58-encoded Solana secret key.
+Set `SOLANA_WALLET_KEY` to your bs58-encoded Solana secret key. Payments are automatic via x402 — your key never leaves your machine.
+## Solana Support
+Pay for AI calls with Solana USDC via [sol.blockrun.ai](https://sol.blockrun.ai):
+```typescript
+import { SolanaLLMClient } from '@blockrun/llm';
+// SOLANA_WALLET_KEY env var (bs58-encoded Solana secret key)
+const client = new SolanaLLMClient();
+// Or pass key directly
+const client2 = new SolanaLLMClient({ privateKey: 'your-bs58-solana-key' });
+// Same API as LLMClient
+const response = await client.chat('openai/gpt-4o', 'gm Solana');
+console.log(response);
+// Live Search with Grok (Solana payment)
+const tweet = await client.chat('xai/grok-3-mini', 'What is trending on X?', { search: true });
+```
+**Setup:**
+1. Export your Solana wallet key: `export SOLANA_WALLET_KEY="your-bs58-key"`
+2. Fund with USDC on Solana mainnet
+3. That's it — payments are automatic via x402
+**Supported endpoint:** `https://sol.blockrun.ai/api`
+**Payment:** Solana USDC (SPL, mainnet)
 ## How It Works
@@ -59,12 +90,10 @@ For Solana, set `BLOCKRUN_SOLANA_KEY` environment variable with your base58-enco
 | Model | Input Price | Output Price |
 |-------|-------------|--------------|
 | `openai/gpt-5.2` | $1.75/M | $14.00/M |
-| `openai/gpt-5.1` | $1.25/M | $10.00/M |
-| `openai/gpt-5` | $1.25/M | $10.00/M |
 | `openai/gpt-5-mini` | $0.25/M | $2.00/M |
 | `openai/gpt-5-nano` | $0.05/M | $0.40/M |
 | `openai/gpt-5.2-pro` | $21.00/M | $168.00/M |
-| `openai/gpt-5-pro` | $15.00/M | $120.00/M |
+| `openai/gpt-5.2-codex` | $1.75/M | $14.00/M |
 ### OpenAI GPT-4 Family
 | Model | Input Price | Output Price |
@@ -87,16 +116,21 @@ For Solana, set `BLOCKRUN_SOLANA_KEY` environment variable with your base58-enco
 ### Anthropic Claude
 | Model | Input Price | Output Price |
 |-------|-------------|--------------|
+| `anthropic/claude-opus-4.6` | $5.00/M | $25.00/M |
+| `anthropic/claude-opus-4.5` | $5.00/M | $25.00/M |
 | `anthropic/claude-opus-4` | $15.00/M | $75.00/M |
+| `anthropic/claude-sonnet-4.6` | $3.00/M | $15.00/M |
 | `anthropic/claude-sonnet-4` | $3.00/M | $15.00/M |
 | `anthropic/claude-haiku-4.5` | $1.00/M | $5.00/M |
 ### Google Gemini
 | Model | Input Price | Output Price |
 |-------|-------------|--------------|
-| `google/gemini-3-pro-preview` | $2.00/M | $12.00/M |
+| `google/gemini-3.1-pro` | $2.00/M | $12.00/M |
+| `google/gemini-3-flash-preview` | $0.50/M | $3.00/M |
 | `google/gemini-2.5-pro` | $1.25/M | $10.00/M |
-| `google/gemini-2.5-flash` | $0.15/M | $0.60/M |
+| `google/gemini-2.5-flash` | $0.30/M | $2.50/M |
+| `google/gemini-2.5-flash-lite` | $0.10/M | $0.40/M |
 ### DeepSeek
 | Model | Input Price | Output Price |
@@ -105,17 +139,34 @@ For Solana, set `BLOCKRUN_SOLANA_KEY` environment variable with your base58-enco
 | `deepseek/deepseek-reasoner` | $0.28/M | $0.42/M |
 ### xAI Grok
-| Model | Input Price | Output Price |
-|-------|-------------|--------------|
-| `xai/grok-3` | $3.00/M | $15.00/M |
-| `xai/grok-3-fast` | $5.00/M | $25.00/M |
-| `xai/grok-3-mini` | $0.30/M | $0.50/M |
+| Model | Input Price | Output Price | Context | Notes |
+|-------|-------------|--------------|---------|-------|
+| `xai/grok-3` | $3.00/M | $15.00/M | 131K | Flagship |
+| `xai/grok-3-mini` | $0.30/M | $0.50/M | 131K | Fast & affordable |
+| `xai/grok-4-1-fast-reasoning` | $0.20/M | $0.50/M | **2M** | Latest, chain-of-thought |
+| `xai/grok-4-1-fast-non-reasoning` | $0.20/M | $0.50/M | **2M** | Latest, direct response |
+| `xai/grok-4-fast-reasoning` | $0.20/M | $0.50/M | **2M** | Step-by-step reasoning |
+| `xai/grok-4-fast-non-reasoning` | $0.20/M | $0.50/M | **2M** | Quick responses |
+| `xai/grok-code-fast-1` | $0.20/M | $1.50/M | 256K | Code generation |
+| `xai/grok-4-0709` | $0.20/M | $1.50/M | 256K | Premium quality |
+| `xai/grok-2-vision` | $2.00/M | $10.00/M | 32K | Vision capabilities |
 ### Moonshot Kimi
 | Model | Input Price | Output Price |
 |-------|-------------|--------------|
 | `moonshot/kimi-k2.5` | $0.60/M | $3.00/M |
+### MiniMax
+| Model | Input Price | Output Price |
+|-------|-------------|--------------|
+| `minimax/minimax-m2.5` | $0.30/M | $1.20/M |
+### NVIDIA (Free & Hosted)
+| Model | Input Price | Output Price | Notes |
+|-------|-------------|--------------|-------|
+| `nvidia/gpt-oss-120b` | **FREE** | **FREE** | OpenAI open-weight 120B (Apache 2.0) |
+| `nvidia/kimi-k2.5` | $0.60/M | $3.00/M | Moonshot 1T MoE with vision |
 ### E2E Verified Models
 All models below have been tested end-to-end via the TypeScript SDK (Feb 2026):
@@ -123,10 +174,12 @@ All models below have been tested end-to-end via the TypeScript SDK (Feb 2026):
 | Provider | Model | Status |
 |----------|-------|--------|
 | OpenAI | `openai/gpt-4o-mini` | Passed |
+| OpenAI | `openai/gpt-5.2-codex` | Passed |
+| Anthropic | `anthropic/claude-opus-4.6` | Passed |
 | Anthropic | `anthropic/claude-sonnet-4` | Passed |
 | Google | `google/gemini-2.5-flash` | Passed |
 | DeepSeek | `deepseek/deepseek-chat` | Passed |
-| xAI | `xai/grok-3-fast` | Passed |
+| xAI | `xai/grok-3` | Passed |
 | Moonshot | `moonshot/kimi-k2.5` | Passed |
 ### Image Generation
@@ -206,6 +259,47 @@ const response2 = await client.chat('anthropic/claude-sonnet-4', 'Write a haiku'
 });
 ```
+### Smart Routing (ClawRouter)
+Save up to 78% on inference costs with intelligent model routing. ClawRouter uses a 14-dimension rule-based scoring algorithm to select the cheapest model that can handle your request (<1ms, 100% local).
+```typescript
+import { LLMClient } from '@blockrun/llm';
+const client = new LLMClient();
+// Auto-route to cheapest capable model
+const result = await client.smartChat('What is 2+2?');
+console.log(result.response);     // '4'
+console.log(result.model);        // 'google/gemini-2.5-flash'
+console.log(result.routing.tier); // 'SIMPLE'
+console.log(`Saved ${(result.routing.savings * 100).toFixed(0)}%`); // 'Saved 78%'
+// Routing profiles
+const free = await client.smartChat('Hello!', { routingProfile: 'free' });     // Zero cost
+const eco = await client.smartChat('Explain AI', { routingProfile: 'eco' });   // Budget optimized
+const auto = await client.smartChat('Code review', { routingProfile: 'auto' }); // Balanced (default)
+const premium = await client.smartChat('Write a legal brief', { routingProfile: 'premium' }); // Best quality
+```
+**Routing Profiles:**
+| Profile | Description | Best For |
+|---------|-------------|----------|
+| `free` | NVIDIA free models only | Testing, simple queries |
+| `eco` | Budget-optimized | Cost-sensitive workloads |
+| `auto` | Intelligent routing (default) | General use |
+| `premium` | Best quality models | Critical tasks |
+**Tiers:**
+| Tier | Example Tasks | Typical Models |
+|------|---------------|----------------|
+| SIMPLE | Greetings, math, lookups | Gemini Flash, GPT-4o-mini |
+| MEDIUM | Explanations, summaries | GPT-4o, Claude Sonnet |
+| COMPLEX | Analysis, code generation | GPT-5.2, Claude Opus |
+| REASONING | Multi-step logic, planning | o3, DeepSeek Reasoner |
 ### Full Chat Completion
 ```typescript
@@ -267,9 +361,8 @@ const client = new LLMClient({
 | Variable | Description |
 |----------|-------------|
-| `BASE_CHAIN_WALLET_KEY` | Your Base chain wallet private key (for Base) |
-| `BLOCKRUN_SOLANA_KEY` | Your Solana wallet secret key - base58 (for Solana) |
-| `BLOCKRUN_NETWORK` | Default network: `base` or `solana` (optional, default: base) |
+| `BASE_CHAIN_WALLET_KEY` | Your Base chain wallet private key (for Base / `LLMClient`) |
+| `SOLANA_WALLET_KEY` | Your Solana wallet secret key - bs58 encoded (for `SolanaLLMClient`) |
 | `BLOCKRUN_API_URL` | API endpoint (optional, default: https://blockrun.ai/api) |
 ## Error Handling
@@ -331,11 +424,11 @@ BASE_CHAIN_WALLET_KEY=0x...
 ### Solana
 1. Create a Solana wallet (Phantom, Backpack, Solflare, etc.)
 2. Get USDC on Solana for API payments
-3. Export your secret key and set as `BLOCKRUN_SOLANA_KEY`
+3. Export your secret key and set as `SOLANA_WALLET_KEY`
 ```bash
 # .env
-BLOCKRUN_SOLANA_KEY=...your_base58_secret_key
+SOLANA_WALLET_KEY=...your_bs58_secret_key
 ```
 Note: Solana transactions are gasless for the user - the CDP facilitator pays for transaction fees.
@@ -389,6 +482,12 @@ import {
   type ChatResponse,
   type ChatOptions,
   type Model,
+  // Smart routing types
+  type SmartChatOptions,
+  type SmartChatResponse,
+  type RoutingDecision,
+  type RoutingProfile,
+  type RoutingTier,
   APIError,
   PaymentError,
 } from '@blockrun/llm';
@@ -397,9 +496,9 @@ import {
 ## Links
 - [Website](https://blockrun.ai)
-- [Documentation](https://docs.blockrun.ai)
-- [GitHub](https://github.com/blockrun/blockrun-llm-ts)
-- [Discord](https://discord.gg/blockrun)
+- [Documentation](https://github.com/BlockRunAI/awesome-blockrun/tree/main/docs)
+- [GitHub](https://github.com/blockrunai/blockrun-llm-ts)
+- [Telegram](https://t.me/+mroQv4-4hGgzOGUx)
 ## License