npm - @botbotgo/better-call - Versions diffs - 0.1.6 → 0.1.7 - Mend

@botbotgo/better-call 0.1.6 → 0.1.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (2) hide show

package/README.md +35 -9
package/package.json +1 -1

package/README.md CHANGED Viewed

@@ -121,15 +121,41 @@ Measured with real Ollama `/api/chat` calls over all supported BFCL v4 single-tu
 Latest completed remote run artifact: `benchmarks/bfcl-real-remote-completed-summary.json`.
-| Model | Completed cases | Raw | BetterCall repair | Accuracy lift | Request errors |
-| --- | ---: | ---: | ---: | ---: | ---: |
-| `granite4.1:3b` | 3,625 | 73.4% | 83.8% | +10.4pp | 25 |
-| `qwen2.5:7b-instruct` | 3,625 | 72.2% | 78.2% | +5.9pp | 80 |
-| `qwen3:0.6b` | 3,625 | 55.5% | 63.6% | +8.2pp | 217 |
-| `qwen3.5:0.8b` | 3,625 | 54.6% | 56.9% | +2.3pp | 901 |
-| `qwen3.5:2b` | 3,625 | 53.9% | 54.9% | +1.0pp | 1,308 |
-| `lfm2.5-thinking:latest` | 3,625 | 50.8% | 54.8% | +4.0pp | 1,142 |
-| `gemma4:e2b` | 3,625 | 24.3% | 24.7% | +0.4pp | 2,641 |
+Performance after wrapping the same model outputs with BetterCall:
+```text
+granite4.1:3b
+  Raw         73.4% | #############################...........
+  BetterCall  83.8% | ##################################......
+qwen2.5:7b-instruct
+  Raw         72.2% | #############################...........
+  BetterCall  78.2% | ###############################.........
+qwen3:0.6b
+  Raw         55.5% | ######################..................
+  BetterCall  63.6% | #########################...............
+qwen3.5:0.8b
+  Raw         54.6% | ######################..................
+  BetterCall  56.9% | #######################.................
+qwen3.5:2b
+  Raw         53.9% | ######################..................
+  BetterCall  54.9% | ######################..................
+lfm2.5-thinking:latest
+  Raw         50.8% | ####################....................
+  BetterCall  54.8% | ######################..................
+gemma4:e2b
+  Raw         24.3% | ##########..............................
+  BetterCall  24.7% | ##########..............................
+```
+| Rank | Model | Completed cases | Raw model | BetterCall | Lift | Request errors |
+| ---: | --- | ---: | ---: | ---: | ---: | ---: |
+| 1 | `granite4.1:3b` | 3,625 | 73.4% | 83.8% | +10.4pp | 25 |
+| 2 | `qwen2.5:7b-instruct` | 3,625 | 72.2% | 78.2% | +5.9pp | 80 |
+| 3 | `qwen3:0.6b` | 3,625 | 55.5% | 63.6% | +8.2pp | 217 |
+| 4 | `qwen3.5:0.8b` | 3,625 | 54.6% | 56.9% | +2.3pp | 901 |
+| 5 | `qwen3.5:2b` | 3,625 | 53.9% | 54.9% | +1.0pp | 1,308 |
+| 6 | `lfm2.5-thinking:latest` | 3,625 | 50.8% | 54.8% | +4.0pp | 1,142 |
+| 7 | `gemma4:e2b` | 3,625 | 24.3% | 24.7% | +0.4pp | 2,641 |
 Latest completed model category detail: `qwen2.5:7b-instruct`.

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@botbotgo/better-call",
-  "version": "0.1.6",
+  "version": "0.1.7",
   "description": "LLM tool-call reliability layer.",
   "type": "module",
   "license": "Apache-2.0",