npm - aiforcecli-chat - Versions diffs - 0.1.0 - Mend

aiforcecli-chat 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (33) hide show

package/License.MD +49 -0
package/README.md +642 -0
package/aiforcecli.config.example.json +66 -0
package/assets/README.md +14 -0
package/dist/cli.js +2 -0
package/dist/index.js +2 -0
package/package.json +62 -0
package/tools/scorecard/README.md +92 -0
package/tools/scorecard/config.json +134 -0
package/tools/scorecard/fetch.mjs +335 -0
package/tools/scorecard/generate.mjs +289 -0
package/tools/scorecard/generated/example/invalid-rows.json +1 -0
package/tools/scorecard/generated/example/scorecard-report.md +147 -0
package/tools/scorecard/generated/example/scorecard.compact.json +61 -0
package/tools/scorecard/generated/example/scorecard.json +1492 -0
package/tools/scorecard/generated/example/unmapped-models.json +1492 -0
package/tools/scorecard/generated/raw/aider_polyglot.html +21071 -0
package/tools/scorecard/generated/raw/terminal_bench_2_1.html +2 -0
package/tools/scorecard/generated/scorecard/invalid-rows.json +1 -0
package/tools/scorecard/generated/scorecard/scorecard-report.md +133 -0
package/tools/scorecard/generated/scorecard/scorecard.compact.json +51 -0
package/tools/scorecard/generated/scorecard/scorecard.json +1181 -0
package/tools/scorecard/generated/scorecard/unmapped-models.json +1492 -0
package/tools/scorecard/generated/scorecard-example/invalid-rows.json +1 -0
package/tools/scorecard/generated/scorecard-example/scorecard-report.md +40 -0
package/tools/scorecard/generated/scorecard-example/scorecard.compact.json +22 -0
package/tools/scorecard/generated/scorecard-example/scorecard.json +389 -0
package/tools/scorecard/generated/scorecard-example/unmapped-models.json +1 -0
package/tools/scorecard/generated/scorecard-fetch/raw/aider_polyglot.html +21071 -0
package/tools/scorecard/generated/scorecard-fetch/raw/terminal_bench_2_1.html +2 -0
package/tools/scorecard/snapshots/example.normalized.example.json +38 -0
package/tools/scorecard/snapshots/live.aider_polyglot.json +1318 -0
package/tools/scorecard/snapshots/live.terminal_bench_2_1.json +294 -0

package/tools/scorecard/snapshots/live.terminal_bench_2_1.json ADDED Viewed

@@ -0,0 +1,294 @@
+{
+  "source": "terminal_bench_2_1",
+  "fetchedAt": "2026-06-16T21:10:47.903Z",
+  "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+  "parser": "terminalBench",
+  "rows": [
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Codex CLI GPT-5.5",
+      "metric": "accuracy",
+      "score": 0.8337078651685393,
+      "scoreScale": "0-1",
+      "date": "2026-05-01",
+      "extra": {
+        "agent": "Codex CLI",
+        "model": [
+          "GPT-5.5"
+        ],
+        "stderr": 0.011123028018664792,
+        "verified": true,
+        "agentName": "codex",
+        "agentVersion": "0.125.0",
+        "modelNames": [
+          "gpt-5.5"
+        ],
+        "modelProviders": [
+          "openai"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Claude Code Claude Opus 4.8",
+      "metric": "accuracy",
+      "score": 0.7887640449438202,
+      "scoreScale": "0-1",
+      "date": "2026-05-29",
+      "extra": {
+        "agent": "Claude Code",
+        "model": [
+          "Claude Opus 4.8"
+        ],
+        "stderr": 0.012612328270024521,
+        "verified": true,
+        "agentName": "claude-code",
+        "agentVersion": "2.1.152",
+        "modelNames": [
+          "claude-opus-4-8"
+        ],
+        "modelProviders": [
+          "anthropic"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Terminus 2 GPT-5.5",
+      "metric": "accuracy",
+      "score": 0.7820224719101123,
+      "scoreScale": "0-1",
+      "date": "2026-05-01",
+      "extra": {
+        "agent": "Terminus 2",
+        "model": [
+          "GPT-5.5"
+        ],
+        "stderr": 0.011996717137113833,
+        "verified": true,
+        "agentName": "terminus-2",
+        "agentVersion": "2.0.0",
+        "modelNames": [
+          "gpt-5.5"
+        ],
+        "modelProviders": [
+          "openai"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Terminus 2 Claude Opus 4.8",
+      "metric": "accuracy",
+      "score": 0.7460674157303371,
+      "scoreScale": "0-1",
+      "date": "2026-05-29",
+      "extra": {
+        "agent": "Terminus 2",
+        "model": [
+          "Claude Opus 4.8"
+        ],
+        "stderr": 0.012308372078767778,
+        "verified": true,
+        "agentName": "terminus-2",
+        "agentVersion": "2.0.0",
+        "modelNames": [
+          "claude-opus-4-8"
+        ],
+        "modelProviders": [
+          "anthropic"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Terminus 2 Gemini 3 Pro",
+      "metric": "accuracy",
+      "score": 0.7438202247191011,
+      "scoreScale": "0-1",
+      "date": "2026-05-01",
+      "extra": {
+        "agent": "Terminus 2",
+        "model": [
+          "Gemini 3 Pro"
+        ],
+        "stderr": 0.013199258566821045,
+        "verified": true,
+        "agentName": "terminus-2",
+        "agentVersion": "2.0.0",
+        "modelNames": [
+          "gemini-3-pro-preview"
+        ],
+        "modelProviders": [
+          "gemini"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Gemini CLI Gemini 3.1 Pro",
+      "metric": "accuracy",
+      "score": 0.7065543071161049,
+      "scoreScale": "0-1",
+      "date": "2026-05-05",
+      "extra": {
+        "agent": "Gemini CLI",
+        "model": [
+          "Gemini 3.1 Pro"
+        ],
+        "stderr": 0.014843703568740315,
+        "verified": true,
+        "agentName": "gemini-cli",
+        "agentVersion": "0.40.0",
+        "modelNames": [
+          "gemini-3.1-pro-preview"
+        ],
+        "modelProviders": [
+          "gemini"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Terminus 2 Gemini 3.1 Pro",
+      "metric": "accuracy",
+      "score": 0.7031835205992509,
+      "scoreScale": "0-1",
+      "date": "2026-05-05",
+      "extra": {
+        "agent": "Terminus 2",
+        "model": [
+          "Gemini 3.1 Pro"
+        ],
+        "stderr": 0.014791636846043224,
+        "verified": true,
+        "agentName": "terminus-2",
+        "agentVersion": "2.0.0",
+        "modelNames": [
+          "gemini-3.1-pro-preview"
+        ],
+        "modelProviders": [
+          "gemini"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Claude Code Claude Opus 4.7",
+      "metric": "accuracy",
+      "score": 0.6971910112359551,
+      "scoreScale": "0-1",
+      "date": "2026-05-01",
+      "extra": {
+        "agent": "Claude Code",
+        "model": [
+          "Claude Opus 4.7"
+        ],
+        "stderr": 0.013864003010396704,
+        "verified": true,
+        "agentName": "claude-code",
+        "agentVersion": "2.1.123",
+        "modelNames": [
+          "claude-opus-4-7"
+        ],
+        "modelProviders": [
+          "anthropic"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Gemini CLI Gemini 3 Pro",
+      "metric": "accuracy",
+      "score": 0.6629213483146067,
+      "scoreScale": "0-1",
+      "date": "2026-05-02",
+      "extra": {
+        "agent": "Gemini CLI",
+        "model": [
+          "Gemini 3 Pro"
+        ],
+        "stderr": 0.013669129281569032,
+        "verified": true,
+        "agentName": "gemini-cli",
+        "agentVersion": "0.40.0",
+        "modelNames": [
+          "gemini-3-pro-preview"
+        ],
+        "modelProviders": [
+          "gemini"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Terminus 2 Claude Opus 4.7",
+      "metric": "accuracy",
+      "score": 0.6606741573033708,
+      "scoreScale": "0-1",
+      "date": "2026-05-01",
+      "extra": {
+        "agent": "Terminus 2",
+        "model": [
+          "Claude Opus 4.7"
+        ],
+        "stderr": 0.013669129281569032,
+        "verified": true,
+        "agentName": "terminus-2",
+        "agentVersion": "2.0.0",
+        "modelNames": [
+          "claude-opus-4-7"
+        ],
+        "modelProviders": [
+          "anthropic"
+        ]
+      }
+    },
+    {
+      "source": "terminal_bench",
+      "benchmark": "terminal_bench",
+      "url": "https://www.tbench.ai/leaderboard/terminal-bench/2.1",
+      "modelRaw": "Claude Code GLM 5.1",
+      "metric": "accuracy",
+      "score": 0.5865168539325842,
+      "scoreScale": "0-1",
+      "date": "2026-05-02",
+      "extra": {
+        "agent": "Claude Code",
+        "model": [
+          "GLM 5.1"
+        ],
+        "stderr": 0.012410517996839619,
+        "verified": true,
+        "agentName": "claude-code",
+        "agentVersion": "2.1.123",
+        "modelNames": [
+          "glm-5.1"
+        ],
+        "modelProviders": [
+          "z-ai"
+        ]
+      }
+    }
+  ]
+}