npm - clawfast - Versions diffs - 1.0.1 → 1.0.3 - Mend

clawfast 1.0.1 → 1.0.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (3) hide show

package/README.md CHANGED Viewed

@@ -123,45 +123,31 @@ ChatGPT: a API da OpenAI autentica chamadas com credenciais de API no servidor.
 O modelo `chat-latest` foi adicionado como opcao por ser o caminho de API mais
 proximo da experiencia ChatGPT Instant.
-## Hugging Face
+## NVIDIA build
-O CLI tambem pode usar o Hugging Face Inference Providers Router por
-`HUGGINGFACE_API_KEY` ou `HF_TOKEN`. Ele usa o endpoint OpenAI-compatible de chat
-completion:
+Provedor PRIMARIO do CLI. Pegue a chave em https://build.nvidia.com/ e use o
+endpoint OpenAI-compatible de chat completion:
 ```env
-HUGGINGFACE_API_KEY=...
-HUGGINGFACE_BASE_URL=https://router.huggingface.co/v1
+NVIDIA_API_KEY=...
+NVIDIA_BASE_URL=https://integrate.api.nvidia.com/v1
 ```
-Modelos adicionados:
-- `Qwen/Qwen3.6-35B-A3B`
-- `zai-org/GLM-5.1-FP8`
-- `deepseek-ai/DeepSeek-V4-Flash`
-Modelos pedidos mas nao selecionaveis no chat router:
+Modelos usados pelo CLI (wiring via `.chat(...)`, chat-completions):
-- `XiaomiMiMo/MiMo-V2.5-Pro-FP4-DFlash`: substituido por
-  `zai-org/GLM-5.1-FP8`, que responde no chat router.
-- `nvidia/DeepSeek-V4-Flash-NVFP4`: o router retorna que nao e um modelo de
-  chat. O CLI usa `deepseek-ai/DeepSeek-V4-Flash` como alternativa roteavel.
-A disponibilidade e o suporte a tool-calling podem variar por modelo/provedor
-no router. Se um modelo da Hugging Face falhar durante uso de ferramentas, use
-`/model auto` ou escolha um modelo OpenRouter/OpenAI no seletor.
+- `minimaxai/minimax-m3`
+- `moonshotai/kimi-k2.6`
+- `z-ai/glm-5.1`
+- `qwen/qwen3.5-397b-a17b`
 ## Configuracao
 As chaves ficam em `../.env.local`, que nao deve ser versionado:
 ```env
-OPENROUTER_API_KEY=...
-HUGGINGFACE_API_KEY=...
-HUGGINGFACE_BASE_URL=https://router.huggingface.co/v1
-OPENAI_API_KEY=...
 NVIDIA_API_KEY=...
 NVIDIA_BASE_URL=https://integrate.api.nvidia.com/v1
+OPENAI_API_KEY=...
 ```
 Variaveis opcionais:
@@ -185,22 +171,19 @@ vier incompleto, a sessao falha em vez de usar uma versao reduzida. Use
 A ordem de fallback do CLI e `CLI_MODEL_CHAIN` em
 [`../lib/ai/providers.ts`](../lib/ai/providers.ts):
-1. OpenRouter `z-ai/glm-4.5-air:free`
-2. OpenRouter `qwen/qwen3-coder:free`
-3. Hugging Face `Qwen/Qwen3.6-35B-A3B`, se `HUGGINGFACE_API_KEY`/`HF_TOKEN`
-   estiver configurada
-4. Hugging Face `zai-org/GLM-5.1-FP8`, se Hugging Face estiver configurada
-5. Hugging Face `deepseek-ai/DeepSeek-V4-Flash`, se Hugging Face estiver
-   configurada
+1. NVIDIA `minimaxai/minimax-m3`, se `NVIDIA_API_KEY` estiver configurada
+2. NVIDIA `moonshotai/kimi-k2.6`
+3. NVIDIA `z-ai/glm-5.1`
+4. NVIDIA `qwen/qwen3.5-397b-a17b`
+5. Kimi / DeepSeek por sessao web logada (proxies), se habilitados
 6. OpenAI `chat-latest`, se `OPENAI_API_KEY` estiver configurada
 Somente provedores com chave configurada entram na cadeia. Se um modelo falhar,
 o CLI tenta o proximo automaticamente.
-`NVIDIA_API_KEY` continua aceito para testes/diagnostico, mas NVIDIA fica fora
-do fallback do agente porque o endpoint atual retorna `500 "'role'"` depois de
-resultados de ferramenta. Para agente com terminal/arquivos, use OpenRouter ou
-OpenAI.
+Os modelos NVIDIA usam o endpoint de chat-completions (`.chat(...)`), que faz
+tool-calling de verdade — as ferramentas do agente (`run_terminal_cmd`, `file`,
+`todo_write`) disparam normalmente.
 Dentro do terminal voce pode escolher o modelo da sessao: