clawfast 1.0.1 → 1.0.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (3) hide show
  1. package/README.md +19 -36
  2. package/dist/clawfast.cjs +918 -292
  3. package/package.json +1 -1
package/README.md CHANGED
@@ -123,45 +123,31 @@ ChatGPT: a API da OpenAI autentica chamadas com credenciais de API no servidor.
123
123
  O modelo `chat-latest` foi adicionado como opcao por ser o caminho de API mais
124
124
  proximo da experiencia ChatGPT Instant.
125
125
 
126
- ## Hugging Face
126
+ ## NVIDIA build
127
127
 
128
- O CLI tambem pode usar o Hugging Face Inference Providers Router por
129
- `HUGGINGFACE_API_KEY` ou `HF_TOKEN`. Ele usa o endpoint OpenAI-compatible de chat
130
- completion:
128
+ Provedor PRIMARIO do CLI. Pegue a chave em https://build.nvidia.com/ e use o
129
+ endpoint OpenAI-compatible de chat completion:
131
130
 
132
131
  ```env
133
- HUGGINGFACE_API_KEY=...
134
- HUGGINGFACE_BASE_URL=https://router.huggingface.co/v1
132
+ NVIDIA_API_KEY=...
133
+ NVIDIA_BASE_URL=https://integrate.api.nvidia.com/v1
135
134
  ```
136
135
 
137
- Modelos adicionados:
138
-
139
- - `Qwen/Qwen3.6-35B-A3B`
140
- - `zai-org/GLM-5.1-FP8`
141
- - `deepseek-ai/DeepSeek-V4-Flash`
142
-
143
- Modelos pedidos mas nao selecionaveis no chat router:
136
+ Modelos usados pelo CLI (wiring via `.chat(...)`, chat-completions):
144
137
 
145
- - `XiaomiMiMo/MiMo-V2.5-Pro-FP4-DFlash`: substituido por
146
- `zai-org/GLM-5.1-FP8`, que responde no chat router.
147
- - `nvidia/DeepSeek-V4-Flash-NVFP4`: o router retorna que nao e um modelo de
148
- chat. O CLI usa `deepseek-ai/DeepSeek-V4-Flash` como alternativa roteavel.
149
-
150
- A disponibilidade e o suporte a tool-calling podem variar por modelo/provedor
151
- no router. Se um modelo da Hugging Face falhar durante uso de ferramentas, use
152
- `/model auto` ou escolha um modelo OpenRouter/OpenAI no seletor.
138
+ - `minimaxai/minimax-m3`
139
+ - `moonshotai/kimi-k2.6`
140
+ - `z-ai/glm-5.1`
141
+ - `qwen/qwen3.5-397b-a17b`
153
142
 
154
143
  ## Configuracao
155
144
 
156
145
  As chaves ficam em `../.env.local`, que nao deve ser versionado:
157
146
 
158
147
  ```env
159
- OPENROUTER_API_KEY=...
160
- HUGGINGFACE_API_KEY=...
161
- HUGGINGFACE_BASE_URL=https://router.huggingface.co/v1
162
- OPENAI_API_KEY=...
163
148
  NVIDIA_API_KEY=...
164
149
  NVIDIA_BASE_URL=https://integrate.api.nvidia.com/v1
150
+ OPENAI_API_KEY=...
165
151
  ```
166
152
 
167
153
  Variaveis opcionais:
@@ -185,22 +171,19 @@ vier incompleto, a sessao falha em vez de usar uma versao reduzida. Use
185
171
  A ordem de fallback do CLI e `CLI_MODEL_CHAIN` em
186
172
  [`../lib/ai/providers.ts`](../lib/ai/providers.ts):
187
173
 
188
- 1. OpenRouter `z-ai/glm-4.5-air:free`
189
- 2. OpenRouter `qwen/qwen3-coder:free`
190
- 3. Hugging Face `Qwen/Qwen3.6-35B-A3B`, se `HUGGINGFACE_API_KEY`/`HF_TOKEN`
191
- estiver configurada
192
- 4. Hugging Face `zai-org/GLM-5.1-FP8`, se Hugging Face estiver configurada
193
- 5. Hugging Face `deepseek-ai/DeepSeek-V4-Flash`, se Hugging Face estiver
194
- configurada
174
+ 1. NVIDIA `minimaxai/minimax-m3`, se `NVIDIA_API_KEY` estiver configurada
175
+ 2. NVIDIA `moonshotai/kimi-k2.6`
176
+ 3. NVIDIA `z-ai/glm-5.1`
177
+ 4. NVIDIA `qwen/qwen3.5-397b-a17b`
178
+ 5. Kimi / DeepSeek por sessao web logada (proxies), se habilitados
195
179
  6. OpenAI `chat-latest`, se `OPENAI_API_KEY` estiver configurada
196
180
 
197
181
  Somente provedores com chave configurada entram na cadeia. Se um modelo falhar,
198
182
  o CLI tenta o proximo automaticamente.
199
183
 
200
- `NVIDIA_API_KEY` continua aceito para testes/diagnostico, mas NVIDIA fica fora
201
- do fallback do agente porque o endpoint atual retorna `500 "'role'"` depois de
202
- resultados de ferramenta. Para agente com terminal/arquivos, use OpenRouter ou
203
- OpenAI.
184
+ Os modelos NVIDIA usam o endpoint de chat-completions (`.chat(...)`), que faz
185
+ tool-calling de verdade as ferramentas do agente (`run_terminal_cmd`, `file`,
186
+ `todo_write`) disparam normalmente.
204
187
 
205
188
  Dentro do terminal voce pode escolher o modelo da sessao:
206
189