npm - mcp-lab-agent - Versions diffs - 1.1.1 → 2.0.0 - Mend

mcp-lab-agent 1.1.1 → 2.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

package/README.md CHANGED Viewed

@@ -1,242 +1,310 @@
 # mcp-lab-agent
-MCP server + AI agents para QA automation em **qualquer projeto**. Detecta automaticamente frameworks de teste e estrutura do projeto.
+[![npm version](https://img.shields.io/npm/v/mcp-lab-agent.svg)](https://www.npmjs.com/package/mcp-lab-agent)
+[![Node.js](https://img.shields.io/badge/node-%3E%3D18-green)](https://nodejs.org)
+[![License: MIT](https://img.shields.io/badge/License-MIT-blue.svg)](LICENSE)
-## 📚 Documentação Rápida
+**Agente autônomo de QA que aprende com os próprios erros.**
-| Guia | Descrição |
-|------|-----------|
-| 🚀 **[Quick Start](QUICKSTART.md)** | Instale em 2 minutos e comece a usar |
-| 📖 **[Como Usar](COMO_USAR.md)** | Guia completo de uso com exemplos |
-| 🧪 **[Teste Comigo](TESTE_COMIGO.md)** | Roteiro para testar e dar feedback |
-| 🔧 **[Instalação](INSTALL.md)** | Opções detalhadas de instalação |
-| ⚙️ **[Setup Cursor](CURSOR_SETUP.md)** | Configuração passo a passo |
-| 🚨 **[Troubleshooting](TROUBLESHOOTING.md)** | Solução de problemas |
-| 🎯 **[Frameworks](FRAMEWORKS.md)** | Frameworks suportados |
+Não é só um assistente: é um agente que **lê seu projeto, gera testes, executa, corrige falhas automaticamente e aprende** para cada vez acertar mais na primeira tentativa.
-## Features
-- **Detecção automática** de frameworks:
-  - **E2E/UI**: Cypress, Playwright, WebdriverIO
-  - **Unit/Integration**: Jest, Vitest, Mocha, Jasmine
-  - **Mobile**: Appium, Detox
-  - **API**: Supertest, Pactum
-  - **Python**: Robot Framework, pytest, Behave
-- **Execução de testes** com output estruturado (backend, frontend, mobile, API)
-- **Geração de testes** via LLM (Groq, Gemini, OpenAI)
-- **Análise de falhas** e sugestões de correção inteligentes
-- **Bug reports** automáticos em Markdown
-- **Linter** e **coverage** integrados
-- **Templates de teste** para API, UI e Unit
-- **Zero configuração**: funciona em projetos Node.js e Python
-## Instalação e Uso no Cursor
+---
-### 🚀 Instalação Rápida (Recomendado)
+## O diferencial
-**1. Configure o MCP no Cursor:**
+| Outras ferramentas | **mcp-lab-agent** |
+|-------------------|-------------------|
+| Geram testes | **Gera, roda, corrige e aprende** |
+| Você corrige erros | **Auto-correção com retry inteligente** |
+| Sem memória | **Aprende com erros passados** |
+| Configuração complexa | **Zero config: detecta 15+ frameworks** |
+| Sem métricas | **Taxa de sucesso, correções, aprendizados** |
-Edite ou crie o arquivo `~/.cursor/mcp.json`:
+**Modo autônomo:**
 ```bash
-mkdir -p ~/.cursor
-nano ~/.cursor/mcp.json
-```
-**2. Adicione a configuração:**
-```json
-{
-  "mcpServers": {
-    "qa-lab-agent": {
-      "command": "npx",
-      "args": ["-y", "mcp-lab-agent"],
-      "cwd": "${workspaceFolder}"
-    }
-  }
-}
+npx mcp-lab-agent auto "login flow" --max-retries 5
 ```
-**3. Reinicie o Cursor**
+O agente:
+1. Detecta seu projeto (Cypress, Playwright, Jest, etc.)
+2. Gera o teste com base em aprendizados anteriores
+3. Executa o teste
+4. Se falhar: analisa, corrige e tenta de novo
+5. Aprende com cada correção para melhorar nas próximas
-**4. Pronto!** Abra qualquer projeto e use normalmente no chat.
+**Resultado:** Testes que passam na primeira tentativa aumentam com o tempo.
 ---
-### 📦 Outras Opções de Instalação
+## Quick Start
-<details>
-<summary>Opção 1: Build Local (para desenvolvimento)</summary>
+### Modo autônomo (CLI)
 ```bash
-# Clone e instale
-git clone https://github.com/Wesley-Gomes93/mcp-lab-agent
-cd mcp-lab-agent
-npm install
-npm run build
+# Gera, roda, corrige e aprende automaticamente
+npx mcp-lab-agent auto "login flow" --max-retries 5
+# Ver métricas de aprendizado
+npx mcp-lab-agent stats
+# Detectar estrutura do projeto
+npx mcp-lab-agent detect
 ```
-Configure no `~/.cursor/mcp.json`:
+### Integração com IDE (Cursor/Cline/Windsurf)
+**1. Configure o MCP** (`~/.cursor/mcp.json`):
 ```json
 {
   "mcpServers": {
     "qa-lab-agent": {
-      "command": "node",
-      "args": ["/caminho/completo/para/mcp-lab-agent/dist/index.js"],
+      "command": "npx",
+      "args": ["-y", "mcp-lab-agent"],
       "cwd": "${workspaceFolder}"
     }
   }
 }
 ```
-**Nota:** Substitua `/caminho/completo/para/mcp-lab-agent` pelo caminho real no seu sistema.
-</details>
+**2. Use no chat:**
-<details>
-<summary>Opção 2: Instalação Global com npm link</summary>
-```bash
-cd mcp-lab-agent
-sudo npm link
+```
+"Detecte a estrutura do meu projeto"
+"Modo autônomo: gere teste para login"
+"Rode os testes"
+"Por que o teste falhou?"
+"Avalie http://localhost:3000 no browser"
+"Mostre as estatísticas de aprendizado"
 ```
-Configure no `~/.cursor/mcp.json`:
+---
-```json
-{
-  "mcpServers": {
-    "qa-lab-agent": {
-      "command": "mcp-lab-agent",
-      "cwd": "${workspaceFolder}"
-    }
-  }
-}
+## Architecture
+O diagrama abaixo mostra como o agente autônomo funciona:
+```mermaid
+flowchart TB
+    subgraph IDE["🖥️ IDE (Cursor, Cline, Windsurf)"]
+        Chat[Chat do usuário]
+    end
+    subgraph CLI["💻 CLI (Terminal)"]
+        Auto["mcp-lab-agent auto"]
+        Stats["mcp-lab-agent stats"]
+    end
+    subgraph MCP["MCP Protocol (stdio)"]
+        Transport[Stdio Transport]
+    end
+    subgraph Agent["mcp-lab-agent"]
+        Router[qa_route_task]
+        AutoTool["qa_auto<br/>(Loop autônomo)"]
+        subgraph Agents["Agentes Especializados"]
+            D[detection<br/>detect_project, read_project, list_test_files]
+            E[execution<br/>run_tests, watch_tests, get_test_coverage]
+            G[generation<br/>generate_tests, write_test]
+            A[analysis<br/>analyze_failures, por_que_falhou, suggest_selector_fix]
+            B[browser<br/>web_eval_browser]
+            R[reporting<br/>create_bug_report, get_business_metrics]
+            L[learning<br/>qa_learning_stats]
+        end
+        subgraph Brain["🧠 Núcleo Inteligente"]
+            MR[Model Router<br/>simples → Groq/Flash | complexo → 70B/Pro]
+            PM[Project Memory<br/>.qa-lab-memory.json]
+            FD[Flaky Detection<br/>timing, selector, network]
+            LS[Learning System<br/>salva correções bem-sucedidas]
+        end
+    end
+    subgraph External["Externo"]
+        LLM[LLM: Groq / Gemini / OpenAI]
+        PW[Playwright optional]
+        Proj[Seu projeto]
+    end
+    Chat --> Transport
+    Transport --> Router
+    Router --> AutoTool
+    Router --> D & E & G & A & B & R & L
+    Auto --> AutoTool
+    Stats --> L
+    AutoTool --> G
+    AutoTool --> E
+    AutoTool --> A
+    AutoTool --> LS
+    D & E & G & A & R --> Proj
+    B --> PW
+    B --> Proj
+    G & A --> MR
+    MR --> LLM
+    G & A & AutoTool --> PM
+    A & AutoTool --> FD
+    AutoTool --> LS
+    LS --> PM
 ```
-</details>
+**Fluxo autônomo (qa_auto):**
+1. **Detecta** projeto (frameworks, pastas, fluxos)
+2. **Gera** teste usando LLM + memória de aprendizados
+3. **Executa** o teste
+4. **Se falhar:** analisa (flaky detection), corrige e tenta de novo
+5. **Aprende:** salva correções bem-sucedidas na memória
+6. **Repete** até passar ou atingir max_retries
+**Fluxo resumido (IDE):**
+1. **Usuário** fala no chat do IDE
+2. **MCP** entrega a mensagem ao `mcp-lab-agent`
+3. **qa_route_task** sugere o agente certo (detection, execution, generation, etc.)
+4. **Ferramentas** executam no projeto (detectar, rodar, gerar, analisar)
+5. **Model Router** escolhe o modelo: tarefas simples → barato; complexas → mais capaz
+6. **Project Memory** guarda padrões e fluxos para próximas gerações
+7. **Flaky Detection** identifica testes intermitentes e sugere correções
+---
-## Ferramentas disponíveis
+## Features
-### Core Tools
+| Categoria | O que faz |
+|-----------|-----------|
+| **🤖 Autônomo** | `qa_auto` — loop completo: gera, roda, corrige, aprende (até passar ou max_retries) |
+| **📊 Learning** | Salva correções bem-sucedidas, taxa de sucesso na 1ª tentativa, métricas de aprendizado |
+| **Detecção** | Cypress, Playwright, WebdriverIO, Jest, Vitest, Mocha, Robot, pytest, Behave, Appium, Detox |
+| **Execução** | run_tests, watch, coverage (Jest/Vitest) |
+| **Geração** | Testes via LLM (Groq, Gemini, OpenAI), templates |
+| **Análise** | analyze_failures, por_que_falhou, suggest_fix, suggest_selector_fix |
+| **Browser** | web_eval_browser — screenshots, network, console (Playwright opcional) |
+| **Relatórios** | Bug reports em Markdown, métricas de negócio |
+| **Flaky-aware** | Detecta timing, selector, network; sugere retries |
+| **Model routing** | Tarefas simples → modelo barato; complexas → modelo forte |
+| **Memória** | Cache em .qa-lab-memory.json, qa-lab-flows.json |
-| Tool | Descrição |
-|------|-----------|
-| `detect_project` | Detecta frameworks, pastas de teste, backend, frontend |
-| `run_tests` | Executa testes (Cypress, Playwright, Jest, npm test) |
-| `read_project` | Lê package.json, specs existentes |
-| `generate_tests` | Gera spec com LLM (requer API key) |
-| `write_test` | Grava spec no disco |
-| `analyze_failures` | Analisa output de falhas e extrai stack traces |
+---
-### Novas Ferramentas (v2.0)
+## CLI
-| Tool | Descrição |
-|------|-----------|
-| `suggest_fix` | Sugere correções para falhas detectadas (seletores, asserções, rede) |
-| `create_bug_report` | Gera bug report estruturado em Markdown a partir de falhas |
-| `list_test_files` | Lista todos os arquivos de teste (filtro por framework/pattern) |
-| `run_linter` | Executa ESLint/Prettier com auto-fix opcional |
-| `install_dependencies` | Instala dependências (npm/yarn/pnpm - detecta automaticamente) |
-| `get_test_coverage` | Gera relatório de cobertura de testes (Jest) |
-| `watch_tests` | Inicia testes em watch mode (Jest/Vitest) |
-| `create_test_template` | Gera boilerplate de teste (API/UI/Unit) para qualquer framework |
-| `suggest_selector_fix` | **Self-healing:** Sugere seletor alternativo quando UI muda (element not found) |
-| `get_business_metrics` | **Métricas de negócio:** Tempo até bug, custo por defeito, cobertura por fluxo |
-| `suggest_selector_fix` | **Self-healing:** Sugere correção de seletor quando UI muda (LLM) |
-| `get_business_metrics` | **Métricas de negócio:** Tempo até bug, custo por defeito, cobertura por fluxo |
+```bash
+mcp-lab-agent [comando]
+```
-## Variáveis de ambiente (opcional)
+| Comando | Descrição |
+|---------|-----------|
+| *(sem args)* | Inicia o servidor MCP (modo padrão para o IDE) |
+| `auto <descrição> [--max-retries N]` | **[NOVO]** Modo autônomo: gera, roda, corrige e aprende (default: 3 tentativas) |
+| `stats` | **[NOVO]** Mostra estatísticas de aprendizado (taxa de sucesso, correções, etc.) |
+| `detect [--json]` | Detecta frameworks e estrutura do projeto |
+| `route <tarefa>` | Sugere qual ferramenta usar |
+| `list` | Lista agentes e ferramentas disponíveis |
+| `--help` | Mostra ajuda |
+**Exemplos:**
+```bash
+mcp-lab-agent auto "login flow" --max-retries 5
+mcp-lab-agent stats
+mcp-lab-agent detect
+mcp-lab-agent route "rodar os testes"
+mcp-lab-agent list
+```
-Para usar `generate_tests`, configure no `.env` do projeto:
+Referência completa do CLI: `mcp-lab-agent --help`
-- **GROQ_API_KEY** — Groq (gratuito): https://console.groq.com/keys
-- **GEMINI_API_KEY** — Google Gemini (gratuito): https://aistudio.google.com/apikey
-- **OPENAI_API_KEY** — OpenAI (pago): https://platform.openai.com/api-keys
+---
-## Como Usar
+## Escalabilidade
-### 💬 Conversação Natural
+### Como o mcp-lab-agent escala para empresas
-**Você não precisa saber comandos especiais!** Apenas converse naturalmente com o Cursor:
+**1. Multi-projeto:**
+- Cada projeto tem sua própria memória (`.qa-lab-memory.json`)
+- Aprendizados são isolados por contexto
+- Suporte a monorepos (detecta múltiplos frameworks)
-```
-"Detecte a estrutura do meu projeto"
-"Gere um teste para o fluxo de login"
-"Rode os testes"
-"Analise as falhas e sugira correções"
-"Crie um bug report das falhas"
+**2. CI/CD:**
+```yaml
+# .github/workflows/qa.yml
+- run: npx mcp-lab-agent auto "smoke tests" --max-retries 2
+- run: npx mcp-lab-agent stats
 ```
-O Cursor **automaticamente** identifica quando usar as ferramentas do MCP. Você não precisa mencionar nomes de ferramentas ou fazer configurações especiais.
+**3. Métricas exportáveis:**
+- `.qa-lab-memory.json` pode ser lido por dashboards
+- `stats` retorna JSON estruturado
+- Integração com Grafana/DataDog via script
-### 🎯 Exemplos Práticos
+**4. Aprendizado compartilhado (roadmap):**
+- Exportar/importar memórias entre projetos
+- Central de aprendizados da empresa
+- Padrões globais + overrides locais
-**Começando em um projeto novo:**
-```
-Você: "Quais frameworks de teste estão instalados aqui?"
-Cursor: [usa detect_project automaticamente]
+**5. Customização:**
+- `qa-lab-flows.json` para fluxos de negócio específicos
+- Variáveis de ambiente para modelos customizados
+- Extensível via MCP tools
-Você: "Gere um teste E2E para o cadastro de usuários"
-Cursor: [usa generate_tests + write_test]
+---
-Você: "Rode os testes"
-Cursor: [usa run_tests]
-```
+## Configuração
-**Analisando falhas:**
-```
-Você: "Os testes falharam, me ajude a entender o que aconteceu"
-Cursor: [usa analyze_failures + suggest_fix]
+### Variáveis de ambiente (opcional)
-Você: "Crie um relatório dessas falhas"
-Cursor: [usa create_bug_report]
-```
+| Variável | Uso |
+|----------|-----|
+| `GROQ_API_KEY` | Groq (gratuito, rápido) |
+| `GEMINI_API_KEY` | Google Gemini |
+| `OPENAI_API_KEY` | OpenAI |
+| `QA_LAB_LLM_SIMPLE` | Modelo para tarefas simples (ex: gemini-1.5-flash) |
+| `QA_LAB_LLM_COMPLEX` | Modelo para tarefas complexas (ex: gpt-4o) |
-**Manutenção do projeto:**
-```
-Você: "Liste todos os testes de Cypress"
-Cursor: [usa list_test_files]
+### Modo browser (opcional)
-Você: "Rode o linter e corrija os problemas"
-Cursor: [usa run_linter com auto-fix]
+Para `web_eval_browser`:
-Você: "Gere um relatório de cobertura"
-Cursor: [usa get_test_coverage]
+```bash
+npm install playwright
 ```
-### 🔧 Ferramentas Disponíveis (para referência)
-Você não precisa chamar essas ferramentas diretamente, mas é útil saber o que está disponível:
+---
-| Categoria | Ferramentas |
-|-----------|-------------|
-| **Detecção** | `detect_project`, `read_project`, `list_test_files` |
-| **Execução** | `run_tests`, `watch_tests`, `get_test_coverage` |
-| **Geração** | `generate_tests`, `write_test`, `create_test_template` |
-| **Análise** | `analyze_failures`, `suggest_fix`, `suggest_selector_fix`, `create_bug_report` |
-| **Métricas** | `get_business_metrics` |
-| **Manutenção** | `run_linter`, `install_dependencies` |
+## Documentação
-## Publicar no npm
+- **[PITCH.md](PITCH.md)** — Apresentação executiva (use para apresentar ao time)
+- **[EXEMPLO_EVOLUCAO.md](EXEMPLO_EVOLUCAO.md)** — Como a taxa de sucesso melhora com o tempo
+- **[ARQUITETURA_LEARNING.md](ARQUITETURA_LEARNING.md)** — Detalhes técnicos do sistema de learning
+- **[CHANGELOG.md](CHANGELOG.md)** — Histórico de versões
+- **[MIGRATION_V2.md](MIGRATION_V2.md)** — Guia de migração da v1.x
-```bash
-npm run build
-npm login
-npm publish
-```
+Documentação completa (local): `docs/`
-Se o nome `mcp-lab-agent` já estiver em uso, use escopo: `@seu-usuario/mcp-lab-agent`.
+---
-## Desenvolvimento local
+## Desenvolvimento
 ```bash
+git clone https://github.com/Wesley-Gomes93/mcp-lab-agent
+cd mcp-lab-agent
 npm install
 npm run build
-node dist/index.js  # testa o servidor
+npm test
 ```
+| Script | Descrição |
+|--------|-----------|
+| `npm run build` | Build com tsup |
+| `npm test` | Testes (Vitest) |
+| `npm run test:coverage` | Cobertura |
+| `npm run dev` | Build em watch |
+---
 ## Licença
-MIT
+MIT © Wesley Gomes