npm - alvin-bot - Versions diffs - 4.4.4 → 4.4.5 - Mend

alvin-bot 4.4.4 → 4.4.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (3) hide show

package/CHANGELOG.md CHANGED Viewed

@@ -2,6 +2,19 @@
 All notable changes to Alvin Bot are documented here.
+## [4.4.5] — 2026-04-09
+### 🔐 Security / Information Disclosure
+**`BACKLOG.md` removed from published tarball** — The project's internal roadmap was listed in `.gitignore` but not in `.npmignore`, so every `npm install -g alvin-bot` shipped an 8.7 KB file containing the full list of open P0/P1 issues, including known-but-unpatched security weaknesses (WebSocket auth gap, tool-executor sandbox gaps, Web UI HTTP-only, etc.). A published backlog of known vulnerabilities is effectively an attack roadmap for anyone inspecting the package.
+`BACKLOG.md` is now listed in `.npmignore` alongside `CLAUDE.md`, `SOUL.md`, and `TOOLS.md`. Verified with `npm pack --dry-run`: the file no longer appears in the tarball.
+Users on `4.4.4` or earlier should update:
+```bash
+npm update -g alvin-bot
+```
 ## [4.4.4] — 2026-04-09
 ### 🔐 Security / Data Layout

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "alvin-bot",
-  "version": "4.4.4",
+  "version": "4.4.5",
   "description": "Alvin Bot — Your personal AI agent on Telegram, WhatsApp, Discord, Signal, and Web.",
   "type": "module",
   "main": "dist/index.js",

package/BACKLOG.md DELETED Viewed

@@ -1,223 +0,0 @@
-# BACKLOG.md — Alvin Bot Entwicklung
-> Interne Projektdatei. Wird NICHT ins Git gepusht (.gitignore).
-> Letzte Aktualisierung: 2026-03-03
----
-## Legende
-| Prio | Bedeutung |
-|------|-----------|
-| P0 | Sicherheitslücke / Kritisch |
-| P1 | Wichtig für Stabilität & Code-Qualität |
-| P2 | Feature / Developer Experience |
-| P3 | Nice-to-Have / Zukunft |
----
-## P0 — Security
-### [ ] WebSocket Auth fehlt
-- Aktuell kann jeder, der `localhost:3100` erreicht, über WebSocket chatten
-- Lösung: Auth-Token als Query-Param beim WS-Connect (`ws://localhost:3100?token=xxx`)
-- Token aus WEB_PASSWORD ableiten oder Session-Cookie validieren
-### [ ] Tool Executor: Unzureichendes Sandboxing
-- `run_shell` Blocklist ist minimal (nur `rm -rf /`, `mkfs`, `dd`)
-- `rm -rf ~/Projects/` würde durchgehen
-- `write_file` kann `.env` und Systemdateien überschreiben
-- `python_execute` führt beliebigen Code ohne Sandbox aus
-- Lösung: Working-Directory-Sandboxing, Blocklist für sensitive Pfade (.env, /etc/, ~/.ssh/)
-### [ ] Web UI: Kein HTTPS
-- HTTP-only → Passwörter und Chat im Klartext
-- Lösung: Optionaler HTTPS-Modus mit self-signed Cert, oder Warnung wenn WEB_PASSWORD gesetzt aber kein HTTPS
-### [ ] Sudo-Passwort in CLI-Argument (macOS)
-- `security add-generic-password` bekommt das Passwort als CLI-Arg → sichtbar in `ps aux`
-- Lösung: Passwort über stdin pipen statt als Argument
----
-## P1 — Code-Qualität & Stabilität
-### [ ] commands.ts aufteilen (74KB Monolith!)
-- Aktuell: ALLE Telegram-Commands in einer Datei (~1700 Zeilen)
-- Vorschlag: `src/handlers/commands/` Ordner mit je einer Datei pro Bereich:
-  - `chat.ts` (help, start, new, cancel)
-  - `model.ts` (model, effort, fallback, voice)
-  - `tools.ts` (web, imagine, browse, remind)
-  - `memory.ts` (recall, remember, reindex, export, memory)
-  - `admin.ts` (status, dir, groups, security, users, setup, sudo)
-  - `cron.ts` (cron)
-  - `extensions.ts` (plugins, mcp, tools, webui)
-  - `index.ts` (registriert alle)
-### [ ] web/server.ts aufteilen (57KB Monolith!)
-- Aktuell: REST-API, WebSocket, Static-Serving, Auth — alles in einer Datei
-- Vorschlag: Router-Module nach Bereich (api/models.ts, api/memory.ts, api/sessions.ts, etc.)
-### [ ] web/public/js/app.js refactoren (3079 Zeilen)
-- Vanilla JS ohne Struktur → schwer wartbar
-- Option A: Alpine.js oder Petite-Vue für reaktive Bindings (minimaler Overhead)
-- Option B: Web Components für Isolation der Sektionen
-- Option C: Zumindest in Module aufteilen (ES Module Imports)
-### [ ] Config-Validation mit Zod
-- Aktuell: Kein Validation → `ALLOWED_USERS=""` ergibt `[NaN]`
-- `BOT_TOKEN` fehlt → kryptischer Fehler statt klare Meldung
-- Lösung: `src/config.ts` mit Zod-Schema, Startup-Validation, klare Fehlermeldungen
-### [ ] MAX_BUDGET_USD wird nie enforced
-- Variable wird gelesen aber nirgendwo geprüft
-- Lösung: In `queryWithFallback()` vor jedem API-Call prüfen, bei Überschreitung blockieren
-### [ ] Tests einführen
-- Aktuell: Null Tests im gesamten Projekt
-- Priorität für Tests:
-  1. Provider-Registry (Fallback-Chain Logik)
-  2. Cron-Parser (Edge Cases bei Zeitberechnung)
-  3. Tool-Executor (Security-Blocklist)
-  4. Config-Validation
-  5. Markdown-Sanitizer
-- Framework: Vitest (schnell, ESM-nativ, kein Babel nötig)
-### [ ] Watch-Mode für Development
-- Aktuell: `npm run dev` = `tsx src/index.ts` (einmal starten, manuell restarten)
-- Lösung: `tsx watch src/index.ts` oder `nodemon` mit TS-Loader
----
-## P2 — Features & Verbesserungen
-### [ ] Session-Persistence (optional)
-- Sessions überleben keinen Restart — Chat-History weg nach `pm2 restart`
-- Option A: SQLite-File für Sessions (leichtgewichtig, kein DB-Server)
-- Option B: JSON-Files pro User in `data/sessions/`
-- Opt-in via `SESSION_PERSIST=true` in .env
-### [ ] Session-Timeout / Cleanup
-- Sessions akkumulieren sich unbegrenzt im Speicher
-- Lösung: Inaktive Sessions nach 24h aus dem RAM entfernen (History bleibt in Memory-Logs)
-### [ ] Memory-Rotation
-- Daily Logs (`~/.alvin-bot/memory/YYYY-MM-DD.md`) wachsen unbegrenzt
-- Lösung: Nach 30 Tagen alte Logs in `~/.alvin-bot/memory/archive/` verschieben oder komprimieren
-- Optional: Automatische Zusammenfassung alter Logs via AI
-### [ ] Embedding-Provider erweitern
-- Aktuell: Nur Google `text-embedding-004`
-- Alternativen: OpenAI Embeddings, lokale Ollama-Embeddings, Cohere
-- Fallback-Chain wie bei Chat-Providern
-### [ ] Plugin-Tools für alle Provider
-- Plugin-Tools funktionieren aktuell nur über Telegram-Commands
-- Sie sollten auch als Agent-Tools in `OpenAICompatibleProvider` injiziert werden
-- Damit können alle LLMs Plugin-Funktionen nutzen (nicht nur Claude SDK)
-### [ ] MCP HTTP/SSE Transport fertigstellen
-- Aktuell nur stdio-Transport implementiert
-- HTTP/SSE ist stub: `"HTTP/SSE transport not yet supported"`
-- Wichtig für Remote-MCP-Server (z.B. Cloudflare Workers)
-### [ ] Discord: Richtige Integration
-- `discord.js` fehlt in package.json (muss manuell installiert werden)
-- Kein Support für Discord Slash-Commands
-- Kein Rate-Limiting
-- Lösung: Als optional peer dependency, Slash-Command Registration
-### [ ] WhatsApp Media Cleanup
-- `data/wa-media/` sammelt empfangene Medien-Dateien und löscht sie nie
-- Lösung: Cron-Job oder TTL-basiertes Cleanup (z.B. nach 7 Tagen löschen)
-### [ ] Heartbeat-Kosten reduzieren
-- Heartbeat macht echte API-Calls ("Hi") an alle Provider → erzeugt Kosten
-- Lösung: Für Provider mit bekanntem Status-Endpoint nur diesen pingen
-- Für kostenlose Provider (Groq, NVIDIA): OK so lassen
-### [ ] Kosten-Tracking verbessern
-- `estimateCost()` schätzt nur Output-Tokens, keine Input-Tokens
-- Preise teilweise veraltet
-- Lösung: Aktuelle Preistabelle pflegen, Input+Output getrennt tracken
-### [ ] Cron-Parser erweitern
-- Kein Support für `@daily`, `@hourly`, `@reboot`, `@weekly`
-- Kein `L` (last day of month), kein `W` (nearest weekday)
-- Lösung: Aliases in `parseSchedule()` hinzufügen
----
-## P3 — Nice-to-Have / Zukunft
-### [ ] Multi-Language über DE/EN hinaus
-- i18n-System unterstützt nur `de | en`
-- Erweiterbar auf FR, ES, TR, RU etc.
-- Web UI hat bereits ~500 Keys → Übersetzung nötig
-### [ ] Skill-Matching mit Embeddings
-- Aktuell: Simples `text.includes(trigger)` — sehr unzuverlässig
-- Besser: Embedding-basiertes Similarity-Matching für Skill-Trigger
-- Oder: LLM-basierte Skill-Auswahl ("Welcher Skill passt zu dieser Nachricht?")
-### [ ] Plugin Hot-Reload über Web UI
-- Aktuell: Plugin-Änderungen erfordern Bot-Restart
-- Lösung: "Reload Plugin" Button in Web UI → `pluginManager.reload(name)`
-### [ ] Conversation-Export als PDF
-- `/export` gibt aktuell Markdown → könnte auch als formatiertes PDF exportieren
-- Tools vorhanden: `pandoc`, `wkhtmltopdf`
-### [ ] Streaming für OpenAI-Compatible + Tool-Use
-- Aktuell schließen sich Streaming und Tool-Use gegenseitig aus
-- Lösung: Tool-Calls aus Stream-Chunks akkumulieren (wie OpenAI es unterstützt)
-### [ ] Windows .exe Build
-- Braucht Windows-Umgebung oder Cross-Compilation
-- electron-builder unterstützt es, aber nicht von macOS aus testbar
-### [ ] Linux .AppImage Build
-- Braucht Linux-Umgebung oder CI (GitHub Actions)
-- Vorschlag: GitHub Actions Workflow für Multi-Platform Builds
-### [ ] CI/CD Pipeline (GitHub Actions)
-- Build-Verification auf Push
-- Lint (ESLint) + Type-Check + Tests
-- Auto-Publish zu npm bei Tag
-- Multi-Platform Electron Builds (macOS, Windows, Linux)
-### [ ] Rate-Limiting für API-Endpoints
-- Web UI API-Endpoints haben kein Rate-Limiting
-- Lösung: Simpler in-memory Counter pro IP (kein Redis nötig)
-### [ ] Electron: asar wieder aktivieren
-- `asar: false` wegen electron-builder 26.x Bug
-- Bei neuerer Version testen ob es gefixt ist → Source-Code wäre dann nicht mehr exposed
-### [ ] Provider-Config via Web UI erweitern
-- Neue Provider-Presets (z.B. Anthropic API direkt, DeepSeek, Mistral) über Web UI registrieren
-- Aktuell nur über .env oder Code möglich
----
-## Erledigte Items
-### [x] i18n English-First (v3.3.0)
-- Alle Telegram-Commands, TUI, Services, Plugins auf Englisch
-- Web UI bleibt bilingual (DE/EN Toggle)
-- TUI nur noch mit explizitem --lang de auf Deutsch
-### [x] /webui Telegram-Befehl (v3.3.0)
-- Sendet Web UI URL als Text (kein Inline-Button, da Telegram localhost-URLs blockiert)
-### [x] Smart Port Selection (v3.3.0)
-- Web UI findet automatisch freien Port wenn 3100 belegt
-### [x] Multi-Platform Support (Phase 7)
-- Telegram, WhatsApp, Discord, Signal
-### [x] Universal Tool Use (Phase 8)
-- Alle Provider können Shell, File I/O, Web Fetch, Python ausführen
-### [x] Skill System (Phase 9)
-- SKILL.md-basierte Domain-Expertise