WhatsApp ist dort, wo Konversationen stattfinden. Nicht Slack, nicht Discord, nicht Telegram — für den Großteil der Welt ist WhatsApp der Standard. Zwei Milliarden monatlich aktive Nutzer, dominant in Europa, Lateinamerika, Südasien und Afrika. Wenn man einen KI-Assistenten will, der wirklich Teil des täglichen Lebens ist, muss er dort sein, wo die täglichen Konversationen bereits stattfinden.
Das Problem ist, dass WhatsApp keine Bot-API für Privatpersonen anbietet. Die WhatsApp Business API existiert, erfordert aber ein Geschäftskonto, eine Meta-Genehmigung und eine Pro-Nachricht-Gebührenstruktur, die für Kundenservice konzipiert ist, nicht für persönliche Assistenten. Für einen Entwickler, der einen persönlichen KI-Bot in seinem WhatsApp will — einen, der in Gruppenchats antwortet, Kontext behält und auf eigener Hardware läuft — ist der offizielle Weg eine Sackgasse.
NanoClaw löst das mit Baileys, einer Open-Source-WhatsApp-Web-Bibliothek, die sich auf dieselbe Weise mit WhatsApps Servern verbindet wie der WhatsApp-Web-Client. Man scannt einen QR-Code, die Verbindung wird hergestellt, und NanoClaw kann Nachrichten als das eigene WhatsApp-Konto senden und empfangen. Keine Business-API, keine Meta-Genehmigung, keine Pro-Nachricht-Gebühren.
Die Architektur: Warum WhatsApp besonders ist
NanoClaws WhatsApp-Integration ist nicht nur eine Nachrichtenbrücke — sie ist der primäre Kanal, um den die gesamte Architektur herum konzipiert ist. Während andere Kanäle (Telegram, Discord, Slack) über Claude Code Skills hinzugefügt werden, ist WhatsApp in den Kern eingebaut. Das ist keine Bevorzugung; es spiegelt wider, wie WhatsApps Gruppenmodell natürlich auf NanoClaws Sicherheitsmodell abbildet.
WhatsApp-Gruppen sind die Isolationsgrenze. Jede Gruppe erhält ihren eigenen Container, ihre eigene CLAUDE.md-Speicherdatei und ihren eigenen beschreibbaren Arbeitsbereich. Wenn jemand eine Nachricht in einer Familiengruppe sendet, hat der antwortende Agent nur Zugriff auf die Historie und den Speicher dieser Gruppe. Er kann keine Nachrichten aus der Arbeitsgruppe sehen, nicht auf die private Chat-Historie zugreifen und keine Dateien lesen, die anderen Gruppen gehören. Die Isolation wird durch Container-Mounts durchgesetzt, nicht durch Anwendungslogik.
Diese Per-Group-Isolation macht NanoClaw sicher für die Art, wie Menschen WhatsApp tatsächlich nutzen. Die Familiengruppe bespricht persönliche Angelegenheiten. Die Arbeitsgruppe bespricht proprietäre Projekte. Die Freundesgruppe teilt Dinge, die man nicht öffentlich teilen würde. Jeder dieser Kontexte muss getrennt sein, und NanoClaw stellt das sicher — nicht durch Zugriffskontrolllisten, die Bugs haben könnten, sondern durch physische Container-Trennung, die nicht durch Exploits auf Anwendungsebene umgangen werden kann.
Einrichtung
Der Einrichtungsprozess dauert etwa zehn Minuten, wovon das meiste Wartezeit für npm install ist.
Repository klonen und Abhängigkeiten installieren:
```bash git clone https://github.com/qwibitai/NanoClaw.git cd NanoClaw npm install ```
Umgebung konfigurieren. Die minimale Konfiguration ist nur ein Anthropic API-Key:
```bash echo 'ANTHROPIC_API_KEY=sk-ant-your-key-here' > .env ```
WhatsApp-Pairing starten:
```bash npm run auth ```
Das zeigt einen QR-Code im Terminal an. WhatsApp auf dem Handy öffnen, zu Verknüpfte Geräte gehen und den Code scannen. Die Verbindung wird hergestellt, und NanoClaw lauscht nun auf Nachrichten.
Den Agent starten:
```bash npm start ```
Das war's. Eine Nachricht an eine beliebige WhatsApp-Gruppe senden, in der der Bot aktiv sein soll, den Namen des Assistenten erwähnen (konfigurierbar über ASSISTANT_NAME in .env), und er antwortet. Die erste Antwort dauert ein paar Sekunden, während der Container hochfährt; nachfolgende Nachrichten in derselben Sitzung sind schneller, weil der Container warm bleibt.
Wie Nachrichten fließen
Das Verständnis des Nachrichtenflusses erklärt, warum sich NanoClaw trotz des Container-Overheads reaktionsschnell anfühlt. Wenn eine Nachricht auf WhatsApp eintrifft, empfängt der Host-Prozess — NanoClaws ~500-Zeilen-TypeScript-Kern — sie über Baileys. Er prüft, ob die Nachricht an den Assistenten gerichtet ist (durch Namenserwähnung oder Direktnachricht). Falls ja, schlägt der Host den Container-Status der Gruppe nach.
Wenn bereits ein Container für diese Gruppe läuft (aus einer kürzlichen Konversation), wird die Nachricht über IPC an ihn weitergeleitet. Der Agent im Container empfängt die Nachricht, verarbeitet sie mit Claude Agent SDK und sendet die Antwort über IPC zurück. Der Host leitet die Antwort an WhatsApp weiter. Zusätzliche Latenz insgesamt: wenige Millisekunden für IPC, plus was auch immer Claudes API für die Antwort braucht.
Wenn kein Container läuft, startet der Host einen. Auf macOS mit Apple Container dauert das 200–400 ms. Auf Linux mit Docker 1–2 Sekunden. Der Container erhält die CLAUDE.md-Speicherdatei der Gruppe, die Konversationshistorie aus SQLite und den API-Key über stdin. Er verarbeitet die Nachricht und antwortet. Der Container bleibt für ein konfigurierbares Timeout aktiv (Standard: 30 Minuten), um Folgenachrichten ohne den Start-Overhead zu verarbeiten.
Das Ergebnis ist, dass die meisten Nachrichten — die während einer aktiven Konversation — sich sofort anfühlen. Die KI-Antwortzeit wird von Claudes API-Latenz dominiert, nicht von NanoClaws Infrastruktur. Nur die erste Nachricht nach einer längeren Pause hat den Container-Start-Overhead, und selbst der ist schnell genug, dass Nutzer ihn selten bemerken.
Per-Group-Speicher: Das Feature, das es nützlich macht
Die Per-Group-CLAUDE.md-Datei verwandelt einen zustandslosen Chatbot in einen wirklich nützlichen Assistenten. Die Speicherdatei jeder Gruppe sammelt über die Zeit Kontext an — Präferenzen, laufende Projekte, wiederkehrende Themen, Insider-Witze. Der Agent liest diese Datei zu Beginn jedes Konversationsschritts, was bedeutet, dass er sich erinnert, was man ihm letzte Woche gesagt hat, ohne dass man es wiederholen muss.
In einer Familiengruppe könnte der Speicher Ernährungspräferenzen, Schulpläne und wiederkehrende Aktivitäten vermerken. In einer Arbeitsgruppe könnte er Projektfristen, Teampräferenzen und technische Entscheidungen verfolgen. In einer Freundesgruppe könnte er sich an Reisepläne, Restaurantempfehlungen und gemeinsame Interessen erinnern.
Der Speicher ist editierbar. Man kann den Agent bitten, sich etwas Bestimmtes zu merken („merke dir, dass Mama gegen Schalentiere allergisch ist") oder etwas zu vergessen („vergiss, was ich über die Überraschungsparty gesagt habe"). Man kann die CLAUDE.md-Datei auch direkt bearbeiten — es ist eine einfache Textdatei im eigenen Dateisystem, nicht in einer Datenbank eingesperrt.
Die Datenschutz-Realität
Einen WhatsApp-KI-Bot zu betreiben wirft berechtigte Datenschutzfragen auf, und es lohnt sich, direkt darüber zu sprechen. Die Nachrichten, die NanoClaw verarbeitet, werden an Anthropics API gesendet, damit Claude Antworten generieren kann. Das bedeutet, dass WhatsApp-Nachrichten — oder zumindest die an den Assistenten gerichteten — das eigene Gerät verlassen und von Anthropics Servern verarbeitet werden.
NanoClaw mildert das auf mehrere Weisen ab. Nur Nachrichten, die explizit an den Assistenten gerichtet sind, werden an die API gesendet — der Bot verarbeitet oder speichert keine Nachrichten, die nicht an ihn gerichtet sind. Die in SQLite gespeicherte Konversationshistorie bleibt auf dem eigenen Rechner. Die CLAUDE.md-Speicherdateien bleiben auf dem eigenen Rechner. Und wenn man NanoClaw so konfiguriert, dass es Ollama statt Anthropic nutzt, findet die KI-Verarbeitung auch lokal statt — nichts verlässt das eigene Netzwerk.
Für die meisten Nutzer sieht die praktische Datenschutzlage so aus: WhatsApp-Nachrichten bleiben auf dem eigenen Gerät, außer wenn man dem KI-Assistenten explizit eine Frage stellt — in diesem Fall wird diese spezifische Nachricht an Anthropic gesendet (oder lokal mit Ollama verarbeitet). Das ist eine deutlich bessere Datenschutz-Story als Cloud-KI-Dienste, die alles verarbeiten und speichern, was man tippt.
WhatsApp ist dort, wo das Leben stattfindet. NanoClaw platziert einen KI-Assistenten dort — mit dem Isolations-, Speicher- und Datenschutzmodell, das es sicher macht, ihn in den Gruppen zu nutzen, in denen man Dinge bespricht, die wirklich wichtig sind.