Roje agentów: kiedy jeden AI nie wystarcza i jak NanoClaw orkiestruje wiele

Prosisz swojego asystenta AI o zbadanie produktu konkurencji, podsumowanie wyników, przygotowanie dokumentu porównawczego i wysłanie go do zespołu mailem. Pojedynczy agent potrafi wykonać każdy z tych kroków — ale zrobienie ich dobrze, sekwencyjnie, utrzymując kontekst przez wszystkie cztery zadania, napiera na granice tego, co jedna sesja agenta obsługuje z gracją. Okno kontekstu się zapełnia. Agent traci orientację w wcześniejszych krokach. Jakość końcowego wyniku spada, bo model żongluje zbyt wieloma kwestiami jednocześnie.

To jest problem, który rozwiązują roje agentów. Zamiast jednego agenta robiącego wszystko, agent koordynator rozbija zadanie na podzadania i deleguje każde do agenta specjalisty. Agent badawczy przeszukuje internet i zwraca ustrukturyzowane wyniki. Agent piszący bierze te wyniki i przygotowuje dokument. Agent mailowy wysyła rezultat. Każdy agent działa we własnym kontenerze, z własnym oknem kontekstu, skupiony na jednej rzeczy.

Pomysł nie jest nowy — CrewAI i AutoGen eksplorują wzorce wieloagentowe od ponad roku. Różnica w podejściu NanoClaw polega na tym, że każdy agent w roju działa we własnym izolowanym kontenerze, co oznacza, że gwarancje bezpieczeństwa i izolacji obowiązujące dla rozmów z pojedynczym agentem automatycznie rozciągają się na przepływy wieloagentowe.

Jak roje działają w NanoClaw

Architektura rojów NanoClaw jest zbudowana na prostym prymitywie: agent może tworzyć innych agentów. Kiedy Claude Code działa wewnątrz kontenera, jednym z dostępnych narzędzi jest delegacja agenta — możliwość opisania podzadania i zlecenia NanoClaw utworzenia nowego kontenera do jego obsługi. Agent nadrzędny dostaje wynik, kiedy agent podrzędny zakończy pracę.

Orkiestracja odbywa się naturalnie przez własne rozumowanie Claude. Nie definiujesz grafu przepływu pracy ani nie konfigurujesz ról agentów w pliku YAML. Opisujesz, czego chcesz, a Claude decyduje, czy obsłużyć to bezpośrednio, czy delegować części do podagentów. Decyzja opiera się na tym samym rozumowaniu, które czyni Claude dobrym w rozkładaniu złożonych problemów — rozpoznaje, kiedy zadanie ma niezależne komponenty, które skorzystałyby na skupionej uwadze.

W praktyce wygląda to jak drzewo kontenerów. Kontener główny odbiera Twoją wiadomość, decyduje, że potrzebuje badań webowych i pisania dokumentu, tworzy dwa kontenery podrzędne, czeka na ich wyniki i syntetyzuje końcową odpowiedź. Każdy kontener podrzędny ma własny kontekst CLAUDE.md, własną zamontowaną przestrzeń roboczą i własny zestaw narzędzi. Agent badawczy ma włączone przeglądanie internetu; agent piszący ma dostęp do zapisu w współdzielonej przestrzeni roboczej. Żaden nie może uzyskać dostępu do kontekstu ani narzędzi drugiego.

Dlaczego izolacja kontenerowa ma znaczenie dla rojów

Większość frameworków wieloagentowych uruchamia wszystkich agentów w tym samym procesie. Agenci CrewAI współdzielą środowisko uruchomieniowe Python. Agenci AutoGen współdzielą wątek rozmowy. To działa na dema, ale tworzy problemy na skalę, które trudno naprawić po fakcie.

Pierwszy problem to zasięg rażenia. Jeśli jeden agent w roju napotka prompt injection — złośliwą stronę, która próbuje przejąć zachowanie agenta — iniekcja jest zamknięta w tym pojedynczym kontenerze. Nie może wpłynąć na agenta nadrzędnego, nie może uzyskać dostępu do kontekstów innych agentów podrzędnych i nie może odczytać historii rozmów oryginalnego użytkownika. Skompromitowany kontener jest niszczony po zakończeniu, a agent nadrzędny otrzymuje jakikolwiek wynik wyprodukował (który może ocenić pod kątem jakości przed użyciem).

Drugi problem to rywalizacja o zasoby. Agenci we współdzielonym procesie konkurują o to samo okno kontekstu, tę samą pamięć i ten sam procesor. W NanoClaw każdy kontener ma własne zasoby. Agent badawczy przeglądający ciężkie strony nie spowalnia agenta piszącego, który przygotowuje dokument. Kontenery działają współbieżnie na oddzielnych wątkach, a zarządzanie zasobami hosta obsługuje planowanie.

Trzeci problem to zakres uprawnień. Agent badawczy potrzebuje dostępu do internetu, ale nie powinien mieć uprawnień do zapisu plików. Agent zarządzający plikami potrzebuje dostępu do dysku, ale nie powinien mieć dostępu do internetu. We frameworku ze współdzielonym procesem wymuszanie tych granic wymaga kontroli uprawnień na poziomie aplikacji, które można obejść. W NanoClaw granice to montowania kontenerów — agent badawczy dosłownie nie może zapisywać na dysku, bo żadna zapisywalna ścieżka nie jest zamontowana do jego kontenera.

Praktyczne wzorce rojów

Wzorce wyłaniające się z rzeczywistego użycia są ciekawsze niż teoretyczna architektura. Najczęstszy to wzorzec badaj-i-syntetyzuj: agent nadrzędny tworzy 3-5 agentów badawczych do zbadania różnych aspektów pytania równolegle, zbiera ich wyniki i produkuje zsyntetyzowaną odpowiedź, która jest dokładniejsza niż cokolwiek, co pojedynczy agent mógłby wyprodukować w jednym podejściu.

Drugi częsty wzorzec to szkicuj-i-recenzuj. Agent pisze pierwszy szkic, potem tworzy agenta recenzenta z instrukcjami, by go skrytykował. Feedback recenzenta wraca do oryginalnego agenta (lub nowego agenta piszącego) do rewizji. To produkuje zauważalnie lepszy wynik niż generowanie w jednym podejściu, bo agent recenzent ma świeże okno kontekstu i może ocenić szkic bez obciążenia poznawczego związanego z jego napisaniem.

Trzeci wzorzec to specjalizacja narzędziowa. Niektóre zadania wymagają narzędzi, które są kosztowne lub ryzykowne — przeglądanie internetu, wykonywanie poleceń powłoki, modyfikacje systemu plików. Agent nadrzędny może delegować te operacje do agentów podrzędnych z konkretnym dostępem do narzędzi, utrzymując własny kontekst czysty i własne uprawnienia minimalne. Agent nadrzędny nigdy bezpośrednio nie dotyka systemu plików ani sieci; przetwarza tylko wyniki, które zwracają agenci podrzędni.

Ograniczenia rojów

Roje nie są darmowe. Każdy agent podrzędny to oddzielne wywołanie API Claude, co oznacza oddzielne koszty tokenów. Rój, który tworzy pięciu agentów badawczych, kosztuje mniej więcej pięć razy tyle co pojedynczy agent wykonujący całe badanie. Dla prostych pytań — „jaka jest pogoda?" lub „przetłumacz to zdanie" — roje to czysty narzut.

Opóźnienie też się kumuluje. Nawet przy równoległym wykonaniu agent nadrzędny musi czekać na najwolniejszego agenta podrzędnego, zanim może zsyntetyzować wyniki. Rój pięciu agentów, gdzie jeden potrzebuje 30 sekund na przeglądanie wolnej strony, oznacza, że użytkownik czeka 30 sekund plus czas syntezy, niezależnie od tego, jak szybcy byli pozostali czterej.

NanoClaw radzi sobie z tym pragmatycznie. Claude decyduje, kiedy użyć rojów na podstawie złożoności zadania — proste pytania dostają bezpośrednie odpowiedzi, złożone wieloczęściowe żądania są delegowane. Użytkownik nie konfiguruje zachowania rojów; po prostu zadaje pytania, a system skaluje swoje podejście do złożoności. Celem nie jest używanie rojów wszędzie — celem jest używanie ich tam, gdzie naprawdę produkują lepsze wyniki niż pojedynczy agent.

Wieloagentowa przyszłość nie polega na zastępowaniu pojedynczych agentów. Polega na daniu pojedynczym agentom możliwości wezwania pomocy, kiedy jej potrzebują, w sposób bezpieczny, izolowany i przejrzysty. Model kontener-na-agenta NanoClaw umożliwia to bez kompromisów bezpieczeństwa, które wynikają z uruchamiania wielu agentów we współdzielonym środowisku.

Roje agentów: kiedy jeden AI nie wystarcza i jak NanoClaw orkiestruje wiele

Jak roje działają w NanoClaw

Dlaczego izolacja kontenerowa ma znaczenie dla rojów

Praktyczne wzorce rojów

Ograniczenia rojów

Zacznij budować agentów AI już dziś