Bạn yêu cầu trợ lý AI nghiên cứu sản phẩm đối thủ, tóm tắt kết quả, soạn tài liệu so sánh, và gửi email cho đội. Một agent đơn lẻ có thể làm từng bước — nhưng làm tốt tất cả, theo trình tự, trong khi duy trì ngữ cảnh xuyên suốt bốn tác vụ, đẩy đến giới hạn của một phiên agent. Context window đầy lên. Agent mất dấu các bước trước. Chất lượng đầu ra cuối cùng giảm vì mô hình đang xử lý quá nhiều mối quan tâm cùng lúc.
Đây là vấn đề mà agent swarm giải quyết. Thay vì một agent làm mọi thứ, agent điều phối chia tác vụ thành các tác vụ con và ủy thác mỗi tác vụ cho agent chuyên biệt. Agent nghiên cứu tìm kiếm web và trả về kết quả có cấu trúc. Agent viết lách nhận kết quả đó và soạn tài liệu. Agent email gửi kết quả. Mỗi agent hoạt động trong container riêng, với context window riêng, tập trung vào một việc.
Ý tưởng không mới — CrewAI và AutoGen đã khám phá mô hình đa agent hơn một năm. Điều khác biệt ở cách tiếp cận của NanoClaw là mỗi agent trong swarm chạy trong container cách ly riêng, nghĩa là đảm bảo bảo mật và cách ly áp dụng cho hội thoại đơn agent tự động mở rộng sang workflow đa agent.
Swarm Hoạt Động Thế Nào Trong NanoClaw
Kiến trúc swarm của NanoClaw xây trên một nguyên tắc đơn giản: agent có thể sinh ra agent khác. Khi Claude Code chạy trong container, một trong các công cụ khả dụng là ủy thác agent — khả năng mô tả tác vụ con và để NanoClaw khởi tạo container mới xử lý nó. Agent cha nhận lại kết quả khi agent con hoàn thành.
Việc điều phối diễn ra tự nhiên qua lý luận của chính Claude. Bạn không cần định nghĩa đồ thị workflow hay cấu hình vai trò agent trong file YAML. Bạn mô tả điều bạn muốn, và Claude quyết định xử lý trực tiếp hay ủy thác phần nào cho sub-agent. Quyết định dựa trên cùng khả năng lý luận khiến Claude giỏi phân tách vấn đề phức tạp — nó nhận ra khi tác vụ có các thành phần độc lập sẽ hưởng lợi từ sự tập trung riêng.
Trong thực tế, nó trông như cây container. Container gốc nhận tin nhắn của bạn, quyết định cần nghiên cứu web và viết tài liệu, sinh hai container con, đợi kết quả, và tổng hợp phản hồi cuối cùng. Mỗi container con có ngữ cảnh CLAUDE.md riêng, workspace mount riêng, và tập công cụ riêng. Agent nghiên cứu được bật duyệt web; agent viết lách có quyền ghi file vào workspace chung. Không agent nào truy cập được ngữ cảnh hay công cụ của agent kia.
Tại Sao Container Isolation Quan Trọng Cho Swarm
Hầu hết framework đa agent chạy tất cả agent trong cùng tiến trình. Agent của CrewAI chia sẻ Python runtime. Agent của AutoGen chia sẻ luồng hội thoại. Cách này hoạt động cho demo, nhưng tạo vấn đề ở quy mô lớn khó sửa sau.
Vấn đề đầu tiên là phạm vi thiệt hại. Nếu một agent trong swarm gặp prompt injection — website độc hại cố chiếm quyền hành vi agent — injection bị giới hạn trong container đó. Nó không thể ảnh hưởng agent cha, không thể truy cập ngữ cảnh agent con khác, và không thể đọc lịch sử hội thoại của người dùng gốc. Container bị xâm nhập bị hủy khi hoàn thành, và agent cha nhận bất kỳ đầu ra nào nó tạo ra (mà agent cha có thể đánh giá chất lượng trước khi dùng).
Vấn đề thứ hai là tranh chấp tài nguyên. Agent trong tiến trình chung cạnh tranh cùng context window, cùng bộ nhớ, và cùng CPU. Trong NanoClaw, mỗi container có tài nguyên riêng. Agent nghiên cứu đang duyệt trang web nặng không làm chậm agent viết lách đang soạn tài liệu. Các container chạy đồng thời trên thread riêng, và quản lý tài nguyên host xử lý lập lịch.
Vấn đề thứ ba là phân vùng thông tin xác thực. Agent nghiên cứu cần truy cập web nhưng không nên có quyền ghi file. Agent quản lý file cần truy cập đĩa nhưng không nên có truy cập web. Trong framework tiến trình chung, thực thi ranh giới này đòi hỏi kiểm tra quyền cấp ứng dụng có thể bị vượt qua. Trong NanoClaw, ranh giới là container mount — agent nghiên cứu đúng nghĩa không thể ghi đĩa vì không có đường dẫn ghi được nào mount vào container.
Các Mô Hình Swarm Thực Tế
Các mô hình xuất hiện từ sử dụng thực tế thú vị hơn kiến trúc lý thuyết. Phổ biến nhất là mô hình nghiên cứu-và-tổng hợp: agent cha sinh 3-5 agent nghiên cứu để điều tra các khía cạnh khác nhau của câu hỏi song song, thu thập kết quả, và tạo câu trả lời tổng hợp kỹ lưỡng hơn bất kỳ agent đơn lẻ nào có thể tạo trong một lượt.
Mô hình phổ biến thứ hai là soạn-và-đánh giá. Agent viết bản nháp đầu tiên, rồi sinh agent đánh giá với hướng dẫn phê bình. Phản hồi của agent đánh giá quay lại agent gốc (hoặc agent soạn mới) để chỉnh sửa. Cách này tạo đầu ra tốt hơn đáng kể so với tạo một lượt, vì agent đánh giá có context window mới và có thể đánh giá bản nháp mà không mang gánh nặng nhận thức của việc đã viết nó.
Mô hình thứ ba là chuyên biệt hóa công cụ. Một số tác vụ đòi hỏi công cụ tốn kém hoặc rủi ro — duyệt web, thực thi lệnh shell, sửa đổi hệ thống file. Agent cha có thể ủy thác các thao tác này cho agent con với quyền truy cập công cụ cụ thể, giữ ngữ cảnh riêng sạch sẽ và quyền hạn riêng tối thiểu. Agent cha không bao giờ trực tiếp chạm hệ thống file hay mạng; nó chỉ xử lý kết quả agent con trả về.
Giới Hạn Của Swarm
Swarm không miễn phí. Mỗi agent con là một lệnh gọi Claude API riêng, nghĩa là chi phí token riêng. Swarm sinh năm agent nghiên cứu tốn gấp khoảng năm lần so với một agent làm toàn bộ nghiên cứu. Với câu hỏi đơn giản — "thời tiết thế nào?" hay "dịch câu này" — swarm là overhead thuần túy.
Độ trễ cũng tích lũy. Ngay cả với thực thi song song, agent cha phải đợi agent con chậm nhất hoàn thành trước khi tổng hợp kết quả. Swarm năm agent mà một agent mất 30 giây duyệt website chậm nghĩa là người dùng đợi 30 giây cộng thời gian tổng hợp, bất kể bốn agent kia nhanh thế nào.
NanoClaw xử lý điều này thực dụng. Claude quyết định khi nào dùng swarm dựa trên độ phức tạp tác vụ — câu hỏi đơn giản nhận câu trả lời trực tiếp, yêu cầu phức tạp nhiều phần được ủy thác. Người dùng không cấu hình hành vi swarm; họ chỉ hỏi, và hệ thống điều chỉnh cách tiếp cận phù hợp với độ phức tạp. Mục tiêu không phải dùng swarm mọi nơi — mà là dùng nơi chúng thực sự tạo kết quả tốt hơn agent đơn lẻ.
Tương lai đa agent không phải thay thế agent đơn lẻ. Mà là cho agent đơn lẻ khả năng gọi trợ giúp khi cần, theo cách an toàn, cách ly, và minh bạch. Mô hình container-cho-mỗi-agent của NanoClaw biến điều đó thành khả thi mà không phải đánh đổi bảo mật khi chạy nhiều agent trong môi trường chung.