Claude Code Sub-Agents vs Agent Teams: Chọn Cái Nào? (2026)

Trong Claude Code, agent teams tốn $7-8 mỗi task phức tạp, gấp 10 đến 80 lần so với một single session thông thường. Mình đã chứng kiến không ít developer chọn agent teams chỉ vì nghe “song song thật sự” thì ngầu hơn, rồi nhìn budget Claude Max bay hơi sau 3-4 task trong một buổi sáng. Sub-agents xử lý được phần lớn trường hợp với chi phí chỉ $1-3 mỗi task, và agent teams có những use case riêng mà không thể thay thế.
Bài này sẽ cho bạn một Multi-Agent Decision Matrix cụ thể: 3 câu hỏi để chọn đúng tool ngay lần đầu. Không phải lý thuyết, mà là cost ladder thực tế, câu chuyện từ người đã cháy 887.000 token/phút, và pattern hybrid để kết hợp cả hai khi cần.
TL;DR
- Sub-agents: 1 Claude session điều phối nhiều agent con, tốn $1-3/task phức tạp
- Agent teams: nhiều Claude session chạy song song độc lập, tốn $7-8/task
- Dùng sub-agents khi tasks có thứ tự phụ thuộc; agent teams khi cần true isolation
- SKILL.md của sub-agents có thể tái dùng làm agent team member definitions
- 3 câu hỏi trong Multi-Agent Decision Matrix giúp chọn đúng trong 30 giây
Sub-Agents vs Agent Teams Khác Nhau Như Thế Nào?
Sub-agents và agent teams trong sub-agents Claude Code đều cho phép chạy nhiều task song song, nhưng kiến trúc của chúng khác nhau căn bản.
Sub-agents chạy trong cùng một Claude Code session. Parent session đóng vai trò orchestrator: chia task, giao cho từng agent con, nhận kết quả về và tổng hợp. Các agent con dùng chung context window với parent, có thể đọc cùng một file, và giao tiếp qua shared state. Bạn định nghĩa sub-agent bằng file SKILL.md hoặc CLAUDE.md trong thư mục con.
Agent teams (hay còn gọi là agent team feature trong Claude Code, cần bật experimental flag CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1) là nhiều Claude Code instance chạy song song hoàn toàn độc lập. Mỗi thành viên trong team có context window riêng, không biết thành viên kia đang làm gì, và giao tiếp với nhau qua shared project context hoặc file system. Đây là “true parallelism” theo nghĩa thực sự.
| Sub-Agents | Agent Teams | |
|---|---|---|
| Kiến trúc | 1 session điều phối nhiều agent con | Nhiều session song song độc lập |
| Context window | Chia sẻ với parent session | Mỗi member có context riêng |
| Giao tiếp | Qua parent session state | Qua shared project / file system |
| Chi phí ước tính | $1-3/task phức tạp | $7-8/task phức tạp |
| Phiên bản yêu cầu | Bất kỳ | Cần bật experimental flag |
| Tốt nhất cho | Tasks có thứ tự, orchestration | True isolation, true parallel |
| Debug/rollback | Đơn giản (1 session) | Phức tạp (nhiều session, nhiều worktree) |
| Phù hợp khi | Tasks phụ thuộc nhau, budget < $3 | Tasks hoàn toàn độc lập, cần isolation |
Điểm mấu chốt: sub-agents vẫn bị giới hạn bởi context window của parent session. Khi parent session đầy context, tất cả agent con đều bị ảnh hưởng. Agent teams không có giới hạn này, nhưng cái giá phải trả là chi phí token tăng vọt.
Tại Sao Chi Phí Lại Chênh Lệch 10-80x?

Một 3-member agent team tiêu thụ khoảng 3-4 lần token so với single session làm cùng task. Con số này không phải ngẫu nhiên, mà đến từ cách hoạt động của mỗi session.
Mỗi Claude Code session phải load lại toàn bộ context từ đầu: project files, CLAUDE.md, lịch sử conversation, tool results. Khi 3 agent chạy song song, bạn đang trả chi phí context loading 3 lần. Thêm vào đó, các agent cần “báo cáo” qua lại với nhau thông qua shared files, mỗi lần read/write đều tốn token.
Điều quan trọng cần nhớ là chi phí thực tế còn phụ thuộc vào độ phức tạp của task. Một sub-agent làm refactoring nhỏ sẽ tốn ít hơn nhiều so với agent đọc toàn bộ codebase lớn.
| Phương thức | Chi phí ước tính | Token multiplier | Khi nào phù hợp |
|---|---|---|---|
| Single session | $0.10-$0.50/task | 1x (baseline) | Tasks đơn, tuyến tính |
| Sub-agents | $1-3/task | 2-6x | Tasks có thể chia nhỏ, vẫn có dependencies |
| Agent teams (3 members) | $7-8/task | 10-20x | True parallelism, isolated contexts |
Nếu bạn dùng Claude Pro plan, agent teams còn bị giới hạn thêm: ước tính chỉ 2-3 task/ngày trước khi chạm rate limit. Claude Max plan thoải mái hơn với khoảng 8-10 agent team task mỗi 5 giờ. Đây là lý do mình khuyến khích đánh giá kỹ trước khi bật tính năng này lên.
Khi Nào Nên Dùng Sub-Agents?
Sub-agents phù hợp nhất khi task của bạn có thể chia nhỏ thành các subtasks nhưng vẫn cần một orchestrator theo dõi toàn bộ flow. Đây là những gì mình gọi là Sub-Agent Sweet Spot.
Sub-Agent Sweet Spot xác định 3 tín hiệu để dùng sub-agents thay vì agent teams:
1. Sequential dependencies với parallelism cục bộ. Bạn cần chạy song song trong một giai đoạn, nhưng kết quả của giai đoạn đó phải xong trước khi giai đoạn tiếp theo bắt đầu. Ví dụ: viết 5 file cùng lúc (parallel), nhưng sau đó cần review và integrate (sequential). Sub-agent orchestrator xử lý việc này tốt hơn agent teams.
2. Shared context là lợi thế, không phải nhược điểm. Nếu các sub-task cần đọc cùng một file lớn, cùng một CLAUDE.md phức tạp, hoặc cần biết nhau đang làm gì, sub-agents tiết kiệm hơn vì context load một lần. Mô hình orchestration này đặc biệt hiệu quả khi các sub-tasks cần chia sẻ state và kết quả trung gian với nhau.
3. Budget dưới $3/task. Với Claude Code hooks và sub-agent definitions tốt, bạn có thể tự động hóa workflow phức tạp mà không cần đốt budget lên agent teams. Mình dùng sub-agents cho tasks như: generate test suite, refactor nhiều file cùng lúc, generate multiple documentation sections.
Một điểm cộng khác: sub-agents không cần bật experimental flag hay bất kỳ điều kiện phiên bản đặc biệt nào. Nếu bạn đang dùng phiên bản cũ hoặc đang cân nhắc có cài đặt Claude Code không, sub-agents là lựa chọn an toàn.
Khi Nào Nên Dùng Agent Teams?
Agent teams tỏa sáng trong một tình huống rất cụ thể: khi bạn cần nhiều Claude instance làm các task hoàn toàn độc lập nhau cùng lúc, và context isolation thực sự quan trọng.
Team Justification Threshold là 3 điều kiện phải thỏa mãn cùng lúc:
1. True parallelism không có dependencies. Các tasks không cần biết nhau. Ví dụ điển hình: 3 member team đang đồng thời viết frontend component A, backend API endpoint B, và documentation C. Không có gì trong C phụ thuộc vào A hay B cho đến khi cả 3 xong.
2. Context isolation là yêu cầu, không chỉ là nice-to-have. Khi bạn muốn mỗi agent có “fresh eyes” mà không bị ảnh hưởng bởi decision của agent kia, agent teams cho kết quả tốt hơn. Ví dụ: một agent viết implementation, một agent độc lập viết unit tests, một agent viết integration tests. Nếu test agent biết implementation detail, tests có thể vô tình bị bias.
Cách tiếp cận này phù hợp nhất cho các tình huống cần tính khách quan thực sự, khi bạn muốn từng agent đưa ra đánh giá độc lập mà không bị thiên kiến bởi công việc của agent khác.
3. Budget và plan cho phép. Agent teams yêu cầu bật biến môi trường CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 – xem tài liệu chính thức Claude Code của Anthropic. Anthropic khuyến nghị team size 3-5 members, mỗi member xử lý 5-6 tasks.
Framework Quyết Định 3 Chiều: Sub-Agents, Agent Teams, Hay Single Session?

Multi-Agent Decision Matrix giải quyết câu hỏi “dùng gì?” bằng 3 câu hỏi theo thứ tự:
| Câu hỏi | Trả lời “Không” | Trả lời “Có” → tiếp theo |
|---|---|---|
| 1. Task có thể chia thành ≥2 subtasks độc lập? | → Single session | → Câu 2 |
| 2. Các subtasks cần true context isolation? | → Sub-agents | → Câu 3 |
| 3. Budget và plan cho phép $7-8/task? | → Sub-agents | → Agent teams |
Đây là một số ví dụ thực tế để hiệu chỉnh matrix:
Single session: Viết một bài blog 2.000 từ, refactor một function, debug một lỗi cụ thể. Không cần multi-agent gì cả.
Sub-agents: Generate cả một test suite cho module (mỗi test file là một sub-task), viết docs cho 10 endpoint API cùng lúc, crawl và summarize 5 competitor pages song song. Orchestrator biết tất cả kết quả và tổng hợp.
Agent teams: Build fullstack feature với frontend/backend/test agents hoàn toàn độc lập; code review song song với 2 reviewers có “fresh eyes”; A/B test hai implementation approaches với 2 agents độc lập để tránh anchoring bias.
Ngoài ba lựa chọn trên, còn một option thứ tư ít được nhắc đến: Git worktrees. Với git worktree add, bạn có thể mở nhiều thư mục làm việc từ cùng một repo và chạy Claude Code trong từng thư mục. Chi phí? $0 extra ngoài token của từng session. Phù hợp khi cần parallel development nhưng không cần Claude tự điều phối. Kết hợp với chế độ /ultraplan của Claude Code để plan trước rồi execute song song là một pattern khá hiệu quả.
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1. Xem tài liệu Claude Code của Anthropic.
Có Thể Kết Hợp Sub-Agents Và Agent Teams Không?
Có. Sub-agent SKILL.md files có thể tái dùng trực tiếp làm agent team member definitions. Đây là pattern hybrid mình thấy ít người biết đến nhất.
Khi bạn định nghĩa sub-agent bằng SKILL.md hoặc một CLAUDE.md chuyên dụng, file đó chứa đầy đủ context về role, capabilities, và constraints của agent đó. Thay vì viết lại từ đầu cho agent team member, bạn có thể point agent team member config về cùng SKILL.md đó.
Workflow hybrid trông như thế này:
- Giai đoạn planning: Dùng sub-agents để phân tích task, chia nhỏ thành subtasks, xác định dependencies.
- Giai đoạn execution: Những subtasks không có dependencies với nhau chuyển sang agent teams. Những subtasks có dependencies tiếp tục dùng sub-agents.
- Giai đoạn integration: Một sub-agent orchestrator tổng hợp output từ cả hai loại.
Pattern này đặc biệt hữu ích khi bạn có một project lớn với mixed workload: một số phases cần true parallelism (dùng agent teams), một số phases cần coordination chặt chẽ (dùng sub-agents).
Điều quan trọng là SKILL.md files của bạn cần được viết đủ generic để hoạt động trong cả hai context. Tránh hard-code giả định rằng agent đang chạy trong parent session hay standalone session.
Khi thiết kế SKILL.md theo cách này, bạn thực sự đang xây dựng một thư viện agent tái sử dụng được. Mỗi file là một định nghĩa vai trò độc lập, dùng được trong cả orchestration lẫn parallel execution.
Làm Thế Nào Để Tránh Cháy Token Khi Dùng Parallel Agents?
Tháng 3 năm 2025, một developer chia sẻ trên cộng đồng Claude Code rằng anh ấy đã đốt 887.000 token mỗi phút sau khi vô tình spawn 49 sub-agents cùng lúc. Không phải typo, 49 agents. Budget Claude Max của anh chạm hard limit trong vòng vài phút.
Câu chuyện này minh họa một risk thực tế khi dùng parallel agents mà không có guardrails. Dưới đây là checklist phòng ngừa:
Trước khi chạy:
– Giới hạn số lượng agent rõ ràng trong prompt. Đừng để Claude tự quyết định số agent sẽ spawn.
– Dùng max_agents: N trong agent team config nếu available.
– Test với 2 agents trước khi scale lên 5.
Trong khi chạy:
– Monitor session bằng agent teams dashboard hoặc tmux sessions.
– Đặt timeout rõ ràng cho từng subtask. Một sub-agent hung mà không timeout sẽ chạy mãi.
– Log token usage thường xuyên, đặc biệt trong 5 phút đầu tiên.
Về kiến trúc:
– Chia task thành batches thay vì spawn tất cả cùng lúc. 5 agents × 3 batches thường an toàn hơn 15 agents cùng lúc.
– Với agent teams, Anthropic khuyến nghị max 5 members. Đừng vượt con số này khi chưa cần thiết.
– Nếu một task có thể xong trong single session dưới 10 phút, đừng multi-agent hóa nó.
Câu Hỏi Thường Gặp
Sub-agents và agent teams trong Claude Code khác nhau như thế nào?
Sub-agents chạy trong cùng một Claude Code session, với parent session đóng vai trò orchestrator. Agent teams là nhiều Claude Code session độc lập chạy song song. Sự khác biệt chính: sub-agents chia sẻ context window, agent teams có context window riêng biệt. Về chi phí: sub-agents tốn $1-3/task, agent teams tốn $7-8/task phức tạp.
Agent teams có tốn token nhiều hơn sub-agents không?
Có, rõ rệt. Một 3-member agent team tiêu thụ khoảng 3-4 lần token so với single session, vì mỗi session phải load context, tools, và project files độc lập. Sub-agents tiết kiệm hơn vì chỉ có một parent session load context chính, các agent con piggyback trên đó.
Cần phiên bản Claude Code nào để dùng agent teams?
Agent teams yêu cầu bật biến môi trường CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 trước khi khởi động Claude Code (tính đến tháng 4/2026) – xem tài liệu chính thức Anthropic để biết điều kiện hỗ trợ mới nhất. Sub-agents không có yêu cầu đặc biệt, hoạt động trên mọi phiên bản hiện tại.
Có thể dùng sub-agents và agent teams cùng nhau không?
Có, đây là hybrid approach mà mình đề xuất cho projects lớn. Dùng sub-agents cho planning và coordination, agent teams cho execution phases cần true parallelism. SKILL.md của sub-agents có thể tái sử dụng làm agent team member definitions, tiết kiệm công định nghĩa lại từ đầu.
Làm sao để bật agent teams trong Claude Code?
Set biến môi trường trước khi chạy Claude Code:
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
claude
Trên Windows, dùng $env:CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS="1" trong PowerShell. Sau khi bật, bạn có thể yêu cầu Claude “start an agent team” hoặc dùng lệnh /agent-team trong session.
Agent teams và Git worktrees khác nhau như thế nào?
Git worktrees cho phép chạy nhiều thư mục làm việc song song từ cùng một repo mà không tốn thêm chi phí Claude. Bạn phải tự quản lý, Claude không tự điều phối. Agent teams có Claude tự quản lý coordination, nhưng tốn $7-8/task. Với tasks mà bạn muốn parallel development nhưng không cần AI coordination, Git worktrees là lựa chọn kinh tế hơn.
Kết Luận
Multi-Agent Decision Matrix tóm gọn mọi thứ thành 3 câu hỏi: task có thể chia không, cần true isolation không, budget có đủ không. Nếu câu trả lời là Có-Có-Có, agent teams là lựa chọn đúng. Bất kỳ tổ hợp nào khác, sub-agents hoặc single session sẽ tiết kiệm hơn mà vẫn đạt kết quả tương đương.
Sub-Agent Sweet Spot cho phần lớn trường hợp: sequential dependencies, shared context hữu ích, và budget dưới $3/task. Team Justification Threshold cho 10% còn lại: true parallelism, context isolation quan trọng, và plan cho phép.
Trước khi spawn bất kỳ agent nào, hãy dành 30 giây chạy qua 3 câu hỏi trên. Bước đó có thể tiết kiệm cho bạn $5-7 mỗi task, và sau 50 task, đó là $250-350 tiết kiệm thực sự.
Đọc thêm về cách cài đặt và cấu hình từng loại: Sub-Agents trong Claude Code và Agent Teams trong Claude Code. Xem tổng hợp tất cả tính năng tại roadmap đầy đủ Claude Code 2026.
