Claude Code Sub-Agents vs Agent Teams: Chọn Cái Nào? (2026)

Sub-Agents vs Agent Teams: two stick figures at a fork in the road with cost labels $1-3 and $7-8, decision signpost, parchment sketch style
Sub-agents và agent teams: hai tool khác nhau căn bản về kiến trúc và chi phí, không phải hai phiên bản của cùng một thứ. Xem thêm Agent View dashboard quản lý multi-sessionManaged Agents hosted runtime để hiểu hệ sinh thái multi-agent của Anthropic

Trong Claude Code, agent teams tốn $7-8 mỗi task phức tạp, gấp 10 đến 80 lần so với một single session thông thường. Mình đã chứng kiến không ít developer chọn agent teams chỉ vì nghe “song song thật sự” thì ngầu hơn, rồi nhìn budget Claude Max bay hơi sau 3-4 task trong một buổi sáng. Sub-agents xử lý được phần lớn trường hợp với chi phí chỉ $1-3 mỗi task, và agent teams có những use case riêng mà không thể thay thế.

Bài này sẽ cho bạn một Multi-Agent Decision Matrix cụ thể: 3 câu hỏi để chọn đúng tool ngay lần đầu. Không phải lý thuyết, mà là cost ladder thực tế, câu chuyện từ người đã cháy 887.000 token/phút, và pattern hybrid để kết hợp cả hai khi cần.

TL;DR

  • Sub-agents: 1 Claude session điều phối nhiều agent con, tốn $1-3/task phức tạp
  • Agent teams: nhiều Claude session chạy song song độc lập, tốn $7-8/task
  • Dùng sub-agents khi tasks có thứ tự phụ thuộc; agent teams khi cần true isolation
  • SKILL. session trong AI giải thích đầy đủ.md của sub-agents có thể tái dùng làm agent team member definitions
  • 3 câu hỏi trong Multi-Agent Decision Matrix giúp chọn đúng trong 30 giây
$7-8
chi phí/task với agent teams
3-4x
token tiêu thụ so với single session
887k
token/phút trong disaster case với 49 sub-agents

Sub-Agents vs Agent Teams Khác Nhau Như Thế Nào?

Sub-agents và agent teams trong sub-agents Claude Code đều cho phép chạy nhiều task song song, nhưng kiến trúc của chúng khác nhau căn bản.

Sub-agents chạy trong cùng một Claude Code session. Parent session đóng vai trò orchestrator: chia task, giao cho từng agent con, nhận kết quả về và tổng hợp. Các agent con dùng chung context window với parent, có thể đọc cùng một file, và giao tiếp qua shared state. Bạn định nghĩa sub-agent bằng file SKILL.md hoặc CLAUDE.md trong thư mục con.

Agent teams (hay còn gọi là agent team feature trong Claude Code, cần bật experimental flag CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1) là nhiều Claude Code instance chạy song song hoàn toàn độc lập. Mỗi thành viên trong team có context window riêng, không biết thành viên kia đang làm gì, và giao tiếp với nhau qua shared project context hoặc file system. Đây là “true parallelism” theo nghĩa thực sự.

Sub-AgentsAgent Teams
Kiến trúc1 session điều phối nhiều agent conNhiều session song song độc lập
Context windowChia sẻ với parent sessionMỗi member có context riêng
Giao tiếpQua parent session stateQua shared project / file system
Chi phí ước tính$1-3/task phức tạp$7-8/task phức tạp
Phiên bản yêu cầuBất kỳCần bật experimental flag
Tốt nhất choTasks có thứ tự, orchestrationTrue isolation, true parallel
Debug/rollbackĐơn giản (1 session)Phức tạp (nhiều session, nhiều worktree)
Phù hợp khiTasks phụ thuộc nhau, budget < $3Tasks hoàn toàn độc lập, cần isolation

Điểm mấu chốt: sub-agents vẫn bị giới hạn bởi context window của parent session. Khi parent session đầy context, tất cả agent con đều bị ảnh hưởng. Agent teams không có giới hạn này, nhưng cái giá phải trả là chi phí token tăng vọt.

Tại Sao Chi Phí Lại Chênh Lệch 10-80x?

Multi-Agent Cost Ladder: horizontal bar chart showing Single Session $0.10-0.50, Sub-Agents $1-3, Agent Teams $7-8 per task
Cost ladder thực tế: từ single session $0.10 đến agent teams $7-8, chênh lệch 10-80x tùy độ phức tạp của task

Một 3-member agent team tiêu thụ khoảng 3-4 lần token so với single session làm cùng task. Con số này không phải ngẫu nhiên, mà đến từ cách hoạt động của mỗi session.

Mỗi Claude Code session phải load lại toàn bộ context từ đầu: project files, CLAUDE.md, lịch sử conversation, tool results. Khi 3 agent chạy song song, bạn đang trả chi phí context loading 3 lần. Thêm vào đó, các agent cần “báo cáo” qua lại với nhau thông qua shared files, mỗi lần read/write đều tốn token.

Điều quan trọng cần nhớ là chi phí thực tế còn phụ thuộc vào độ phức tạp của task. Một sub-agent làm refactoring nhỏ sẽ tốn ít hơn nhiều so với agent đọc toàn bộ codebase lớn.

Phương thứcChi phí ước tínhToken multiplierKhi nào phù hợp
Single session$0.10-$0.50/task1x (baseline)Tasks đơn, tuyến tính
Sub-agents$1-3/task2-6xTasks có thể chia nhỏ, vẫn có dependencies
Agent teams (3 members)$7-8/task10-20xTrue parallelism, isolated contexts
Source: Chi phí thực tế từ Turing CollegeMindStudio: 3-teammate agent team dùng ~3-4x token so với single session. Với Claude Max plan, mỗi complex task tốn $7-8.

Nếu bạn dùng Claude Pro plan, agent teams còn bị giới hạn thêm: ước tính chỉ 2-3 task/ngày trước khi chạm rate limit. Claude Max plan thoải mái hơn với khoảng 8-10 agent team task mỗi 5 giờ. Đây là lý do mình khuyến khích đánh giá kỹ trước khi bật tính năng này lên.

Khi Nào Nên Dùng Sub-Agents?

Sub-agents phù hợp nhất khi task của bạn có thể chia nhỏ thành các subtasks nhưng vẫn cần một orchestrator theo dõi toàn bộ flow. Đây là những gì mình gọi là Sub-Agent Sweet Spot.

Sub-Agent Sweet Spot xác định 3 tín hiệu để dùng sub-agents thay vì agent teams:

1. Sequential dependencies với parallelism cục bộ. Bạn cần chạy song song trong một giai đoạn, nhưng kết quả của giai đoạn đó phải xong trước khi giai đoạn tiếp theo bắt đầu. Ví dụ: viết 5 file cùng lúc (parallel), nhưng sau đó cần review và integrate (sequential). Sub-agent orchestrator xử lý việc này tốt hơn agent teams.

2. Shared context là lợi thế, không phải nhược điểm. Nếu các sub-task cần đọc cùng một file lớn, cùng một CLAUDE.md phức tạp, hoặc cần biết nhau đang làm gì, sub-agents tiết kiệm hơn vì context load một lần. Mô hình orchestration này đặc biệt hiệu quả khi các sub-tasks cần chia sẻ state và kết quả trung gian với nhau.

3. Budget dưới $3/task. Với Claude Code hooks và sub-agent definitions tốt, bạn có thể tự động hóa workflow phức tạp mà không cần đốt budget lên agent teams. Mình dùng sub-agents cho tasks như: generate test suite, refactor nhiều file cùng lúc, generate multiple documentation sections.

Một điểm cộng khác: sub-agents không cần bật experimental flag hay bất kỳ điều kiện phiên bản đặc biệt nào. Nếu bạn đang dùng phiên bản cũ hoặc đang cân nhắc có cài đặt Claude Code không, sub-agents là lựa chọn an toàn.

Khi Nào Nên Dùng Agent Teams?

Agent teams tỏa sáng trong một tình huống rất cụ thể: khi bạn cần nhiều Claude instance làm các task hoàn toàn độc lập nhau cùng lúc, và context isolation thực sự quan trọng.

Team Justification Threshold là 3 điều kiện phải thỏa mãn cùng lúc:

1. True parallelism không có dependencies. Các tasks không cần biết nhau. Ví dụ điển hình: 3 member team đang đồng thời viết frontend component A, backend API endpoint B, và documentation C. Không có gì trong C phụ thuộc vào A hay B cho đến khi cả 3 xong.

2. Context isolation là yêu cầu, không chỉ là nice-to-have. Khi bạn muốn mỗi agent có “fresh eyes” mà không bị ảnh hưởng bởi decision của agent kia, agent teams cho kết quả tốt hơn. Ví dụ: một agent viết implementation, một agent độc lập viết unit tests, một agent viết integration tests. Nếu test agent biết implementation detail, tests có thể vô tình bị bias.

Cách tiếp cận này phù hợp nhất cho các tình huống cần tính khách quan thực sự, khi bạn muốn từng agent đưa ra đánh giá độc lập mà không bị thiên kiến bởi công việc của agent khác.

3. Budget và plan cho phép. Agent teams yêu cầu bật biến môi trường CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 – xem tài liệu chính thức Claude Code của Anthropic. Anthropic khuyến nghị team size 3-5 members, mỗi member xử lý 5-6 tasks.

Warning: Nếu chỉ 2 trong 3 điều kiện trên được thỏa mãn, quay lại dùng sub-agents. Chi phí tăng thêm $4-6/task thường không justify với những trường hợp borderline.

Framework Quyết Định 3 Chiều: Sub-Agents, Agent Teams, Hay Single Session?

Multi-Agent Decision Matrix: 3 questions flowchart leading to Single Session, Sub-Agents, or Agent Teams based on task complexity and budget
Multi-Agent Decision Matrix: 3 câu hỏi theo thứ tự giúp chọn đúng tool trong 30 giây

Multi-Agent Decision Matrix giải quyết câu hỏi “dùng gì?” bằng 3 câu hỏi theo thứ tự:

Câu hỏiTrả lời “Không”Trả lời “Có” → tiếp theo
1. Task có thể chia thành ≥2 subtasks độc lập?→ Single session→ Câu 2
2. Các subtasks cần true context isolation?→ Sub-agents→ Câu 3
3. Budget và plan cho phép $7-8/task?→ Sub-agents→ Agent teams

Đây là một số ví dụ thực tế để hiệu chỉnh matrix:

Single session: Viết một bài blog 2.000 từ, refactor một function, debug một lỗi cụ thể. Không cần multi-agent gì cả.

Sub-agents: Generate cả một test suite cho module (mỗi test file là một sub-task), viết docs cho 10 endpoint API cùng lúc, crawl và summarize 5 competitor pages song song. Orchestrator biết tất cả kết quả và tổng hợp.

Agent teams: Build fullstack feature với frontend/backend/test agents hoàn toàn độc lập; code review song song với 2 reviewers có “fresh eyes”; A/B test hai implementation approaches với 2 agents độc lập để tránh anchoring bias.

Ngoài ba lựa chọn trên, còn một option thứ tư ít được nhắc đến: Git worktrees. Với git worktree add, bạn có thể mở nhiều thư mục làm việc từ cùng một repo và chạy Claude Code trong từng thư mục. Chi phí? $0 extra ngoài token của từng session. Phù hợp khi cần parallel development nhưng không cần Claude tự điều phối. Kết hợp với chế độ /ultraplan của Claude Code để plan trước rồi execute song song là một pattern khá hiệu quả.

Source: Anthropic khuyến nghị team size 3-5 members, mỗi member đảm nhận 5-6 tasks. Enable qua CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1. Xem tài liệu Claude Code của Anthropic.

Có Thể Kết Hợp Sub-Agents Và Agent Teams Không?

Có. Sub-agent SKILL.md files có thể tái dùng trực tiếp làm agent team member definitions. Đây là pattern hybrid mình thấy ít người biết đến nhất.

Khi bạn định nghĩa sub-agent bằng SKILL.md hoặc một CLAUDE.md chuyên dụng, file đó chứa đầy đủ context về role, capabilities, và constraints của agent đó. Thay vì viết lại từ đầu cho agent team member, bạn có thể point agent team member config về cùng SKILL.md đó.

Workflow hybrid trông như thế này:

  1. Giai đoạn planning: Dùng sub-agents để phân tích task, chia nhỏ thành subtasks, xác định dependencies.
  2. Giai đoạn execution: Những subtasks không có dependencies với nhau chuyển sang agent teams. Những subtasks có dependencies tiếp tục dùng sub-agents.
  3. Giai đoạn integration: Một sub-agent orchestrator tổng hợp output từ cả hai loại.

Pattern này đặc biệt hữu ích khi bạn có một project lớn với mixed workload: một số phases cần true parallelism (dùng agent teams), một số phases cần coordination chặt chẽ (dùng sub-agents).

Điều quan trọng là SKILL.md files của bạn cần được viết đủ generic để hoạt động trong cả hai context. Tránh hard-code giả định rằng agent đang chạy trong parent session hay standalone session.

Khi thiết kế SKILL.md theo cách này, bạn thực sự đang xây dựng một thư viện agent tái sử dụng được. Mỗi file là một định nghĩa vai trò độc lập, dùng được trong cả orchestration lẫn parallel execution.

Làm Thế Nào Để Tránh Cháy Token Khi Dùng Parallel Agents?

Tháng 3 năm 2025, một developer chia sẻ trên cộng đồng Claude Code rằng anh ấy đã đốt 887.000 token mỗi phút sau khi vô tình spawn 49 sub-agents cùng lúc. Không phải typo, 49 agents. Budget Claude Max của anh chạm hard limit trong vòng vài phút.

Câu chuyện này minh họa một risk thực tế khi dùng parallel agents mà không có guardrails. Dưới đây là checklist phòng ngừa:

Trước khi chạy: – Giới hạn số lượng agent rõ ràng trong prompt. Đừng để Claude tự quyết định số agent sẽ spawn. – Dùng max_agents: N trong agent team config nếu available. – Test với 2 agents trước khi scale lên 5.

Trong khi chạy: – Monitor session bằng agent teams dashboard hoặc tmux sessions. – Đặt timeout rõ ràng cho từng subtask. Một sub-agent hung mà không timeout sẽ chạy mãi. – Log token usage thường xuyên, đặc biệt trong 5 phút đầu tiên.

Về kiến trúc: – Chia task thành batches thay vì spawn tất cả cùng lúc. 5 agents × 3 batches thường an toàn hơn 15 agents cùng lúc. – Với agent teams, Anthropic khuyến nghị max 5 members. Đừng vượt con số này khi chưa cần thiết. – Nếu một task có thể xong trong single session dưới 10 phút, đừng multi-agent hóa nó.

Source: Case study: developer cháy 887k token/phút với 49 sub-agents. Xem AICosts.ai. Tier 2, CRAAP 3/5. Dùng như cautionary tale, không dùng làm benchmark chính thức.

Cả Hai Pattern Liên Kết Với Phần Còn Lại Của Ecosystem Năm 2026 Ra Sao?

Phần này giúp dev hiểu rõ vị trí của 2 pattern phân chia task trong toàn bộ hệ sinh thái Claude Code năm 2026. Hiểu được mối liên kết giữa các thành phần giúp team chọn đúng pattern cho từng tình huống cụ thể, tránh việc dùng nhầm pattern gây lãng phí token API và thời gian xử lý.

Đối với người mới làm quen với khái niệm phân chia task, nên đọc kỹ tài liệu nền tảng về Claude Code skills trước khi đi sâu vào việc chọn pattern cụ thể. Skill là đơn vị nhỏ nhất có thể được gọi từ cả pattern sub-agents và pattern agent teams. Hiểu rõ cách skill hoạt động giúp team thiết kế các sub-agent hiệu quả hơn, mỗi sub-agent chỉ gọi các skill cần thiết cho công việc cụ thể của mình. Pattern khôn ngoan là xây dựng skill library nhỏ gọn và tập trung, sau đó kết hợp chúng theo nhiều cách khác nhau tùy theo nhu cầu của từng task tổng thể.

Khi cần chạy các pattern theo schedule định kỳ, kết hợp với Claude Code Routines là cách tối ưu nhất. Cấu hình routine kích hoạt pattern agent teams vào rạng sáng mỗi ngày để xử lý các task phức tạp khi system rảnh rỗi. Cách làm này tận dụng được off-peak hour của API và đảm bảo kết quả sẵn sàng khi team bắt đầu ngày làm việc mới. Đặc biệt phù hợp với các task analysis dữ liệu lớn hoặc tổng hợp báo cáo định kỳ không yêu cầu phản hồi tức thời.

Đối với các task cần lặp lại nhiều lần đến khi đạt kết quả mong muốn, pattern sub-agents kết hợp tốt với /loop command trong Claude Code. Mô hình điển hình là loop chính kích hoạt nhiều sub-agent song song trong mỗi iteration, tổng hợp kết quả của tất cả sub-agent trước khi quyết định có lặp lại hay không. Pattern này đặc biệt mạnh cho các task optimization cần thử nhiều variant khác nhau, ví dụ tối ưu hóa nội dung bài viết cho SEO bằng cách thử nhiều phong cách viết khác nhau song song trong cùng một loop.

Đối với các pipeline research phức tạp cần truy cập nhiều nguồn dữ liệu khác nhau, kết hợp pattern sub-agents với AutoResearch loop tạo ra kiến trúc cực kỳ mạnh mẽ. Mỗi sub-agent phụ trách research một sub-topic cụ thể, kết quả tổng hợp được research loop chính sử dụng để quyết định hướng research tiếp theo. Kết hợp với MCP (Model Context Protocol) cho phép các sub-agent truy cập dữ liệu nội bộ của doanh nghiệp một cách an toàn, không qua các API công khai có thể bị nghe lén.

Khi Chọn Pattern Cho Team VN Cần Cân Nhắc Yếu Tố Nào

Phần này tổng hợp 3 yếu tố quan trọng nhất khi team product tại VN cần chọn giữa 2 pattern phân chia task. Mỗi yếu tố đều rút ra từ kinh nghiệm thực chiến của nhiều dự án đã triển khai trong 6 tháng đầu năm 2026, đáng được cân nhắc kỹ trước khi commit một pattern cụ thể cho dự án dài hạn.

Yếu tố đầu tiên là về budget IT của doanh nghiệp. Pattern agent teams có chi phí cao hơn nhiều so với pattern sub-agents đơn giản, đôi khi gấp 10-80 lần tùy theo độ phức tạp của task. Đối với startup có budget hạn chế, pattern sub-agents đơn giản thường phù hợp hơn vì cho phép kiểm soát chi phí dễ dàng. Đối với doanh nghiệp lớn có budget dồi dào và yêu cầu chất lượng kết quả cao, pattern agent teams là lựa chọn tốt hơn vì cho ra kết quả chi tiết và toàn diện hơn. Đầu tư 20 phút phân tích budget thực tế của dự án trước khi chọn pattern giúp tránh tình trạng phải đổi pattern giữa chừng do chi phí vượt dự kiến.

Yếu tố thứ hai là về response time cho end-user. Pattern sub-agents đơn giản cho ra kết quả nhanh hơn nhiều so với pattern agent teams vì không cần coordination giữa nhiều agent. Nếu sản phẩm có yêu cầu phản hồi trong vòng vài giây như chatbot hỗ trợ khách hàng real-time, pattern sub-agents đơn giản là lựa chọn duy nhất khả thi. Nếu sản phẩm là báo cáo phân tích chuyên sâu không yêu cầu phản hồi tức thời, pattern agent teams có thể cho ra kết quả chất lượng cao hơn dù mất nhiều thời gian hơn. Phân tích kỹ yêu cầu response time của từng loại task giúp chọn pattern phù hợp ngay từ đầu thiết kế hệ thống.

Yếu tố cuối cùng là về độ phức tạp của task cần xử lý. Pattern sub-agents đơn giản phù hợp với các task có thể chia nhỏ một cách rõ ràng theo từng bước tuần tự, ví dụ tóm tắt nội dung của 3 bài viết khác nhau. Pattern agent teams phù hợp với các task có nhiều khía cạnh cần phân tích đồng thời và yêu cầu coordination giữa các kết quả phân tích khác nhau, ví dụ đánh giá toàn diện một chiến dịch quảng cáo từ nhiều góc độ kinh doanh khác nhau. Đầu tư 10-15 phút phân tích bản chất của task trước khi chọn pattern giúp đảm bảo lựa chọn đúng đắn cho dự án.

Câu Hỏi Thường Gặp

Sub-agents và agent teams trong Claude Code khác nhau như thế nào?

Sub-agents chạy trong cùng một Claude Code session, với parent session đóng vai trò orchestrator. Agent teams là nhiều Claude Code session độc lập chạy song song. Sự khác biệt chính: sub-agents chia sẻ context window, agent teams có context window riêng biệt. Về chi phí: sub-agents tốn $1-3/task, agent teams tốn $7-8/task phức tạp.

Agent teams có tốn token nhiều hơn sub-agents không?

Có, rõ rệt. Một 3-member agent team tiêu thụ khoảng 3-4 lần token so với single session, vì mỗi session phải load context, tools, và project files độc lập. Sub-agents tiết kiệm hơn vì chỉ có một parent session load context chính, các agent con piggyback trên đó.

Cần phiên bản Claude Code nào để dùng agent teams?

Agent teams yêu cầu bật biến môi trường CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 trước khi khởi động Claude Code (tính đến tháng 4/2026) – xem tài liệu chính thức Anthropic để biết điều kiện hỗ trợ mới nhất. Sub-agents không có yêu cầu đặc biệt, hoạt động trên mọi phiên bản hiện tại.

Có thể dùng sub-agents và agent teams cùng nhau không?

Có, đây là hybrid approach mà mình đề xuất cho projects lớn. Dùng sub-agents cho planning và coordination, agent teams cho execution phases cần true parallelism. SKILL.md của sub-agents có thể tái sử dụng làm agent team member definitions, tiết kiệm công định nghĩa lại từ đầu.

Làm sao để bật agent teams trong Claude Code?

Set biến môi trường trước khi chạy Claude Code:

export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
claude

Trên Windows, dùng $env:CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS="1" trong PowerShell. Sau khi bật, bạn có thể yêu cầu Claude “start an agent team” hoặc dùng lệnh /agent-team trong session.

Agent teams và Git worktrees khác nhau như thế nào?

Git worktrees cho phép chạy nhiều thư mục làm việc song song từ cùng một repo mà không tốn thêm chi phí Claude. Bạn phải tự quản lý, Claude không tự điều phối. Agent teams có Claude tự quản lý coordination, nhưng tốn $7-8/task. Với tasks mà bạn muốn parallel development nhưng không cần AI coordination, Git worktrees là lựa chọn kinh tế hơn.

Kết Luận

Multi-Agent Decision Matrix tóm gọn mọi thứ thành 3 câu hỏi: task có thể chia không, cần true isolation không, budget có đủ không. Nếu câu trả lời là Có-Có-Có, agent teams là lựa chọn đúng. Bất kỳ tổ hợp nào khác, sub-agents hoặc single session sẽ tiết kiệm hơn mà vẫn đạt kết quả tương đương.

Sub-Agent Sweet Spot cho phần lớn trường hợp: sequential dependencies, shared context hữu ích, và budget dưới $3/task. Team Justification Threshold cho 10% còn lại: true parallelism, context isolation quan trọng, và plan cho phép.

Trước khi spawn bất kỳ agent nào, hãy dành 30 giây chạy qua 3 câu hỏi trên. Bước đó có thể tiết kiệm cho bạn $5-7 mỗi task, và sau 50 task, đó là $250-350 tiết kiệm thực sự.

Đọc thêm về cách cài đặt và cấu hình từng loại: Sub-Agents trong Claude CodeAgent Teams trong Claude Code. Xem tổng hợp tất cả tính năng tại roadmap đầy đủ Claude Code 2026.

Similar Posts