Codex CLI Pricing 2026: Free Go Plus Pro + 6 Mẹo Tối Ưu
Codex CLI pricing 2026 có 6 tier: Free ($0), Go ($8), Plus ($20), Pro (từ $100/tháng với 2 option 5x và 20x), Business (pay-as-you-go), Enterprise/Edu (custom). Tool Codex CLI tự nó open-source Apache-2.0 tải free, chi phí thực phát sinh ở ChatGPT subscription dùng kèm. Mỗi tier có quota rate limit per 5-hour window khác nhau tuỳ model. Per official OpenAI Codex pricing verified 20/05/2026.
Lưu ý: OpenAI thay đổi pricing theo quý, recommend verify lại trang docs trước khi commit subscription dài hạn. Bài này dựa trên snapshot 20/05/2026 và 1 tháng dùng Plus thực tế trên ongboit production stack. Reader chưa dùng Codex CLI bao giờ nên đọc trước Codex CLI là gì và hướng dẫn cài đặt rồi quay lại bài này để pick tier phù hợp.
- Tool tải free qua npm/Homebrew (Apache-2.0). Cost thực ở ChatGPT subscription dùng kèm.
- 6 tier: Free $0, Go $8, Plus $20, Pro từ $100 (5x option) hoặc $200+ (20x option), Business + Enterprise pay-as-you-go.
- Sweet spot: Plus $20 cho solo dev daily, Pro 5x $100 cho heavy user multi-project, Pro 20x cho production team.
- Free tier: đủ thử nghiệm 1-2 giờ/ngày, không phù hợp daily workflow vì quota khắt khe.
- 6 mẹo tối ưu: parallel Claude advisor, model selection, prompt cache, context trim, batch task, off-peak. Tiết kiệm 30% cost đo ongboit.
- Pick Free nếu chỉ muốn thử Codex CLI 1-2 giờ/ngày, không production workload.
- Pick Go $8 nếu task ngắn 5-10 lần/ngày, không cần model premium.
- Pick Plus $20 nếu solo dev workflow daily, dùng cả ChatGPT Web + Codex CLI (sweet spot recommend).
- Pick Pro 5x $100 nếu heavy user multi-project, hoặc team nhỏ 2-3 dev share account (test ToS trước).
OpenAI hiện đang chạy promotional boost cho 2 tier (per official pricing page) sẽ kết thúc 31/05/2026:
- Pro 5x ($100/tháng): tạm thời nhận 2x multiplier trên 5x baseline = thực tế 10x Plus quota. Từ 01/06/2026 halve về 5x. Subscribe trong tháng 5 lock được rate ưu đãi 2 tháng đầu.
- Pro 20x ($200/tháng): tạm thời 25x Plus quota thay vì 20x standard. Từ 01/06/2026 về 20x. Long-time customer benefit.
Implication: nếu đang cân nhắc upgrade Pro tier, subscribe trước 31/05 để hưởng rate boost. Nếu pick Plus $20 thì không affect (Plus không có boost program).
Codex CLI Pricing 2026 Có Mấy Tier? Free Vs Plus Vs Pro Khác Nhau Ra Sao?
OpenAI hiện cung cấp 6 tier subscription, mỗi tier có quota Codex CLI riêng được tính theo number of message trong cửa sổ 5 giờ (rolling window, không reset 0h00):
| Tier | Giá/tháng | GPT-5.4 quota (5h window) | Phù hợp cho |
|---|---|---|---|
| Free | $0 | Limited (rate limit chặt) | Thử nghiệm 1-2 giờ/ngày |
| Go | $8 | Lightweight tasks | Casual user, task ngắn |
| Plus | $20 | 20-100 message | Solo dev daily (recommend) |
| Pro 5x | Từ $100 | 100-500 message | Heavy user, multi-project |
| Pro 20x | Từ $200 | 400-2,000 message | Production team, parallel workflow |
| Business | Pay-as-you-go | Match Plus limits + team seats | Team 5+ dev cần SSO, audit log |
| Enterprise / Edu | Custom | Priority + custom quota | Org >50 dev cần compliance |
Phân biệt Pro 5x vs Pro 20x: Pro 5x ($100/tháng) tăng quota 5 lần so với Plus, Pro 20x ($200/tháng trở lên) tăng 20 lần. Pro 20x cũng mở khoá model Spark (model tier cao nhất hiện tại). Detail config switch model qua profile trong file config xem ở Codex CLI config.toml deep dive.
Quota khác nhau theo model: model nhẹ (GPT-5.4-mini) tiêu thụ ít message credit hơn rõ rệt so với GPT-5.5 hoặc Spark. Plus tier có 60-350 message GPT-5.4-mini per 5h, gấp 3-4 lần quota GPT-5.4 full. Workflow tối ưu pattern: dùng mini cho boilerplate quick, switch sang full GPT-5.4 cho task reasoning sâu.
ChatGPT Subscription Có Bao Gồm Codex CLI Quota Riêng Không?
Không. Quota Codex CLI chia sẻ chung với quota ChatGPT Web/iOS của bạn. Nếu sáng dùng 30 message ChatGPT Web hỏi đáp, chiều dùng Codex CLI sẽ còn lại quota tương ứng trong cùng cửa sổ 5 giờ. Per OpenAI Codex CLI overview, mọi tier (Plus, Pro, Business, Edu, Enterprise) include Codex và share quota pool.
Trừ trường hợp tier Business + Enterprise mode pay-as-you-go: chuyển sang dùng API credit theo token (không phải message rolling window). Cost rate cụ thể:
| Model | Input ($/1M token) | Cached input ($/1M) | Output ($/1M) |
|---|---|---|---|
| GPT-5.5 | $125 | $12.50 | $750 |
| GPT-5.4 | $62.50 | $6.25 | $375 |
| GPT-5.4-mini | $18.75 | $1.88 | $113 |
Cached input rate rẻ hơn 10 lần so với fresh input, là lý do quan trọng để optimize context (Pattern #3 phần dưới). Output token đắt nhất, ngụ ý prompt nên rõ ràng để Codex trả lời gọn, không lan man.
Token Usage Codex CLI Cost Breakdown Thực Tế Ra Sao?
Mỗi tool call trong Codex CLI tốn token theo công thức: input tokens (prompt + context + tool description) + output tokens (model response + tool call args). Trên ongboit production (Plus $20/tháng), 1 tháng đo thực tế thấy phân bổ token:
- ~60% input token dành cho conversation history + system prompt + MCP tool descriptions (xem bài 7 MCP server setup để hiểu MCP token overhead)
- ~25% input token dành cho file content Codex đọc (vd
cat file.pytool call) - ~15% output token dành cho model response + tool call arguments
Average message Codex CLI trên ongboit (task daily mix) tốn ~5,000-15,000 token (input + output). Plus tier 20-100 message GPT-5.4 per 5h tương đương 100K-1.5M token mỗi cửa sổ. Một session debug bug phức tạp dễ đụng trần quota chỉ trong 2 giờ.
Credit-based pricing trên Business/Enterprise: dùng “credit” tương đương 1$ = 100 credit. Mỗi local task ~14 credit cho GPT-5.5, ~7 cho GPT-5.4, ~5 cho gpt-5.3-codex, ~2 cho GPT-5.4-mini. Cloud task ~25 credit. Code review ~25 credit per PR. Tính toán nhanh: $100 = 10,000 credit ~= 1,400 local task GPT-5.5 hoặc 5,000 task mini.

6 Cách Tối Ưu Cost Codex CLI Cho Dev Production Là Gì?
Sau 1 tháng tinh chỉnh trên ongboit (Next.js + WordPress + n8n), 6 pattern tối ưu cost ROI cao nhất, tiết kiệm khoảng 30% so với baseline không tối ưu:
Pattern 1: Parallel Claude advisor (dual-tool combo). Dùng Claude Code + Codex CLI song song: Claude làm advisor planning, Codex execute. Claude reasoning depth tốt hơn cho architecture (94% vs 82% accuracy), Codex tốc độ nhanh hơn cho execution. Combo $40/tháng ($20 Plus + $20 Claude Pro) tiết kiệm thời gian + cost so với chỉ dùng 1 tool, vì giảm số iteration sai → ít message wasted.
Pattern 2: Model selection theo task complexity. Profile rotation qua --profile flag:
# ~/.codex/config.toml , model selection profile
[profiles.cheap]
model = "gpt-5.4-mini" # task ngắn, boilerplate
model_reasoning_effort = "low"
[profiles.standard]
model = "gpt-5.4" # daily workflow (default)
model_reasoning_effort = "medium"
[profiles.deep]
model = "gpt-5.5" # architecture, debug phức tạp
model_reasoning_effort = "high"
Chạy codex --profile cheap cho task quick, switch --profile deep khi cần reasoning sâu. Trên ongboit thấy 60% task dùng được mini hoặc GPT-5.4 standard (tiết kiệm 3-5 lần token vs GPT-5.5).
Pattern 3: Dùng prompt cache hiệu quả. Cached input rate rẻ hơn fresh input 10 lần. Codex tự cache đoạn prompt lặp lại (system prompt, file context vừa đọc). Maximize cache hit bằng cách: giữ session liên tục (không exit + restart liên tục), reuse file context (Codex giữ cache file đã đọc trong session). Tránh /clear nếu không cần thiết.
Pattern 4: Context trim qua /compact. Conversation càng dài, prompt càng cồng kềnh. Sau 5-10 turn dùng /compact để Codex tóm tắt context, giảm input token mỗi turn sau. Đo trên ongboit: turn 20 không compact ~12K token input, sau compact giảm còn ~4K , tiết kiệm 65% input cost.
Pattern 5: Batch task qua exec mode. Thay vì interactive session 10 lần cho 10 task tương tự, batch qua codex exec "..." headless mode. Mỗi exec call có overhead startup nhưng không tích luỹ context history → input token thấp hơn. Phù hợp task automation qua Codex CLI cài VPS cho n8n trigger.
Pattern 6: Off-peak scheduling. OpenAI có thể throttle tier Plus vào peak hour (12-17h US East). Lên lịch heavy task vào early morning hoặc off-peak time, throughput cao hơn rõ. ongboit chạy 3 n8n workflow cron 4-6h sáng giờ VN (off-peak US), throughput cao hơn 30-40% so với chạy 14-17h giờ VN (peak US).
Sau 1 tháng tinh chỉnh cost Codex CLI Plus $20 trên ongboit production, 3 sharp edge load-bearing:
- Rate limit 5h window không reset 0h00. Một số dev assume reset đầu ngày, đặt cron heavy task 7h sáng VN, thực tế quota tích luỹ từ 2-3h sáng (lúc dùng session tối hôm trước), 7h chỉ còn 20-30% quota. Workaround: tracking quota qua
codex --statustrước khi run heavy task, hoặc spread workload đều thay vì burst. - Pro 5x vs Pro 20x không proportional cost vs quota. Pro 5x $100 tăng quota 5x so với Plus, Pro 20x $200+ tăng 20x. Pro 20x ROI tốt hơn nếu thực sự dùng >5x Plus daily, nhưng dev solo dễ overpay. Đo workload 2 tuần trên Plus trước, nếu thường xuyên đụng trần >3 lần/tuần thì upgrade Pro 5x, không đủ thì giữ Plus.
- Codex Cloud task tốn credit gấp 1.5-2x local task. Cloud task (qua web UI Codex Cloud) ~25 credit, local CLI ~5-14 credit cho cùng model. Workaround: dùng Codex Cloud chỉ khi cần mobile workflow (commute), main workflow giữ trên local CLI. Detail Codex Cloud mobile pattern trong bài Codex CLI là gì.
Quy tắc chung: Plus $20 là sweet spot 80% dev solo. Pro 5x $100 khi workload heavy 3+ lần đụng trần Plus/tuần. Pro 20x chỉ khi production team 2-3 dev share account. Track quota daily qua /status + áp dụng 6 pattern tối ưu trước khi upgrade tier.
Bài này dựa trên: (1) OpenAI Codex pricing docs chính thức tại developers.openai.com/codex/pricing truy cập 20/05/2026, (2) 1 tháng dùng Plus $20 trên ongboit production stack với 47 PR đo lường, (3) đối chiếu rate limit + credit cost qua testing thực tế.
Pricing volatile caveat: OpenAI có thể thay đổi pricing theo quý (April 2026 đã đổi từ per-message sang token-based). Số liệu trong bài là snapshot 20/05/2026, recommend verify official pricing page trước khi commit subscription dài hạn.
Để bạn tự kiểm tra lại các con số cost trong bài (47 PR, ~30% saved, 60% input token, p50 quota usage):
- Phạm vi đo: 47 PR merged trên ongboit.com production (Next.js 15.4 + WordPress 6.5 + n8n self-hosted), 18/04 đến 18/05/2026, 1 dev solo với subscription ChatGPT Plus $20/tháng.
- Cost saved 30%: so sánh thời gian + token usage trước vs sau khi áp dụng 6 pattern tối ưu (Pattern 1-6 trong H2 #4). Đo qua
/statuscommand lấy quota usage daily + log session duration. - Token distribution 60/25/15: phân tích raw transcript của 20 session sample, count input vs output token qua
codex --debuglog mode. - Credit rate per task: số liệu công bố bởi OpenAI tại developers.openai.com/codex/pricing, không phải mình đo, trích từ snapshot 20/05/2026.
- Giới hạn: n=47 PR là dữ liệu 1 dev solo, 1 stack, 1 tier Plus. Pro tier hoặc Business mode credit-based có pattern usage khác. Không đo: Spark model premium, Pro 20x heavy workload, multi-user share account.
Subscription cost public + token usage log không công khai chi tiết (privacy), nhưng pattern + methodology có thể tái thực hiện trên subscription của bạn để verify.

Combo 6 pattern trên ăn nhập với hệ sinh thái Codex CLI power-user khác trong cluster:
- Skill reusable: dùng SKILL.md custom slash command để encapsulate prompt template hay dùng, giảm token re-explain.
- Hook auto-validate: 8 lifecycle hook event (PreCompact + PostCompact mới v0.129) giúp save state trước compact, tránh waste context.
- /goal Ralph Loop: long-running task qua /goal command với 6-element structure spec giảm 60-70% time-to-completion vs prompt loose.
Free Tier Limit + Cách Stretch Quota Tối Đa Như Thế Nào?
Free tier ChatGPT có quota Codex CLI nhưng rate limit khắt khe (chính thức không công bố con số cụ thể, ước tính ~10-20 message GPT-5.4-mini per 5h window). Đủ thử nghiệm 1-2 giờ/ngày cho dev mới làm quen, không phù hợp daily workflow.
5 mẹo stretch Free tier:
- Default model là
gpt-5.4-minitrong~/.codex/config.tomlđể tiết kiệm credit per call. - Tránh dùng MCP nhiều server vì mỗi server tăng prompt size 200-300 token. Free tier nên chỉ cài Filesystem MCP.
- Disable
/goalexperimental trongfeatures.goals = false, vì goal context tăng 200-500 token mỗi turn. - Compact thường xuyên sau mỗi 3-4 turn để giảm history overhead.
- Batch task qua
codex exec "..."one-shot mode khi không cần interactive session, vì exec mode không tích luỹ history.
Khi quota Free hết, nâng cấp Go $8 là bước hợp lý nếu chưa sẵn sàng Plus $20. Go đủ cho casual user task 30-50 message/tuần. Trên 50 message thì Plus $20 ROI tốt hơn rõ.
Codex CLI Cost Vs Claude Code Pro: Nên Pick Cái Nào?
Câu hỏi quan trọng nhất cho dev solo có budget $20-40/tháng. So sánh head-to-head:
- Codex CLI Plus $20: share quota với ChatGPT Web, model GPT-5.4 default, quota 20-100 GPT-5.4 message per 5h.
- Claude Code Pro $20: quota riêng tách biệt ChatGPT, model Sonnet 4.6 default, accuracy task architecture cao hơn (94% vs 82% trên ongboit test).
- Dual-tool combo $40: cả 2, tiết kiệm 4 giờ/tuần workflow + tăng resilience 2-3 lần khi 1 bên stuck (đo ongboit 47 PR).
Sweet spot recommend dev VN: Plus $20 nếu đang dùng ChatGPT Web nhiều (share quota), Claude Pro $20 nếu task chính là architecture/refactor sâu. Production stack $40 combo. Detail full comparison head-to-head và Claude Code Pro vs Max pricing + Claude Code vs Codex CLI feature comparison.
Codex CLI Là Gì? Hướng Dẫn Toàn Diện Cho Developer 2026 – Đã hiểu pricing + tối ưu cost? Quay lại pillar tổng quan để xem lại lộ trình master 9 bài Codex CLI cluster.
Câu Hỏi Thường Gặp
Free tier Codex CLI có rate limit khắt khe không?
Khá khắt khe. OpenAI không công bố con số cụ thể nhưng ước tính ~10-20 message GPT-5.4-mini per 5-hour window cho Free tier. Đủ thử nghiệm 1-2 giờ/ngày, không phù hợp daily workflow. Khi đụng trần phải đợi tới 5 giờ sau hoặc upgrade. Recommend Plus $20 cho dev solo daily, hoặc Go $8 nếu chỉ task casual ngắn 30-50 message/tuần.
Pro 5x vs Pro 20x khác nhau ra sao?
Pro 5x $100/tháng tăng quota 5 lần so với Plus (100-500 message GPT-5.4 per 5h vs Plus 20-100). Pro 20x $200+ tăng 20 lần và mở khoá model Spark (tier cao nhất). Pro 20x ROI tốt nếu workload thực sự >5x Plus daily, không đụng trần thường xuyên trên Plus thì không cần upgrade. Đo workload 2 tuần trên Plus trước khi quyết định, nếu đụng trần >3 lần/tuần upgrade Pro 5x, đụng trần Pro 5x mới đến Pro 20x.
Codex CLI có refund subscription không nếu không dùng đủ?
OpenAI có policy refund 7 ngày cho subscription mới (xem help.openai.com verified). Sau 7 ngày refund khó hơn, phải case-by-case qua support. Recommend: dùng Free tier hoặc Go $8 thử 1-2 tuần trước, chỉ upgrade Plus/Pro khi workflow đã ổn định, tránh refund cycle phức tạp.
Thanh toán Codex CLI từ Việt Nam dùng thẻ nào?
ChatGPT Plus + Pro chấp nhận Visa/Mastercard quốc tế phát hành tại VN (TPBank, Sacombank, Techcombank, Vietcombank, MB Bank đều work). Paypal cũng accept. OpenAI hiện không block IP Việt Nam, không cần VPN. Nếu thẻ bị reject, thử trên trình duyệt Incognito để loại trừ cache cookie, hoặc dùng thẻ ngân hàng khác (TPBank EVO có tỉ lệ approve cao nhất theo experience ongboit). Detail thanh toán có trong bài cài đặt Codex CLI.
Go $8 plan có đáng cho dev solo casual không?
Đáng nếu workflow rất nhẹ (task 5-10 lần/ngày, không heavy debug, không multi-project). Go $8 cho lightweight coding task per OpenAI docs, ước tính tương đương 2-3x Free tier. Nếu task production daily hoặc cần model GPT-5.4 thường xuyên thì Plus $20 ROI tốt hơn. Pattern recommend: thử Free 1 tuần đầu, upgrade Go $8 nếu đụng trần Free nhưng chưa cần Plus. Nếu workflow lên 30+ message/ngày thì skip thẳng Plus.
