Tiết Kiệm Token Claude Code: 15 Mẹo Hiệu Quả Nhất 2026

Q: Context rot ảnh hưởng thực tế như thế nào?

Context rot là hiện tượng Claude hoạt động kém dần khi session dài. Khi session càng dài, độ sâu suy luận của model giảm dần: Claude bắt đầu edit file mà không đọc kỹ trước, và đề xuất trái ngược những gì đã thống nhất.

Q: Tại sao 120K token là ngưỡng quan trọng?

120K tokens tương đương 12% của 1M context window, nhưng đây là phạm vi prime time khi CLAUDE.md còn mới và attention model tập trung nhất. Context càng lớn thì độ chính xác truy hồi chi tiết càng giảm. 1M context window không đồng nghĩa output tốt hơn, chỉ có nhiều chỗ hơn cho context rot phát triển.

Q: Session chaining có làm gián đoạn workflow không?

Không, nếu bạn thiết kế đúng. Mỗi session output ra một file, session sau load file đó. Claude không cần nhớ conversation trước, chỉ cần đọc file output. Giống dây chuyền lắp ráp: mỗi trạm nhận input từ trạm trước, làm việc của mình, truyền output cho trạm sau.

Q: Dùng Max plan hay API rẻ hơn?

Nếu bạn dùng dưới $100/tháng qua API thì API rẻ hơn. Trên $100 thì Max 5x ($100/tháng) lợi hơn vì usage gần như không giới hạn. Max 20x ($200/tháng) phù hợp khi cần Opus thường xuyên.

Q: /rewind khác /clear như thế nào?

/clear xóa toàn bộ conversation, reset về zero. /rewind nhảy về một message cụ thể và xóa tất cả sau đó, như undo nhiều bước. Dùng /rewind khi Claude đi sai hướng trong task đang làm. Dùng /clear khi chuyển sang task hoàn toàn mới.

Q: File PDF hay DOCX có cần convert sang Markdown không?

Nếu bạn cần Claude đọc nội dung để phân tích hay tóm tắt, convert sang Markdown giảm khoảng 40-65% token với PDF hay 33% với DOCX. Tool Dockling convert trong vài giây. Không cần thiết nếu bạn chỉ muốn Claude biết file tồn tại, không đọc nội dung.

Q: Làm sao biết mình đang tốn bao nhiêu token?

Gõ /cost trong bất kỳ session nào để xem chi phí realtime. Trên API dashboard (console.anthropic.com), bạn thấy usage theo ngày. Công cụ ccusage từ community cho phép track usage chi tiết theo project và model. Gõ /context để xem cụ thể cái gì đang chiếm bao nhiêu trong context hiện tại.

15 mẹo tiết kiệm token Claude Code - giảm chi phí API từ $290 xuống $82 mỗi tháng với context management — 15 mẹo giúp giảm 50-87% chi phí token trong Claude Code – cập nhật tháng 4/2026

Mình nhớ lần đầu thấy bill API cuối tháng: $290. Nghĩ là mình dùng nhiều quá, nhưng sau khi tìm hiểu mới biết vấn đề không phải lượng dùng, mà là cách dùng. Cơ chế cốt lõi: mỗi lần bạn gửi một message, Claude Code gửi lại toàn bộ lịch sử hội thoại từ đầu, nên trong một session dài phần lớn token đang chi cho việc đọc lại context cũ chứ không phải xử lý task mới. Hiểu và kiểm soát điều này là cách giảm bill nhanh nhất.

Bài gốc mình viết 10 mẹo cơ bản. Lần update này mình bổ sung thêm 5 mẹo mới dựa trên nghiên cứu đó, đặc biệt là khái niệm “Context Rot”, 120K token ceiling, session chaining, và file-to-markdown conversion. Tổng 15 mẹo, áp dụng đủ giúp bạn giảm 70-87% chi phí.

TL;DR

trong một session dài, phần lớn token là để đọc lại history cũ chứ không phải xử lý task mới. 15 mẹo trong bài này tập trung vào 2 chiến lược: (1) giữ context gọn từ đầu với CLAUDE.md, .gitignore, chọn model đúng; (2) quản lý session thông minh với 120K ceiling, session chaining, /rewind, và file-to-markdown conversion. Áp dụng đủ: giảm $290/tháng xuống còn $82/tháng.

$290→$82

Bill API/tháng
sau khi tối ưu

10%

Giá cache-read
so với token gốc

50-87%

Token tiết kiệm
khi áp dụng 15 mẹo

~90%

Token giảm khi convert
HTML sang Markdown

Bạn sẽ học được gì:
– Tại sao context rot làm AI “mất trí” trong session dài và cách phòng tránh
– 120K token ceiling: con số kỳ lạ nhưng có cơ sở khoa học
– Session chaining: làm việc như dây chuyền lắp ráp thay vì một mình một session khổng lồ
– 5 mẹo nâng cao: /rewind, file conversion, session handoff, token dashboard, chiến thuật thời điểm Chi tiết skill session handoff skill setup 1 command với comparison 9 implementation public GitHub.

Xem thêm: Claude Code giá bao nhiêu? So sánh Pro vs Max vs API

Tiết Kiệm Token Claude Code Tại Sao Quan Trọng?

Mỗi message bạn gửi trong Claude Code, toàn bộ conversation history + CLAUDE.md + file contents được gửi lại từ đầu. Theo Anthropic Pricing, Opus 4.8 tính $25/1M output token. Áp dụng advisor strategy Opus Sonnet để chọn model đúng việc. Message đầu tiên có thể chỉ tốn vài trăm token, nhưng message thứ 30 trong cùng session có thể đắt gấp hàng chục lần, vì toàn bộ history được gửi lại mỗi lần.

Tại sao lại như vậy? Vì Claude không “nhớ” conversation. Mỗi lần, nó đọc lại tất cả từ message 1 đến message hiện tại. Session 30 messages có nghĩa là message cuối cùng phải “đọc” 29 messages trước đó. Đây là tính chất của transformer architecture, không phải lỗi.

Điều đáng lo: trong một session dài, phần lớn token chỉ là rereading history cũ chứ không phải xử lý task mới. Nghĩa là phần lớn bill API của bạn có thể đang chi cho việc đọc lại những gì Claude đã biết, không phải cho công việc thực sự mới.

Model	Input ($/1M)	Output ($/1M)	So sánh chi phí
Opus 4.8 (mới nhất)	$5	$25	Khuyến nghị cho task khó
Sonnet 4.6	$3	$15	3x Haiku (input)
Haiku 4.5	$1	$5	Rẻ nhất
Prompt Cache Hit	10% giá gốc	–	Tiết kiệm 90%

Subscription vs API là 2 hệ thống riêng biệt. Gói Pro $20 và Max $100-200/tháng tính rate-limited usage, không per-token. Bảng trên chỉ áp dụng cho API pay-as-you-go. Xem so sánh chi tiết Subscription vs API để biết gói nào hợp bạn.

Context Rot Là Gì Và Tại Sao Bạn Cần Biết Trước?

“Context Rot” là hiện tượng mình gọi là “AI mất trí từ từ”: session càng dài, Claude càng hoạt động kém. Không phải do model tệ, mà do attention mechanism bị phân tán khi context quá lớn. Khi context càng lớn, retrieval accuracy (khả năng nhớ đúng chi tiết) và độ sâu suy luận của model càng có xu hướng giảm, context dài hơn không đồng nghĩa với output tốt hơn.

Triệu chứng cụ thể mình đã gặp: Claude bắt đầu edit file mà không đọc trước, tần suất lỗi này tăng rõ rệt trong session dài. Nó đề xuất giải pháp mâu thuẫn với những gì vừa thống nhất 10 messages trước. Nó “quên” rằng bạn đã nói “đừng sửa file X”. Đây là context rot.

Vấn đề trầm trọng hơn ở tính năng auto-compact: Claude Code tự kích hoạt compact khi context đạt 95% window. Nhưng auto-compact là một quá trình nén, nên chắc chắn mất bớt chi tiết so với context gốc. Bạn không mất context hoàn toàn, nhưng có thể mất các chi tiết quan trọng mà không có cảnh báo rõ ràng.

Trường hợp cực đoan: để nhiều session hoặc agent team chạy không kiểm soát có thể khiến bill tăng vọt, vì context rot khiến agent liên tục retry, mỗi lần retry lại thêm hàng chục ngàn token.

Dấu hiệu nhận biết context rot: Claude sửa file mà không đọc trước, đề xuất trái ngược những gì đã thống nhất, hỏi lại thứ đã được giải thích, output ngắn và kém chi tiết hơn. Khi thấy những dấu hiệu này, đừng cố tiếp tục. Dừng session và bắt đầu mới.

Mẹo 1: CLAUDE.md Của Bạn Có Đang Ngốn Token Mỗi Session Không?

CLAUDE.md được đọc mỗi lần bắt đầu session và mỗi message. Tối ưu file từ 2,100 xuống 800 tokens giảm ~62% startup context (theo test của mình – Anthropic khuyến nghị giữ CLAUDE.md dưới 200 dòng để cải thiện adherence). Nếu CLAUDE.md của bạn đang có 400-500 dòng, bạn đang “nạp” hàng ngàn token thừa vào mỗi request.

Nguyên tắc cốt lõi: chỉ viết những gì Claude không thể tự suy ra từ code. Không giải thích “đây là dự án React” nếu đã có package.json. Không copy-paste README vào đây. Không liệt kê dependencies.

Trên ongboit.com, CLAUDE.md ban đầu dài 400 dòng. Sau khi rút gọn xuống 120 dòng và chuyển phần workflow sang Skills riêng, mỗi session tiết kiệm 3,000-5,000 tokens ngay từ đầu. Với 10 sessions/ngày, tương đương 30,000-50,000 tokens tiết kiệm, khoảng $1-2/ngày.

# CLAUDE.md TỐI ƯU: dưới 200 dòng

## Commands
npm run dev          # Chạy dev server
npm test             # Chạy tests
npm run lint         # Kiểm tra ESLint

## Architecture
- /src/api/     → API routes (Express)
- /src/models/  → Mongoose schemas
- /src/hooks/   → React hooks

## Rules
- Comment tiếng Việt cho business logic
- Luôn chạy test trước khi commit

# ĐỪNG viết:
# - Giải thích "đây là dự án React/Next.js"
# - Copy paste README vào đây
# - Liệt kê tất cả dependencies
# - Workflow dài hơn 10 dòng (chuyển sang Skills)

Skills dùng progressive disclosure: chỉ load metadata ~100 tokens/skill lúc startup, full SKILL.md chỉ load khi trigger. 10 skills = ~1,000 tokens thay vì 50,000+ nếu nhét hết vào CLAUDE.md. Tìm hiểu thêm ở bài Claude Code Skills từ cơ bản đến nâng cao.

Mẹo 2: .claudeignore, Tại Sao Đây Là Mẹo Dễ Nhất Nhưng Ít Ai Làm?

Claude Code tự scan codebase để hiểu context. Chỉ riêng việc exclude node_modules/ và .next/ trong dự án Next.js đã giảm 30-40% context tokens (32blog). Chỉ mất 2 phút để setup, nhưng hầu hết developer bỏ qua bước này.

Claude Code không có file .claudeignore riêng. Nó respect .gitignore mặc định qua setting respectGitignore. Với files cần block hoàn toàn, dùng permissions.deny trong .claude/settings.json.

# .gitignore: thêm các dòng này nếu chưa có

# Build artifacts (Claude không cần đọc)
node_modules/
.next/
dist/
build/
.output/

# Lock files (hàng ngàn dòng, tốn token vô ích)
package-lock.json
yarn.lock
pnpm-lock.yaml

# Media và binaries
*.png
*.jpg
*.mp4
*.woff2

# Logs và cache
*.log
.cache/
.turbo/
coverage/

// .claude/settings.json: block hoàn toàn files nhạy cảm
{
  "permissions": {
    "deny": [
      "Read(.env*)",
      "Read(**/*.secret)",
      "Read(wp-content/uploads/**)"
    ]
  }
}

Nguồn: Claude Code respect .gitignore mặc định qua setting respectGitignore. Exclude đúng các folder như node_modules/ và .next/ giúp giảm đáng kể context token. Settings docs: Anthropic Settings, 2026.

Ba lệnh quản lý context trong Claude Code: /clear, /rewind và /compact – mỗi lệnh phù hợp một tình huống khác nhau

Mẹo 3: /clear, /rewind, /btw, Dùng Lệnh Nào Khi Nào?

Sau 20-30 messages, conversation history có thể đạt 50K+ tokens mỗi request chỉ vì history cũ (Anthropic Docs). Bạn có 3 lệnh khác nhau để xử lý, mỗi lệnh phù hợp một tình huống riêng. Chọn sai lệnh bạn vẫn tốn token thừa hoặc mất context cần thiết.

/clear reset toàn bộ về zero. Dùng khi chuyển sang task hoàn toàn mới, context cũ không còn giá trị. Xong fix bug auth thì clear, bắt đầu viết blog sạch sẽ. Tiết kiệm 50-80% tokens cho session tiếp theo.

/rewind (hay /re, hoặc double-tap Escape) thì khác: nó nhảy lại một message cụ thể và xóa tất cả những gì xảy ra sau đó. Đây là lựa chọn tốt hơn nhiều so với “That didn’t work, try again” vì những lần thử thất bại làm ô nhiễm context. /rewind còn có tùy chọn “summarize from here” để tạo handoff note trước khi xóa. Rất hữu ích khi Claude đi sai hướng.

/btw dùng cho side questions không muốn đưa vào history chính. Claude trả lời rồi quay lại task gốc, câu hỏi phụ không làm nặng context (MindStudio).

# Khi nào dùng lệnh nào:

# Chuyển task hoàn toàn mới
/clear

# Claude đi sai hướng, muốn thử lại từ message N
/rewind   # hoặc double-tap Escape
# → chọn message muốn quay về
# → "summarize from here" nếu cần handoff

# Hỏi phụ không ảnh hưởng context chính
/btw Thư viện nào tốt cho date formatting trong Node.js?

# Thứ tự ưu tiên khi session dài:
# 1. /rewind nếu Claude vừa đi sai hướng
# 2. /clear nếu task mới hoàn toàn
# 3. /compact nếu task vẫn tiếp tục nhưng context nặng

Mẹo 4: /compact Đúng Cách Để Không Bị Mất Context Quan Trọng

/compact nén toàn bộ conversation thành bản tóm tắt, giải phóng 40-60% context window mà không cần /clear. Nhưng auto-compact có vấn đề: nó chỉ kích hoạt ở 95% context window và là quá trình nén nên mất bớt chi tiết so với bản gốc. Khi bạn để auto-compact tự xử lý, thường đã muộn.

Chiến lược đúng: compact thủ công ở 60% context, trước khi auto-compact kích hoạt. Compact với hướng dẫn cụ thể để giữ đúng thứ bạn cần. Thêm compaction rules vào CLAUDE.md để auto-compact (khi xảy ra) cũng ưu tiên đúng.

# Compact với hướng dẫn cụ thể: hiệu quả hơn bare /compact
/compact Focus on auth module changes and test results

# Thêm compaction rules vào CLAUDE.md:
## Compaction Rules
# When compacting, always preserve:
# - Mục tiêu task hiện tại và acceptance criteria
# - Đường dẫn file đã sửa
# - Kết quả test gần nhất
# - Outline nếu đang viết content
# - Decisions đã thống nhất (không reopen)

# Kiểm tra context level:
/context   # xem cái gì đang chiếm bao nhiêu

Quy tắc vàng: Compact thủ công ở 60%, đừng chờ auto-compact ở 95%. Ở 95%, Claude đã bắt đầu “quên” từ trước đó rồi. Compact ở 60% giữ được nhiều detail hơn nhiều và chủ động hơn.

Mẹo 5: Tại Sao 120K Token Là Ngưỡng Không Nên Vượt?

Mình dùng Opus với 1M context window, nhưng có một kỷ luật cá nhân: không bao giờ để session vượt 120K tokens, tương đương 12% context window. Nghe có vẻ lãng phí, nhưng có lý do cụ thể. Context càng lớn, độ chính xác khi truy hồi chi tiết càng giảm. 1M context window không có nghĩa là output tốt hơn, chỉ có nhiều chỗ hơn cho context rot phát triển.

Có một khái niệm quan trọng: “prime time” của session. Ở 0-20% đầu tiên (0-200K tokens với 1M window), CLAUDE.md còn mới nguyên trong context và attention của model tập trung nhất. Đây là lúc Claude làm việc tốt nhất. Khi vượt 20%, hiệu suất bắt đầu giảm dần.

120K token tương đương 60% của context window cũ 200K tokens, vốn là điểm compact/clear tự nhiên khi người dùng vẫn còn dùng window nhỏ hơn. Con số này không phải ngẫu nhiên, nó là ngưỡng trước khi context rot bắt đầu ảnh hưởng rõ rệt.

Cách mình theo dõi: cấu hình status bar hiển thị context percentage liên tục. Thấy 50-60%? Quyết định: compact ngay hay start session mới cho phần việc còn lại? Không bao giờ để đến 80% mới nghĩ đến.

Mẹo 6: Session Chaining: Chuỗi Session Như Dây Chuyền Lắp Ráp

Thay vì làm tất cả trong một session khổng lồ, hãy chia nhỏ thành nhiều session chuyên biệt. Mỗi session có đúng một mục tiêu, output của session trước là input của session sau. Giống dây chuyền lắp ráp, mỗi trạm làm một việc rất tốt thay vì một người làm tất cả.

Ví dụ workflow thực tế khi mình refactor một module lớn:
– Discovery session: đọc codebase, hiểu kiến trúc hiện tại, ghi chú ra file discovery-notes.md. Kết thúc session, clear.
– Planning session: load discovery-notes.md, tạo refactor-plan.md với từng bước cụ thể. Clear.
– Execution session: load refactor-plan.md, implement từng bước. Nếu dài, chia thêm session con.

Tại sao hiệu quả? Mỗi session bắt đầu với context sạch, chỉ chứa đúng thứ cần cho giai đoạn đó. Discovery session không cần nhớ planning details. Planning session không cần raw code từ discovery. Execution session nhận plan đã được tinh lọc, không có noise.

# Session Chaining Pattern

# === Session 1: Discovery ===
# Goal: Hiểu codebase, không implement gì
"Read src/auth/ and explain the current architecture.
List all files modified in last 30 days.
Output to discovery-notes.md, then we're done."
# → /clear sau khi có discovery-notes.md

# === Session 2: Planning ===
# Load file output từ session 1
"Read discovery-notes.md.
Create a step-by-step refactor plan for auth module.
Save to refactor-plan.md. Flag risks."
# → /clear sau khi có refactor-plan.md

# === Session 3: Execution ===
# Chỉ cần plan, không cần discovery raw
"Read refactor-plan.md. Implement Step 1 only.
When done, update the plan to mark Step 1 complete."

Khi nào nên dùng session chaining: Tasks ước tính trên 45 phút, tasks có nhiều giai đoạn khác nhau (research, plan, implement, review), tasks yêu cầu đọc nhiều files lớn. Không cần thiết cho tasks nhỏ dưới 20 messages.

Chọn đúng model cho từng task có thể tiết kiệm 40-80% chi phí – Sonnet xử lý được 80%+ tác vụ hàng ngày

Mẹo 7: Chọn Model Đúng Việc, Tiết Kiệm Được Bao Nhiêu?

Không phải task nào cũng cần Opus. Theo Anthropic, Sonnet 4.6 xử lý 80%+ tasks thông thường với giá chỉ 1/5 Opus. Chuyển đúng model cho đúng việc tiết kiệm 40-80% chi phí mỗi session. Viết blog, fix bug nhỏ, thêm test, format code, đều là Sonnet territory.

Task	Model nên dùng	Chi phí ước tính
Bug fix nhỏ, viết test, format code	Sonnet	~$0.05-0.15/task
Kiến trúc mới, refactor lớn, phân tích bảo mật	Opus	~$0.50-2.00/task
Search codebase, scan files, audit links	Haiku (subagent)	~$0.01-0.05/task
Viết blog, content creation dài	Opus (plan) + Sonnet (write)	~$1.00-1.50/bài

# Chuyển model nhanh trong session:
/model sonnet     # Mặc định cho hầu hết tasks
/model opus       # Chỉ khi cần reasoning sâu
/model haiku      # Rẻ nhất cho tasks đơn giản

# Set mặc định trong settings.json:
{
  "model": "sonnet",
  "smallModelOverride": "haiku"
}

Mẹo 8: Sub-agents Chạy Context Riêng, Tiết Kiệm Theo Cách Nào?

Khi Claude cần đọc 5-10 files để tìm hiểu codebase, toàn bộ nội dung vào context chính. Sub-agents chạy trong context window riêng biệt, chỉ trả về summary ngắn gọn. Theo Anthropic Docs, agent teams dùng khoảng 7x token hơn session thường, nhưng trick ở chỗ subagent chạy Haiku ($1/1M input) trong khi context chính dùng Opus ($5/1M input).

Workflow audit ongboit.com thực tế: cần kiểm tra 14 bài blog tìm internal link hỏng. Thay vì để Opus đọc từng bài (14 files x 3,000 tokens = 42,000 tokens vào context chính), mình delegate cho subagent Haiku scan tất cả, trả về danh sách 20 dòng. Context chính chỉ nhận 500 tokens. Chi phí giảm từ ~$3.15 xuống ~$0.25.

# Thay vì để Claude đọc trực tiếp (tốn token):
"Đọc tất cả file trong src/api/ và tìm endpoint thiếu auth"
# → Claude đọc 15 files vào context chính (~30,000 tokens)

# Dùng subagent (tiết kiệm):
"Use a subagent to investigate: read all files in src/api/
and list endpoints missing auth middleware. Summary only."
# → Subagent đọc 15 files trong context riêng (Haiku)
# → Trả về 10-20 dòng summary vào context chính (~500 tokens)

Mẹo 9: Tại Sao Plan Mode Là Thói Quen Của Người Tạo Ra Claude Code?

Một thực hành được nhiều power user khuyên: bắt đầu mỗi session bằng plan mode. Không phải vì không tin Claude, mà vì plan mode loại bỏ lãng phí lớn nhất là rework vòng lặp, khi Claude implement đúng ngay từ đầu, bạn tiết kiệm đáng kể số token cho việc làm lại.

Mình đã mắc lỗi này nhiều lần. Yêu cầu Claude refactor auth module không plan trước, kết quả là 5 vòng sửa, mỗi vòng 10,000+ tokens. Tổng 50,000+ tokens cho 1 task. Dùng plan mode, cùng task đó chỉ tốn 20,000 tokens. Không cần bật plan mode cho mọi thứ, nhưng bất kỳ task nào trên 15 phút đều nên plan trước.

Plugin Superpowers cho Claude Code có thêm plan mode enhancement, cho phép save và load plans giữa sessions, rất hữu ích cho project dài.

# Cách vào Plan mode:
# Nhấn Shift+Tab trước khi gửi message

# Hoặc nói trực tiếp:
"Plan first: how would you refactor the auth module
to support OAuth2? Don't write code yet.
List: current state, proposed changes, risks, steps."

# Claude sẽ:
# 1. Phân tích cấu trúc hiện tại
# 2. Đề xuất approach (2-3 options)
# 3. Chờ bạn approve trước khi implement
# → Implement đúng lần đầu = ít rework = ít token

Mẹo 10: Chuyển File Sang Markdown Giảm Token 90%, Thật Không?

Đây là mẹo mà mình không ngờ lại hiệu quả đến vậy. Khi Claude đọc file HTML, PDF, hay DOCX, nó đọc tất cả markup, formatting, metadata, layout. Phần lớn không liên quan đến content. Convert sang Markdown trước khi đưa cho Claude giúp cắt phần lớn token markup: HTML có thể giảm tới ~90% (MindStudio, 01/07/2026), PDF khoảng 40-65%, DOCX khoảng 33-50%.

Con số cụ thể: một file PDF 40 trang tốn token tương đương file Markdown 130 trang. Đó là 3.25x overhead chỉ vì format. Model chỉ cần text content, không cần biết font-size, margin, hay layout của PDF.

Tool mình dùng: Dockling (command line, free), convert PDF/DOCX/HTML sang Markdown trong vài giây. Cũng có thể dùng Pandoc cho DOCX. Với HTML, một regex đơn giản strip hết tags.

# Dockling: convert PDF sang Markdown
dockling convert document.pdf --output document.md

# Pandoc: convert DOCX sang Markdown
pandoc input.docx -t markdown -o output.md

# Python: strip HTML tags đơn giản
python3 -c "
import re, sys
html = open(sys.argv[1]).read()
text = re.sub('<[^>]+>', '', html)
print(text)
" input.html > output.md

# Kết quả giảm token:
# HTML (1MB) → Markdown (~100KB) = 90% giảm
# PDF (40 trang) → Markdown (40 trang) = 65% giảm
# DOCX (100KB) → Markdown (67KB) = 33% giảm

Khi nào áp dụng: Bất kỳ lúc nào bạn cần đưa documentation, report, hay spec cho Claude đọc. Đặc biệt hữu ích khi onboard Claude vào project mới với nhiều tài liệu kỹ thuật.

Mẹo 11-15: Nâng Cao: Giờ Bạn Đã Sẵn Sàng

Năm mẹo sau đây cần chút setup hơn, nhưng payoff lớn hơn nhiều với người dùng nặng. Mình đã dùng tất cả trên workflow ongboit.com.

Mẹo 11: Giảm Extended Thinking Budget

Mặc định Claude Code dành 31,999 tokens/request cho extended thinking. Thinking tokens tính như output token ($25/1M với Opus 4.8). Giảm thinking budget cho simple tasks tiết kiệm đến 70% thinking cost per request (ClaudeFast).

Mình set MAX_THINKING_TOKENS=8000 làm mặc định. Đủ cho 90% công việc hàng ngày. Chỉ tăng lên khi gặp architecture decisions hay complex debugging. Cẩn thận: giảm quá thấp cho complex tasks sẽ output kém, bạn phải yêu cầu sửa lại, mất thêm token, đây là bẫy “tiết kiệm giả”.

# Giảm thinking budget:
export MAX_THINKING_TOKENS=8000

# Thêm rule vào CLAUDE.md:
## Efficiency Rules
# simple file edits: minimal thinking
# architecture decisions: think deeply
# code review: medium thinking

Mẹo 12: Prompt Cụ Thể Cắt 15-25% Token

Prompt mơ hồ buộc Claude scan nhiều file, thử nhiều approach, output dài dòng. Prompts cụ thể giúp tiết kiệm 15-25% tokens nhờ giảm scanning và output thừa (Aslam Doctor). Quy tắc của mình: mỗi prompt phải chứa ít nhất tên file, số dòng, hoặc tên function.

“Fix bug in auth” là prompt tệ. “Fix null pointer in handleSubmit at components/Form.tsx:89” là prompt tốt. Cái sau giúp Claude bỏ qua 50+ files không liên quan, xử lý ngay vào đúng chỗ.

Prompt tốn token	Prompt tiết kiệm
“Fix all bugs”	“Fix null pointer in handleSubmit at components/Form.tsx:89”
“Improve this codebase”	“Add input validation to loginUser() in src/auth.ts line 42”
“Write tests”	“Write 3 unit tests for calculateTotal() in utils/pricing.ts: empty cart, single item, discount”

Mẹo 13: Hooks + Skills Ở Tầng Hệ Thống

Hooks tiền xử lý data trước khi Claude nhận. Thay vì để Claude đọc file log 10,000 dòng (~40,000 tokens), hook grep chỉ lấy dòng ERROR, trả về 50 dòng (~200 tokens). Tiết kiệm 99.5% cho 1 lần đọc log.

Skills chỉ load khi cần, không nhồi tất cả vào CLAUDE.md. Workflow viết blog 16 bước chỉ load khi gõ /blog. Các session khác không bị ảnh hưởng.

#!/bin/bash
# Hook: Tiền xử lý log file (PostToolUse on Read)
INPUT=$(cat)
FILE=$(echo "$INPUT" | jq -r '.file_path // empty')

# Nếu đọc file .log, chỉ giữ dòng ERROR và WARNING
if [[ "$FILE" == *.log ]]; then
  grep -E "ERROR|WARNING" "$FILE" | tail -50
  exit 0
fi
exit 0
# Kết quả: 10,000 dòng log → 50 dòng relevant
# Tiết kiệm: ~39,800 tokens mỗi lần đọc log

Mẹo 14: Session Handoff Skill: Đừng Reset Từ Đầu

Khi session dài đến giới hạn nhưng task chưa xong, bạn không cần bắt đầu lại từ đầu. Tạo một custom slash command /session-handoff để Claude: đọc toàn bộ session, phân tích, output structured summary (decisions made, key files modified, current state, open questions, pick-up-from-here instructions). Sau đó /clear và paste summary vào session mới. Session mới tiếp tục mượt mà như chưa bị ngắt.

Điểm khác biệt so với compact thông thường: handoff được thiết kế để human-readable và AI-readable đồng thời. Bạn có thể đọc để hiểu trạng thái, và Claude mới cũng đọc để tiếp tục. Compact chỉ nhắm đến Claude tiếp tục trong cùng session.

# ~/.claude/commands/session-handoff.md
# Tạo file này để dùng /session-handoff trong mọi project

Analyze this session and create a handoff note:

## Session Handoff

**Task objective:** [what we were trying to accomplish]
**Current status:** [done / in progress / blocked]
**Decisions made:** [key decisions, rationale]
**Files modified:** [list with what changed]
**Next steps:** [exact steps to continue]
**Open questions:** [unresolved issues]
**Pick up from here:** [first message for new session]

Save to session-handoff.md, then confirm done.

Mẹo 15: Token Dashboard: Biết Token Đi Đâu

Không thể tối ưu thứ bạn không đo. Một token dashboard đơn giản cho thấy: sessions, turns, input/output tokens, cache read/create, phân theo project và model. Bạn sẽ nhanh chóng nhận ra pattern, project nào tốn nhất, prompt type nào ăn nhiều token, model nào đang bị dùng sai.

Công cụ có sẵn từ community: ccusage track usage chi tiết theo project từ Claude Code CLI. Cách đơn giản nhất: gõ /cost sau mỗi task lớn, ghi chú lại, sau 1 tuần bạn đã có picture rõ ràng về consumption pattern của mình.

# Xem cost trong session:
/cost

# ccusage (community tool):
npm install -g ccusage
ccusage --project myapp --last 7d

# Xem theo model:
ccusage --breakdown model

# Output: sessions, turns, tokens, cache hits, cost by model

Token Cost Của Các Model Claude Code Hiện Tại (2026)

Tính đến giữa 2026, model mạnh nhất cho Claude Code là Claude Opus 4.8. Theo bảng giá chính thức của Anthropic, Opus 4.8, cũng như 4.7 và 4.6, có giá $5/1M input token và $25/1M output token. Giá dòng Opus không đổi qua các phiên bản này, nên đòn bẩy tiết kiệm lớn nhất không nằm ở việc chờ một model rẻ hơn, mà ở cách bạn dùng.

Routing model mới là đòn bẩy thật. Vì giá Opus giữ nguyên, cách giảm bill hiệu quả nhất là dùng Opus cho task khó (thiết kế kiến trúc, refactor phức tạp, debug nhiều bước), Sonnet 4.6 cho phần lớn task hằng ngày, và Haiku 4.5 cho validation/format. Đây chính là Mẹo 7 ở trên, và nó tiết kiệm nhiều hơn bất kỳ thay đổi version nào.

Prompt caching cắt mạnh chi phí input. Anthropic tính cache-read token chỉ bằng 10% giá gốc. Để tận dụng: giữ CLAUDE.md ổn định trong ngày làm việc (cache key mới stable), stack file context theo thứ tự cố định (CLAUDE.md trước, rồi folder context, sau cùng mới đến task message), và tránh inject timestamp hay random ID vào prompt vì sẽ invalidate cache cả session. Pattern này có thể tiết kiệm 30-40% chi phí input trên session dài so với dùng cache “bừa bãi”.

Theo dõi cost qua ccusage. Chạy ccusage --breakdown model hằng tuần để xem cost split giữa Opus, Sonnet và Haiku. Tỉ lệ lành mạnh thường là Opus 30-40%, Sonnet 50-60% (đa số task), Haiku 5-10% (validation/format). Nếu Opus chiếm trên 70% cost, nhiều khả năng bạn đang dùng Opus cho task đáng lý route sang Sonnet, nên review lại workflow.

Lưu ý về subscription tier: rate limit của Max 5x ($100/tháng) và Max 20x tính theo token throughput, không theo dollar. Vì vậy việc tối ưu context (15 mẹo ở trên) giúp bạn chạy được nhiều session hơn trong cùng tier trước khi chạm rate limit, thường hiệu quả hơn so với việc nâng tier.

Lưu ý cho dev Việt Nam: tiếng Việt có dấu thường tốn nhiều token hơn tiếng Anh do mã hoá UTF-8 nhiều byte cho mỗi ký tự có dấu. Vì vậy nếu CLAUDE.md hoặc prompt của bạn chứa nhiều tiếng Việt (comment, instruction, documentation), việc giữ chúng ngắn gọn và súc tích càng quan trọng, mỗi từ tiết kiệm có tác động lớn hơn so với cùng nội dung viết bằng tiếng Anh.

Quick action items để bắt đầu tối ưu trong ngày: mở Anthropic Console, vào usage tab và ghi lại cost baseline tuần này để có cơ sở so sánh. Áp dụng 3 mẹo đầu tiên (CLAUDE.md gọn, .gitignore đúng cách, thói quen /clear giữa các task). Chạy lại một task quen thuộc (ví dụ audit blog hoặc refactor service nhỏ) và so sánh cost với ghi chép cũ. Sau 1 tuần, xem lại usage chart để thấy mức tiết kiệm thực tế trên workflow của bạn.

Nên Bắt Đầu Từ Đâu Để Tiết Kiệm Token Ngay Hôm Nay?

Nếu bạn chỉ có 30 phút, đây là thứ tự ưu tiên theo impact/effort ratio. Ba mẹo đầu tiên chiếm 70-80% hiệu quả tổng, không cần đến 15 mẹo để thấy kết quả ngay.

Quick wins (dưới 5 phút, hiệu quả ngay):
1. .gitignore đúng cách: 2 phút, giảm 30-40% context ngay
2. Thói quen /clear giữa tasks: 0 phút setup, giảm 50-80% history cost
3. Đổi model mặc định từ Opus sang Sonnet: 2 phút, giảm 40-80% chi phí

Đầu tư ngắn (15-30 phút, payoff dài hạn):
4. Tối ưu CLAUDE.md xuống dưới 200 dòng: 15-20 phút, giảm 62% startup
5. Áp dụng plan mode cho tasks lớn: thói quen, không cần setup

Kỷ luật mới (thay đổi workflow):
6. 120K token ceiling: đặt habit compact/clear trước khi vượt ngưỡng
7. Session chaining cho projects phức tạp: lập kế hoạch trước khi bắt đầu

Nâng cao (30 phút+, dành cho power users):
8-15. Hooks, Skills, file conversion, session handoff, token dashboard

#	Mẹo	Tiết kiệm	Độ khó	Setup
1	CLAUDE.md gọn	62% startup	Dễ	15 phút
2	.gitignore	30-40% context	Dễ	2 phút
3	/clear giữa tasks	50-80% history	Dễ	0 (thói quen)
4	/compact thủ công ở 60%	40-60% context	Dễ	0 (lệnh)
5	120K token ceiling	Ngăn context rot	Dễ	0 (kỷ luật)
6	Session chaining	Ngăn $42K explosion	Trung bình	10 phút
7	Chọn model đúng	40-80% cost	Dễ	5 phút
8	Sub-agents	90%+ context chính	Trung bình	10 phút
9	Plan mode	20-30% rework	Dễ	0 (Shift+Tab)
10	File → Markdown	65-90% per file	Dễ	5 phút (tool)
11	Giảm thinking budget	70% thinking cost	Trung bình	5 phút
12	Prompt cụ thể	15-25% output	Dễ	0 (thói quen)
13	Hooks + Skills	Hàng chục ngàn tokens	Nâng cao	30 phút+
14	Session Handoff	Không mất tiến độ	Trung bình	15 phút
15	Token Dashboard	Nhận biết pattern	Trung bình	10 phút

Kết quả thực tế sau 3 tháng áp dụng 15 mẹo tiết kiệm token trên ongboit.com

Claude Code vs Cursor: Chi Phí Nào Thực Sự Thấp Hơn?

Cursor tính phí theo số request, Claude Code tính theo token, đây là sự khác biệt quan trọng ảnh hưởng trực tiếp đến chi phí thực tế của bạn. Cùng một task, mô hình nào rẻ hơn phụ thuộc hoàn toàn vào cường độ sử dụng.

Cursor Pro ($20/tháng) gồm unlimited fast requests (Sonnet 4.6, GPT-4o-mini) + 500 premium requests/tháng (Opus 4.8, GPT-4o full, Gemini 2.5 Pro). Khi hết 500 premium requests, bạn bị fallback sang model yếu hơn tự động. Cursor cũng bao gồm VS Code fork với AI autocomplete, một thứ Claude Code không có.

Claude Code với Max 5x ($100/tháng) cho Sonnet gần unlimited rate. Max 20x ($200/tháng) cho cả Opus không giới hạn. API pay-as-you-go thì linh hoạt hơn nhưng không có ceiling.

Tiêu chí	Cursor Pro ($20)	Claude Max 5x ($100)	Claude API (pay-as-you-go)
Model mạnh nhất	500 requests/tháng Opus	Sonnet unlimited	Tùy budget ($5/1M)
Editor tích hợp	✓ VS Code fork + autocomplete	✗ Terminal only	✗ Terminal only
Phù hợp nhất	Dùng nhẹ, <500 req/tháng Opus	Dùng vừa, 50+ session/tháng	Dùng nặng hoặc muốn kiểm soát
Token optimization quan trọng?	Ít hơn (tính per-request)	Có (rate limit)	Rất quan trọng (trực tiếp = tiền)

Kết luận thực tế: Developer dùng Cursor cho autocomplete hàng ngày + Claude Code cho agentic tasks nặng không hiếm. Không phải all-or-nothing. Nếu bạn chỉ dùng API và muốn kiểm soát token chặt, 15 mẹo trong bài này áp dụng trực tiếp. Nếu đang trên Max plan, tối ưu token vẫn giúp tránh rate limit và giữ session chất lượng.

Một pattern tiết kiệm token đáng cài: Claude Skills audit cleanup quarterly để xoá skill cài không invoke, scale lên team 20 dev tiết kiệm khoảng 30 USD mỗi tháng.

Mẹo 16: MCP Ngốn Context Âm Thầm, Khi Nào Chuyển Sang Skill Hoặc CLI

Một nguồn tốn token ít người để ý: mỗi MCP server khi kết nối sẽ nạp toàn bộ danh sách tool của nó cùng hướng dẫn dùng vào context, và nằm đó suốt phiên, kể cả khi bạn không gọi tới. Cắm vài MCP (Notion, Google Drive, CRM) là context window đã bị ăn mòn một mảng trước khi bạn gõ câu đầu tiên. Trong thực tế, một MCP nặng có thể chiếm hơn 20% context.

Ba cách gọn token:

Giới hạn 2-3 MCP thực sự dùng thường xuyên; tắt bớt cái ít đụng tới.
Tool ít dùng thì dùng CLI thay vì MCP. Thay vì để MCP nạp sẵn cả bộ tool, để Claude chạy một lệnh CLI tới dịch vụ đó đúng lúc cần, không giữ data trong context.
Chuyển MCP hay dùng thành skill. Skill chỉ nạp phần thân khi được gọi (name và description gần như không tốn token cho tới lúc dùng), nên đóng gói thao tác hay lặp thành skill sẽ rẻ hơn để MCP nạp thường trực.

Câu Hỏi Thường Gặp

Context rot ảnh hưởng thực tế như thế nào?

Context rot là hiện tượng Claude hoạt động kém dần khi session dài. Khi session dài, độ sâu suy luận của Claude giảm dần: model bắt đầu edit file mà không đọc kỹ trước, đề xuất trái ngược những gì đã thống nhất, hay hỏi lại thứ đã được giải thích. Dấu hiệu rõ nhất: output ngày càng ngắn và kém chi tiết.

Tại sao 120K token là ngưỡng quan trọng?

120K tokens tương đương 12% của 1M context window, nhưng đây là phạm vi “prime time” khi CLAUDE.md còn mới và attention model tập trung nhất. Context càng lớn thì độ chính xác truy hồi chi tiết càng giảm. 1M context window không đồng nghĩa output tốt hơn, chỉ có nhiều chỗ hơn cho context rot phát triển.

Session chaining có làm gián đoạn workflow không?

Không, nếu bạn thiết kế đúng. Mỗi session output ra một file (discovery-notes.md, refactor-plan.md), session sau load file đó. Claude không cần nhớ conversation trước, chỉ cần đọc file output. Cảm giác như assembly line: mỗi trạm nhận input từ trạm trước, làm việc của mình, truyền output cho trạm sau.

Dùng Max plan hay API rẻ hơn?

Nếu bạn dùng dưới $100/tháng qua API thì API rẻ hơn. Trên $100 thì Max 5x ($100/tháng) lợi hơn vì usage gần như không giới hạn. Max 20x ($200/tháng) phù hợp khi cần Opus thường xuyên. Xem bài so sánh chi phí chi tiết để tính cho trường hợp của bạn.

Làm sao biết mình đang tốn bao nhiêu token?

Gõ /cost trong bất kỳ session nào để xem chi phí realtime. Trên API dashboard (console.anthropic.com), bạn thấy usage theo ngày. Công cụ ccusage từ community cho phép track usage chi tiết theo project và model. Gõ /context để xem cụ thể cái gì đang chiếm bao nhiêu trong context hiện tại.

/rewind khác /clear như thế nào?

/clear xóa toàn bộ conversation, reset về zero. /rewind nhảy về một message cụ thể và xóa tất cả sau đó, như “undo” nhiều bước. Dùng /rewind khi Claude đi sai hướng trong task đang làm. Dùng /clear khi chuyển sang task hoàn toàn mới. Cả hai đều tốt hơn nhiều so với việc nói “That didn’t work, try again” vì lần thử thất bại sẽ ô nhiễm context.

File PDF hay DOCX có cần convert sang Markdown không?

Nếu bạn cần Claude đọc nội dung để phân tích hay tóm tắt, convert sang Markdown giảm khoảng 40-65% token (PDF) hay 33% (DOCX). Tool Dockling (command line, free) convert trong vài giây. Không cần thiết nếu bạn chỉ muốn Claude biết file tồn tại, không đọc nội dung.

Kết Luận

Token không phải thứ nên sợ, nhưng cũng không nên lãng phí. Bài học lớn nhất: vấn đề không phải bạn dùng bao nhiêu, mà bạn dùng như thế nào. Phần lớn token thường bị tiêu vào việc đọc lại history, không phải làm việc thực sự.

15 mẹo trong bài này chia thành 2 tầng: tầng cơ bản (giữ context gọn từ đầu) và tầng nâng cao (quản lý session vòng đời). Bạn không cần làm tất cả ngay. Ba mẹo đầu tiên, .gitignore, /clear giữa tasks, và CLAUDE.md gọn, đã tiết kiệm được 60-70% tổng chi phí.

Mình đã giảm từ $290/tháng xuống $82/tháng, output không giảm, productivity tăng vì mỗi session hoạt động tốt hơn khi context sạch. Context rot là kẻ thù thầm lặng, không cần phải dùng ít hơn, chỉ cần dùng thông minh hơn.

Bạn mới bắt đầu với Claude Code là gì? Đọc hướng dẫn cài đặt trước. Đã dùng rồi? Thử tạo hooks tự động hóa và viết skill riêng cho workflow của bạn. Muốn biết budget phù hợp? Xem so sánh gói Pro, Max và API để chọn đúng.

Nếu bạn muốn xây dựng lộ trình học Claude Code từ A-Z, xem Bảng Tổng Hợp Claude Code.

Đọc thêm: Cấu hình gọn (rule theo path, CLAUDE.md ngắn) là một cách tiết kiệm token. Xem tổng thể cấu hình Claude Code và thư mục .claude.

15 Mẹo Tiết Kiệm Token Claude Code Hiệu Quả Nhất (2026)

Tiết Kiệm Token Claude Code Tại Sao Quan Trọng?

Context Rot Là Gì Và Tại Sao Bạn Cần Biết Trước?

Mẹo 1: CLAUDE.md Của Bạn Có Đang Ngốn Token Mỗi Session Không?

Mẹo 2: .claudeignore, Tại Sao Đây Là Mẹo Dễ Nhất Nhưng Ít Ai Làm?

Mẹo 3: /clear, /rewind, /btw, Dùng Lệnh Nào Khi Nào?

Mẹo 4: /compact Đúng Cách Để Không Bị Mất Context Quan Trọng

Mẹo 5: Tại Sao 120K Token Là Ngưỡng Không Nên Vượt?

Mẹo 6: Session Chaining: Chuỗi Session Như Dây Chuyền Lắp Ráp

Mẹo 7: Chọn Model Đúng Việc, Tiết Kiệm Được Bao Nhiêu?

Mẹo 8: Sub-agents Chạy Context Riêng, Tiết Kiệm Theo Cách Nào?

Mẹo 9: Tại Sao Plan Mode Là Thói Quen Của Người Tạo Ra Claude Code?

Mẹo 10: Chuyển File Sang Markdown Giảm Token 90%, Thật Không?

Mẹo 11-15: Nâng Cao: Giờ Bạn Đã Sẵn Sàng

Mẹo 11: Giảm Extended Thinking Budget

Mẹo 12: Prompt Cụ Thể Cắt 15-25% Token

Mẹo 13: Hooks + Skills Ở Tầng Hệ Thống

Mẹo 14: Session Handoff Skill: Đừng Reset Từ Đầu

Mẹo 15: Token Dashboard: Biết Token Đi Đâu

Token Cost Của Các Model Claude Code Hiện Tại (2026)

Nên Bắt Đầu Từ Đâu Để Tiết Kiệm Token Ngay Hôm Nay?

Claude Code vs Cursor: Chi Phí Nào Thực Sự Thấp Hơn?

Mẹo 16: MCP Ngốn Context Âm Thầm, Khi Nào Chuyển Sang Skill Hoặc CLI

Câu Hỏi Thường Gặp

Context rot ảnh hưởng thực tế như thế nào?

Tại sao 120K token là ngưỡng quan trọng?

Session chaining có làm gián đoạn workflow không?

Dùng Max plan hay API rẻ hơn?

Làm sao biết mình đang tốn bao nhiêu token?

/rewind khác /clear như thế nào?

File PDF hay DOCX có cần convert sang Markdown không?

Kết Luận

Claude For Small Business 2026: 11 Connector 15 Workflow

Migration Notion To Obsidian: Hướng Dẫn Chuyển 2026

Claude Code Sub-Agents vs Agent Teams: Chọn Cái Nào? (2026)

Claude Code: Build App Đầu Tiên Từng Bước 2026

Claude Code Channels: Nhận Tin Nhắn Từ Telegram, Discord, iMessage (2026)

Claude Code Memory & Context: Hướng Dẫn Quản Lý (2026)

Tiết Kiệm Token Claude Code Tại Sao Quan Trọng?

Context Rot Là Gì Và Tại Sao Bạn Cần Biết Trước?

Mẹo 1: CLAUDE.md Của Bạn Có Đang Ngốn Token Mỗi Session Không?

Mẹo 2: .claudeignore, Tại Sao Đây Là Mẹo Dễ Nhất Nhưng Ít Ai Làm?

Mẹo 3: /clear, /rewind, /btw, Dùng Lệnh Nào Khi Nào?

Mẹo 4: /compact Đúng Cách Để Không Bị Mất Context Quan Trọng

Mẹo 5: Tại Sao 120K Token Là Ngưỡng Không Nên Vượt?

Mẹo 6: Session Chaining: Chuỗi Session Như Dây Chuyền Lắp Ráp

Mẹo 7: Chọn Model Đúng Việc, Tiết Kiệm Được Bao Nhiêu?

Mẹo 8: Sub-agents Chạy Context Riêng, Tiết Kiệm Theo Cách Nào?

Mẹo 9: Tại Sao Plan Mode Là Thói Quen Của Người Tạo Ra Claude Code?

Mẹo 10: Chuyển File Sang Markdown Giảm Token 90%, Thật Không?

Mẹo 11-15: Nâng Cao: Giờ Bạn Đã Sẵn Sàng

Mẹo 11: Giảm Extended Thinking Budget

Mẹo 12: Prompt Cụ Thể Cắt 15-25% Token

Mẹo 13: Hooks + Skills Ở Tầng Hệ Thống

Mẹo 14: Session Handoff Skill: Đừng Reset Từ Đầu

Mẹo 15: Token Dashboard: Biết Token Đi Đâu

Token Cost Của Các Model Claude Code Hiện Tại (2026)

Nên Bắt Đầu Từ Đâu Để Tiết Kiệm Token Ngay Hôm Nay?

Claude Code vs Cursor: Chi Phí Nào Thực Sự Thấp Hơn?

Mẹo 16: MCP Ngốn Context Âm Thầm, Khi Nào Chuyển Sang Skill Hoặc CLI

Câu Hỏi Thường Gặp

Context rot ảnh hưởng thực tế như thế nào?

Tại sao 120K token là ngưỡng quan trọng?

Session chaining có làm gián đoạn workflow không?

Dùng Max plan hay API rẻ hơn?

Làm sao biết mình đang tốn bao nhiêu token?

/rewind khác /clear như thế nào?

File PDF hay DOCX có cần convert sang Markdown không?

Kết Luận

Similar Posts