Claude Code Audit Website 2026: SEO + GEO 1 Lệnh + Autofix

Bạn có site rồi, nhưng không biết nó hổng SEO chỗ nào. Thường thì phải mở Ahrefs hay Semrush (~$100+/tháng), hoặc thuê agency làm audit. Claude Code làm được bằng 1 lệnh, và còn check thêm thứ mà tool truyền thống bỏ qua: ChatGPT, Perplexity có trích site bạn khi trả lời người dùng không.

Vì sao thứ đó quan trọng năm 2026? Khi Google chèn một đoạn tóm tắt AI lên đầu kết quả, tỉ lệ người bấm vào link tụt từ 15% xuống 8% (Pew Research, 2025). Tệ hơn: 25% trang được ChatGPT trích dẫn nhiều nhất lại không nằm trong top 100 Google (seoClarity, 11/2025). Nói cách khác, audit SEO kiểu cũ chỉ nhìn nửa bức tranh.

Bài này nói về gì: giới thiệu kit + lệnh /seo-pipeline: audit hạ tầng website (kỹ thuật, schema, tốc độ, AI-readiness). Mình sẽ chỉ bạn cách chạy, cách đọc báo cáo, và cách đưa báo cáo cho Claude Code để nó sửa site giúp.

Muốn audit nội dung blog (từng bài viết) → xem bài riêng: audit blog portfolio.
Muốn xem danh sách đầy đủ mọi thứ cần check → bài checklist audit website.

Đọc xong bài này, bạn sẽ biết:

Chạy 1 lệnh audit cả SEO + GEO cho bất kỳ site nào.
Đọc report 3 điểm + thẻ lỗi theo mức ưu tiên.
Đưa report cho Claude Code áp fix theo 3 loại: auto / review / manual.
Lặp re-audit để theo dõi điểm nhích lên sau mỗi đợt fix.

/seo-pipeline audit website làm gì cho bạn?

Bạn gõ 1 lệnh. Kit chạy, rồi trả về 1 báo cáo HTML: chấm điểm site, liệt kê lỗi theo thứ tự ưu tiên, và kèm sẵn code để sửa. Không phải mở 5-6 tab tool, không tự ghép số liệu.

/seo-pipeline yoursite.com

3 cách nghĩ khi dùng: (1) audit cả site → /seo-pipeline yoursite.com · (2) audit 1 trang → thêm path: /seo-pipeline yoursite.com/blog/bai-viet · (3) xem nhanh → thêm --fast (~30 phút thay vì 90-120). Mọi thứ khác (mode, loại site) kit tự nhận.

Báo cáo check 2 mặt cùng lúc:

SEO truyền thống: site có lên Google không: tốc độ, cấu trúc, đánh dấu dữ liệu (schema), sitemap, lỗi index.
GEO: viết tắt của Generative Engine Optimization. Tức là kiểm tra xem các AI như ChatGPT, Perplexity, Google AI Overview có “đọc” và trích được site bạn không. Ví dụ: bot của ChatGPT có bị chặn trong file robots.txt không, site có file llms.txt chưa, schema có đủ để AI hiểu bạn là ai không.

Mình nhớ lần đầu chạy /seo-pipeline trên ongboit.com. Mình nghĩ mọi thứ ổn: Google Search Console xanh, bài lên trang 1 vài từ khóa. Nhưng báo cáo chỉ ra ngay 2 thứ mình không ngờ. Bot của GPTBot bị chặn một phần trong robots.txt (do cấu hình WordPress mặc định). Và mình thiếu hoàn toàn FAQPage schema dù bài nào cũng có mục hỏi-đáp ở cuối. Kết quả: ChatGPT gần như không thấy nội dung của mình, và AI Overview của Google cũng không trích được đoạn Q&A nào. Hai lỗi đó mình sẽ không bao giờ tìm ra nếu chỉ nhìn vào Google Analytics.

Dưới nắp capô, lệnh này điều phối 16 chuyên gia ảo (agent) chạy song song. Mỗi agent soi một mảng, rồi tổng hợp thành 3 điểm tổng (composite score). Bạn không cần nhớ con số đó; phần sau mình sẽ mở ra cho ai tò mò.

/seo-pipeline: 1 lệnh đến 16 agent đến 3 điểm tổng — 1 lệnh điều phối 16 agent (6 nặng · 10 nhẹ) → gộp thành 3 điểm tổng.

Vì sao cần 1 lệnh thay vì chạy 16 skill tay?

Mình từng audit ongboit bằng cách gọi từng skill rời, trước khi có orchestrator. Thực tế nó đau hơn mình nghĩ:

16 JSON format khác nhau: không schema chuẩn, phải mở từng file đọc.
Không có composite score: skill này 72, skill kia 64, tổng site bao nhiêu? Tự weight average mỗi lần một kiểu.
Cross-validate thủ công: 2 skill cùng check title, kết luận trái nhau, reconcile tay thêm 30 phút.
112 phút nếu chạy tay tuần tự: 16 skill × ~7 phút (pipeline chạy song song nên nhanh hơn nhiều), chưa tính đọc kết quả.
Synthesis mất 2-3 giờ: dedupe, rank, viết action plan, format báo cáo. Tổng: 4-6 giờ cho 1 site.

Vài client muốn monthly audit, tức 25-30 giờ/tháng chỉ để chạy và tổng hợp. Không scale nổi. Đó là lý do mình gom hết vào 1 lệnh /seo-pipeline.

Audit gồm những mảng nào? (mảng nào do skill nào lo)

Mỗi điểm tổng được ghép từ nhiều mảng nhỏ (pillar), và mỗi mảng có một skill chuyên trách. Dưới đây là bản đồ để bạn biết khi báo cáo nói “Schema yếu” thì đó là skill nào soi ra. 16 chuyên gia ảo (agent) này chính là các skill trong bảng dưới. Mỗi skill lo 1 mảng.

Mảng (pillar)	Skill phụ trách	Loại
Kỹ thuật + tốc độ (crawl, index, SSR, security, CWV)	`geo-technical`	nhẹ
Schema (đánh dấu dữ liệu cho máy hiểu)	`geo-schema`	nhẹ
Sitemap / cấu trúc trang	`seo-sitemap`	nặng
Hiệu năng (tốc độ tải thật từ người dùng)	`seo-performance`	nặng
AI-readiness: bot access · llms.txt · brand mention · từng platform	`geo-crawlers` · `geo-llmstxt` · `geo-brand-mentions` · `geo-platform-optimizer`	platform nặng
Ảnh (alt, định dạng, lazy load)	`seo-images`	nặng
Backlink (hồ sơ link trỏ về)	`seo-backlinks`	nặng
Visual / độ ổn định layout	`seo-visual`	nặng
Accessibility (chuẩn WCAG)	`geo-accessibility`	nhẹ
Compliance (GDPR, cookie, privacy)	`geo-compliance`	nhẹ
Dữ liệu Google thật (GSC index, CrUX tốc độ field, GA4 traffic)	`seo-google`	nhẹ
Soi sâu trang mẫu (on-page từng URL: title, meta, heading, schema)	`seo-page`	nhẹ
Điều phối tổng (master)	`seo-audit`	nhẹ

Đọc cột “Loại”: nhẹ = chạy nhanh (<10 phút), chỉ đọc HTML nên free, luôn chạy. nặng = chạy lâu (30–90 phút) vì gọi tool trả phí (DataForSEO/Firecrawl) hoặc tải nặng; --fast bỏ 6 agent nặng để xem trước nhanh (~30 phút, đổi lại thiếu CWV thật + backlink + AI-citation). Đây là phần audit hạ tầng site; soi nội dung từng bài (E-E-A-T, độ trích dẫn AI) đã tách sang blog-audit-pipeline.

Vì sao từng mảng này quan trọng? Mình lấy 3 ví dụ thật:

Schema: một site bán thiết bị nén khí không có schema Product hay Organization. Google và ChatGPT không biết site đó bán gì, của ai, có uy tín không. Kết quả là AI Overview không bao giờ trích tên thương hiệu khi người hỏi “mua máy nén khí loại nào tốt”. Thêm schema đúng loại: máy tự đọc được ngay.
Compliance: nhiều site Việt Nam chạy GA4 thu thập dữ liệu người dùng ngay khi tải trang, trước khi người dùng đồng ý bất cứ điều gì. Điều này vi phạm Luật Bảo vệ Dữ liệu Cá nhân 91/2025 (PDPL, hiệu lực 1/1/2026, thay Nghị định 13/2023). Rủi ro pháp lý mà đa số chủ site không hay biết.
AI-readiness: site thiếu file llms.txt giống như mở tiệm mà không có bảng hiệu. Bot của Perplexity hay ChatGPT crawl vào, không biết trang nào là quan trọng, trang nào là phụ. Nên nó trích bừa hoặc không trích gì cả.

Muốn xem danh sách đầy đủ từng hạng mục trong mỗi mảng, đọc bài checklist audit website: ở đây mình chỉ cho bạn bức tranh tổng.

3 điểm tổng ghép từ gì + 16 agent chia nặng/nhẹ thế nào

Pipeline dùng 16 agent tổng cộng: 6 nặng (tốn tài nguyên, bỏ qua khi --fast) và 10 nhẹ (luôn chạy).

6 agent nặng (tốn tài nguyên, --fast bỏ để chạy nhanh):

seo-sitemap: crawl toàn bộ URL map
seo-performance: CrUX field data + Lighthouse lab
seo-images: scan alt/format/lazy trên toàn site
seo-backlinks: hồ sơ link inbound qua DataForSEO
seo-visual: screenshot + CLS scan
geo-platform-optimizer: kiểm tra hiện diện trên từng AI platform

10 agent nhẹ (nhanh + free, luôn chạy):

geo-technical: kỹ thuật + tốc độ (crawl/index/SSR/security/CWV)
geo-schema: schema cho máy hiểu
geo-crawlers: quyền truy cập bot AI (robots.txt)
geo-llmstxt: llms.txt
geo-brand-mentions: nhắc thương hiệu trên web
geo-accessibility: chuẩn WCAG
geo-compliance: GDPR/cookie/privacy
seo-audit: điều phối tổng (master)
seo-google: dữ liệu Google thật (GSC/CrUX/GA4)
seo-page: soi sâu trang mẫu

Technical + CWV (8 mảng có trọng số): Crawlability 0.20 · Indexation 0.20 · Security 0.10 · URL 0.10 · Mobile 0.10 · Core Web Vitals 0.15 · Schema-technical 0.10 · JS-rendering 0.05.
GEO/AEO (5 mảng): Brand Authority 0.30 · Platform Coverage 0.20 · Crawler Access 0.20 · llms.txt 0.15 · Schema-AI 0.15.
Overall (10 mảng): Technical 0.16 · Schema 0.12 · Sitemap 0.06 · Performance 0.12 · GEO 0.22 · Platform 0.06 · Brand 0.10 · Image 0.05 · Accessibility 0.06 · Compliance 0.05.

Nguồn: skills/seo-pipeline/references/composite-formula.md.

Chạy /seo-pipeline trên 3 site thật ra kết quả gì?

Terminal output khi chạy /seo-pipeline trên ongboit — Output thật khi chạy `/seo-pipeline`: 16 agent chạy song song.

Mình chạy /seo-pipeline trên 3 site khác loại của mình. Điểm thật, bấm “xem báo cáo” ở cột cuối để mở báo cáo đầy đủ:

Site	Loại	Overall	Technical	AI-search	Báo cáo
ongboit.com	blog kỹ thuật (VN)	62	73	57	xem báo cáo
thietbinenkhi.vn	bán thiết bị (VN)	63	71	62	xem báo cáo
adegagaucha.com	nhà hàng (Orlando, US)	66	72	61	xem báo cáo

Ba site, ba nền tảng, ba ngôn ngữ. Lệnh chạy y như nhau. Điểm bao nhiêu là tốt?

Điểm	Mức
90–100	Xuất sắc
75–89	Tốt
60–74	Khá
40–59	Yếu
dưới 40	Nguy

ongboit 62-66 là “khá, còn việc để làm”.

Để ý cột AI-search (điểm GEO): thấp hơn Technical ở cả 3 site (73→57, 71→62, 72→61). Nghĩa là site lên Google ổn nhưng chưa tối ưu cho AI search. Đúng loại lỗi mà chỉ audit có phần GEO mới bắt được. Bấm “xem báo cáo” để mở một báo cáo thật đầy đủ.

Báo cáo /seo-pipeline: 3 đồng hồ điểm + thẻ category của ongboit.com — Report thật của ongboit.com: 3 đồng hồ điểm tổng (Technical 73 · AI-search 57 · Overall 62) + điểm từng mảng. Đây là thứ bạn nhận sau 1 lệnh.

Chạy audit trên 3 site thuộc 3 ngành khác nhau, mình thấy rõ một chuyện: mỗi loại site lộ một bộ lỗi riêng. Cùng khung báo cáo 3 điểm (Overall / Technical / AI-search) + thẻ lỗi, nhưng vấn đề đào lên hoàn toàn khác nhau.

ongboit.com: blog kỹ thuật (VN) · Overall 62 · Nhóm lỗi: schema + thương hiệu/GEO. Thương hiệu bị phân mảnh do 2 thực thể publisher xung đột (Organization vs Person, kèm sai URL Facebook), chưa có FAQPage hay speakable markup.
thietbinenkhi.vn: thiết bị nén khí, có cửa hàng (local VN) · Overall 63 · Nhóm lỗi: local + bảo mật + tốc độ. Chưa có Google Business Profile, thiếu HSTS, TTFB ~1 giây.
adegagaucha.com: nhà hàng steakhouse Brazil tại Orlando, US · Overall 66 · Nhóm lỗi: local + schema/entity. Xếp #7–8 cho “brazilian steakhouse orlando” (~46.000 lượt hiện/90 ngày, chỉ ~2% click), entity graph chỉ có Facebook, schema bỏ qua chi nhánh Kissimmee.

3 loại site, 3 bộ lỗi khác nhau. Nhưng cùng 1 khung báo cáo: bạn biết chính xác cần vá chỗ nào, không cần đoán.

Báo cáo gồm những file nào? (cấu trúc output)

Mỗi lần chạy sinh 1 thư mục:

audits/yoursite.com/2026-06-03/
├── seo-audit_yoursite.com_2026-06-03.html   ← báo cáo chính (mở browser)
├── seo-audit_yoursite.com_2026-06-03.md     ← bản .md (bỏ vào ChatGPT/Claude)
├── seo-audit_yoursite.com_2026-06-03.pdf    ← tùy chọn (cờ --with-pdf)
├── fixes/                                    ← gói file sửa
└── workflow-report.md                        ← log chi phí + thời gian

Pipeline xuất 2 file song song:

File HTML tự chứa (~250-400KB): mở bằng bất kỳ trình duyệt nào, không cần server, không cần internet. Các phần trong HTML: tóm tắt điều hành · 3 đồng hồ điểm tổng (gauge chart SVG) · thẻ lỗi nhóm theo mức Critical/High/Medium/Low · Quick Wins (làm được trong 7 ngày) · điểm từng mảng dạng bảng · 7 biểu đồ SVG phân tích · định vị so đối thủ (nếu có DataForSEO) · gói autofix (23 fix phân 3 loại) · lộ trình 90 ngày · phụ lục (công thức điểm có trọng số, curl/grep log tái lập). Xuất thêm PDF với cờ --with-pdf.
File Markdown .md: cùng nội dung, format để bỏ vào ChatGPT/Claude hỏi thêm hoặc đưa Claude Code đọc và áp fix trực tiếp. Đây là file bạn dùng ở bước “đưa Claude Code sửa” bên dưới.

Trường coverage_gaps trong báo cáo liệt kê rõ phần nào bị bỏ qua do thiếu credential. Không bao giờ im lặng che giấu.

Đọc báo cáo + đưa Claude Code sửa thế nào?

Đây là phần quan trọng nhất. Một báo cáo đẹp mà không biết dùng thì vô nghĩa.

1. Đọc báo cáo

Mở file HTML. Trên cùng là 3 điểm tổng. Cuộn xuống là các thẻ lỗi, nhóm theo mức nghiêm trọng: Critical → High → Medium → Low. Mỗi thẻ có 3 phần bạn cần:

Vấn đề là gì (diễn đạt cho người, không phải mã lỗi).
Bằng chứng: URL, dòng header, đoạn HTML thật chứng minh lỗi.
Cách sửa: làm gì để hết.

Ví dụ một thẻ lỗi thật từ báo cáo ongboit, lỗi “Thiếu FAQPage schema dù bài đầy Q&A”:

Vấn đề: Bài viết có phần hỏi-đáp rõ ràng (thẻ <h3> dạng câu hỏi + đoạn trả lời ngay sau), nhưng không có FAQPage schema trong <head>. Google và các AI engine không “biết” đây là Q&A: chúng chỉ thấy văn bản bình thường.

Bằng chứng: curl -s https://ongboit.com/[slug]/ | grep -i '"@type"' → không trả về FAQPage. Trong khi đó HTML bài chứa 5 thẻ <h3> bắt đầu bằng dấu hỏi, đủ điều kiện để đánh dấu.

Cách sửa: Sinh block JSON-LD FAQPage chứa từng cặp question-answer từ nội dung bài, chèn vào <head>. File fix sinh sẵn trong gói AUTO-SAFE của báo cáo: upload lên là xong.

Rõ ràng, không mơ hồ. Mỗi thẻ đều có 3 phần đó: bạn không cần đoán xem lỗi có thật không.

Thẻ lỗi trong báo cáo: vấn đề, bằng chứng, time-to-fix, cách sửa — Thẻ lỗi thật: tiêu đề + mức (HIGH) · time-to-fix · confidence · bằng chứng · cách sửa kèm lệnh sẵn.

Vì sao tin được báo cáo này (mà không phải AI đoán bừa)? Trước khi xuất, kit chạy 10 cổng kiểm chứng: mỗi lỗi PHẢI có bằng chứng grep/curl thật trong HTML, cấm bịa số liệu, công thức điểm có log truy vết. Nếu một claim không có bằng chứng thì nó bị loại, không lên báo cáo. Nên khi bạn đưa báo cáo cho Claude Code sửa, bạn đang đưa dữ liệu thật, không phải lời “có vẻ đúng”.

2. Đưa cho Claude Code sửa: cái nào tự sửa, cái nào phải tự làm

Kit không chỉ chỉ lỗi. Nó sinh sẵn code/file để sửa, chia làm 3 loại. Bạn nhìn nhãn là biết mức can thiệp:

Gói fix 3 mức: AUTO-SAFE, AUTO-REVIEW, MANUAL — Gói fix 3 mức: 🤖 dùng luôn · 👁️ duyệt · 📋 tự làm. Danh mục ~23 loại: mỗi audit áp một phần.

🤖 AUTO-SAFE: file dùng được luôn, không cần duyệt. Ví dụ: llms.txt, schema JSON-LD, sitemap. Kit sinh sẵn, bạn (hoặc Claude Code) áp thẳng, gần như không phải chỉnh.
👁️ AUTO-REVIEW: bản nháp cần mắt người duyệt trước khi áp. Ví dụ: viết lại trang mỏng, alt text, gợi ý internal link.
📋 MANUAL: hướng dẫn tự làm, kit không tự động được. Ví dụ: cấu hình CDN, security header, chiến lược Reddit/Wikipedia.

Kit có danh mục khoảng 23 loại fix chia 3 mức như trên. Nhưng mỗi audit thật chỉ áp một phần, tùy lỗi site bạn đang dính. Ví dụ mình chạy ongboit ra 20 fix, không phải 23. Đừng tưởng audit nào cũng ra y số đó.

Các file sửa nằm gọn trong thư mục fixes/ (tên file minh họa):

fixes/
├── AUTO-SAFE/        🤖 dùng luôn
│   ├── llms.txt
│   ├── organization-schema.json
│   ├── faqpage-schema.json
│   └── image-sitemap.xml
├── AUTO-REVIEW/      👁️ duyệt trước khi áp
│   ├── alt-text-bulk.csv
│   └── internal-links-orphans.md
└── manual-guides/    📋 hướng dẫn tự làm
    ├── cdn-setup.md
    └── security-headers.md

Đưa Claude Code đúng cách: đưa gì + prompt nào?

Kit tự sinh sẵn file FIX-INSTRUCTIONS.md ngay trong folder audit. Đọc 30 giây là biết đưa gì, không phải đoán.

Nguyên tắc: chỉ đưa MỘT file, là seo-audit_[site]_[date].md. File đó đủ rồi: mọi finding P0→P3, fix kèm bằng chứng, Quick Wins, Roadmap 90 ngày, Autofix Bundle. Tùy chọn: thêm folder fixes/ nếu muốn Claude áp artifact thẳng (llms.txt, schema JSON-LD, sitemap).

Đừng đưa: phase*.json là data thô, nhiễu, không giúp gì. workflow-report.md chứa chi phí + balance DataForSEO của bạn: bỏ ra khi đưa cho AI hoặc gửi khách (đừng để khách thấy giá vốn). Bạn tự chạy tự xem thì bình thường, đó là data của mình. Để Claude áp được lên WordPress thì bật WP MCP trước.

Prompt mẫu (kit tạo sẵn bản đầy đủ tiếng Anh trong FIX-INSTRUCTIONS.md):

Đọc report đính kèm, tóm tắt P0/P1 + Quick Wins, chưa đổi gì.
Đề xuất thứ tự xử lý (P0→P1→Quick Wins→P2), chờ mình OK rồi mới chạy.
Áp theo 3 loại:
  - AUTO-SAFE artifact → áp thẳng
  - Content/meta → tạo DRAFT, đừng publish live
  - MANUAL → chỉ đưa bước, mình tự làm
Sau mỗi fix: verify bằng curl/grep đúng tín hiệu finding đo, báo pass/fail kèm bằng chứng.
Không bịa kết quả cho "pass". Việc khó undo hoặc public → hỏi trước.
Giữ checklist [finding id] → applied / drafted / skipped.

Cách này an toàn vì Claude tóm tắt trước, tạo draft thay vì đẩy live, và verify từng bước bằng bằng chứng thật. Không phải “có vẻ xong”.

Với ongboit, mình map các lỗi thật vào 3 tier như này:

AUTO-SAFE: FAQPage schema · speakable markup · image sitemap. Ba cái này kit sinh file JSON-LD và XML sẵn, Claude Code upload một lần là xong.
MANUAL: CDN (cần trỏ DNS + cấu hình Cloudflare/BunnyCDN) · cookie consent banner (cần chọn plugin, cấu hình whitelist GA4) · thực thể Wikipedia/Wikidata (cần tạo trang Wikipedia hoặc Wikidata item, đây là quyết định chiến lược, không phải sửa code).

Cách mình thực sự làm với báo cáo ongboit:

Mở file seo-audit_ongboit.com_2026-06-03.md trong Claude Code.
Nhắn Claude Code: “Đọc báo cáo này. Liệt kê tất cả fix nhãn AUTO-SAFE, rồi áp lần lượt lên WordPress của mình qua WP MCP.”
Claude Code đọc từng thẻ lỗi AUTO-SAFE, lấy block code fix đính kèm sẵn trong báo cáo, gọi WP MCP để chèn JSON-LD vào <head> từng bài.
Xong AUTO-SAFE, mình mở phần AUTO-REVIEW, đọc từng cái. Cái nào mình gật đầu thì bảo Claude Code áp. Cái nào mình thấy cần chỉnh thì sửa tay trước.
Phần MANUAL: mình xắn tay làm riêng, theo đúng hướng dẫn từng bước trong báo cáo.

Cả quy trình AUTO-SAFE mất khoảng 15-20 phút. Không cần biết code WordPress internals, không cần vào WP admin sửa từng bài.

3. Sửa xong rồi sao? Chạy lại để chắc

Sau khi áp fix, chạy lại với cờ --baseline trỏ vào báo cáo cũ:

/seo-pipeline yoursite.com --baseline ./bao-cao-cu.html

Kit sẽ đối chiếu từng lỗi cũ: cái nào đã fixed, cái nào còn. Bạn thấy điểm nhích lên, biết công sức có tác dụng. Ví dụ site mình thiếu schema, áp fix AUTO-SAFE rồi chạy lại: mảng Schema từ “yếu” lên “tốt”, điểm Overall tăng. Vòng lặp: chạy → đọc → sửa → chạy lại.

Vòng lặp audit: chạy đến đọc report đến fix (auto/review/manual) đến re-audit đến lặp — Vòng lặp: chạy → đọc → fix (🤖 auto · 👁️ review · 📋 manual) → re-audit, lặp đến khi điểm xanh.

Không có API trả phí thì có audit được không?

Được. Kit tự nhận bạn có gì rồi chạy ở mức tương ứng. Không có tool trả phí nào, nó vẫn ra báo cáo đầy đủ cấu trúc bằng cách tự đọc HTML site. Thêm tool trả phí thì audit sâu hơn: có dữ liệu SERP thật, crawl được toàn site.

Ví dụ: bạn mới cài kit, chưa nối DataForSEO. Vẫn chạy được, vẫn chấm điểm. Chỉ là phần “đối thủ xếp hạng ra sao” sẽ mỏng hơn. Báo cáo tự ghi rõ phần nào bị bỏ qua (mục coverage_gaps), không giấu.

4 mức năng lực T1–T4: mỗi mức có/mất gì

T1 (đủ nhất): GSC OAuth + WP MCP + DataForSEO + Chrome DevTools → GSC thật + backend WP + SERP + CWV field thật. Phần backlink, SERP đối thủ, field data CrUX đều có đủ. Autofix đẩy thẳng lên WP qua MCP.
T2: DataForSEO + Firecrawl → SERP ngoài + crawl toàn site. GSC không có, CWV dùng Lighthouse lab thay field. Vẫn audit được backlink và đối thủ.
T3: chỉ Firecrawl → crawl công khai. Không có SERP, không có backlink thật. Vẫn đủ để audit kỹ thuật, schema, GEO, compliance.
T4: không có gì → tự curl + grep, vẫn chạy hết luồng. Output mỏng nhất nhưng vẫn ra báo cáo đầy đủ cấu trúc. Thích hợp để demo nhanh hoặc audit site lạ không cần đăng nhập.

4 mức năng lực T1-T4 theo tool có sẵn — 4 mức T1-T4: càng nhiều tool, audit càng sâu.

Chỉ fail cứng khi --mode first mà mất mạng. --mode article (audit 1 trang) chạy được cả ở T4. Báo cáo luôn ghi rõ đang ở tier nào và phần nào bị giới hạn, không bao giờ giả vờ có dữ liệu mà thực ra không có.

Dùng /seo-pipeline trong tình huống nào?

Ba nhóm tình huống hay gặp:

Audit site của chính mình. Lần đầu để biết hiện trạng, rồi mỗi tháng chạy lại xem nhích chưa. Ví dụ: mình chạy ongboit mỗi đợt sau khi xuất một loạt bài, xem có sinh lỗi index không.
Audit cho khách (agency/freelancer). Khách chỉ đưa URL là chạy được. Demo trong cuộc gọi 30 phút thì thêm --fast cho nhanh. Giữ khách hàng tháng thì chạy --baseline để show “tháng này tụi tôi fix được gì”. Quản nhiều site khách thì thêm cờ --client tên-khach: mỗi khách ra thư mục riêng sites/[khach]/, report và baseline không lẫn nhau.
Trước khi launch / sau khi đổi nền tảng. Redesign xong, audit trước go-live để khỏi mất thứ hạng. Đổi từ Wix sang WordPress chẳng hạn, chạy lại để bắt link gãy, redirect thiếu.

4 mode + audit site khách (chỉ cần quyền view)

4 mode (kit tự nhận, hiếm khi cần gõ tay):

first: audit đầy đủ lần đầu
monthly: delta nhẹ so baseline tháng trước
reaudit: cần --baseline, đối chiếu fix từng lỗi
article: 1 trang (URL có path → tự hiểu)

Audit site khách bạn không sở hữu: kit chỉ ĐỌC, nên quyền view là đủ. Audit công khai (đọc HTML qua curl/Firecrawl) chạy được ngay với bất kỳ URL nào, không cần login, không cần truy cập hosting. Muốn có dữ liệu GSC thật của khách thì nhờ họ Add bạn vào Search Console (quyền Restricted là đủ). Muốn autofix đẩy lên WP của khách thì cần WP Application Password từ họ.

Flag nâng cao + tình huống khác

Agency nhiều khách: --client tên-khach: mỗi khách thư mục riêng sites/[khach]/, report + baseline không lẫn nhau. Thêm --with-pdf để xuất PDF gửi khách; gắn brand agency qua file BRAND.md.

Audit 1 bài theo từ khóa: --keyword "từ khóa" + URL 1 trang. Kit check trang đó có đang lên top từ khóa không (phân tích intent/SXO), thay vì crawl toàn site.

Site khổng lồ:

--max-urls N (mặc định 1000)
--max-depth N
--crawl-speed N (URL/phút, đừng để 0 với site lạ)
--no-crawl (bỏ crawl, chỉ audit mẫu)
--respect-robots (tôn trọng robots.txt)

Chạy tự động / CI:

--resume (chạy tiếp khi crash)
--resume-from PHASE
--dry-run (in kế hoạch không chạy)
--fixes-only (chỉ sinh lại fixes/)
--agent-timeout-min N

Ép nhận diện (hiếm, kit tự đoán, chỉ dùng khi kit đoán sai):

--business saas|local|ecommerce|publisher|b2b
--market
--goal
--competitors

Theo dõi hàng tháng: --mode monthly (tự bật nếu có audit ≤60 ngày): bản delta nhẹ ~30-45 phút.

Re-audit có đối chiếu: --baseline báo-cáo-cũ.html. Kit dựng “verification matrix”: từng lỗi cũ đánh dấu fixed / partial / notfixed. Khách hỏi “fix xong chưa”: chỉ file đó là xong.

Site KHÔNG phải WordPress (Next.js, Hugo, static): fix AUTO-SAFE là file thường (llms.txt, schema, sitemap), bỏ thẳng vào repo, không cần WP MCP. Chỉ tính năng đẩy thẳng lên WP mới cần WP MCP.

Site staging: chạy được với URL staging, nhưng coi chừng staging hay bật noindex / chặn bot. Điểm crawl thấp giả, không phản ánh production.

Khi nào KHÔNG nên dùng? (giới hạn thật)

Mình thích kit này, nhưng nói thẳng nó không phải đũa thần:

Không thay tool crawl khổng lồ. Site 100.000+ URL cần Screaming Frog / Sitebuld crawl chuyên sâu. Kit lấy mẫu trang đại diện, không bò hết từng URL.
Không có dữ liệu lịch sử/rank-tracking. Muốn theo dõi thứ hạng từ khóa qua từng ngày thì vẫn cần Ahrefs/Semrush. Kit chụp ảnh hiện trạng tại thời điểm chạy.
Phần GEO còn mới. Cách AI search index/trích dẫn đang thay đổi liên tục. Điểm GEO là tín hiệu định hướng, không phải con số tuyệt đối.
Không tự đẩy fix lên hộ bạn. Mặc định kit chỉ sinh file fix; bạn (hoặc Claude Code) quyết định áp. Đây là chủ đích, để không có cái gì tự đổi site mà bạn không biết.
Cần Claude Code subscription. Đây là kit chạy trên Claude Code, không phải web app bấm nút.

/seo-pipeline tốn bao nhiêu tiền?

Chi phí chính là Claude Code subscription: gói Pro $20/tháng là tối thiểu để chạy. DataForSEO là tùy chọn (nạp tối thiểu $50, trả theo dùng, vài cents mỗi lần audit), thêm vào khi muốn dữ liệu SERP/đối thủ. So với Ahrefs hay Semrush ~$100+/tháng cố định, đây là khác biệt đáng kể.

Để bắt đầu, bạn cần cài kit + nối vài thứ một lần cho máy. Mình đã viết chi tiết từng bước trong bài setup tool/API/MCP cho claude-growth: làm theo là chạy được /seo-pipeline.

Lỗi hay gặp khi chạy /seo-pipeline

Gõ /seo-pipeline không thấy gì. Kit chưa cài, hoặc bạn mở Claude Code trước khi cài xong. Skills load lúc khởi động, restart Claude Code là ra.
Audit lâu 90-120 phút. Thêm --fast còn ~30 phút (bỏ 6 agent nặng). Đổi lại: vài phân tích sâu sẽ thiếu, nhưng P0 vẫn đủ.
Report báo “GSC/DataForSEO unavailable” dù bạn chắc đã nối. Không phải lỗi cấu hình. Agent xác thực phải chạy main-thread, restart + chạy lại là sạch. Mình từng bị: GSC báo unavailable trong khi property thật trả 737 clicks/90 ngày.
Điểm tổng 40-60, trông thấp. Bình thường, đừng hoảng. Site chưa tối ưu hay ra vùng đó. Sửa P0 trước, không cần đuổi điểm hoàn hảo.
“Phải fix hết không?” Không. Ưu tiên P0 → Quick Wins, phần còn lại theo roadmap tháng. Report có sẵn phân nhóm ưu tiên.
DataForSEO hết balance giữa chừng. Pipeline không vỡ. Phần thiếu để N/A + ghi rõ coverage_gaps, phần còn lại vẫn chạy.
Audit crash giữa chừng. Chạy lại --resume: kit tiếp từ phase dở, không làm lại từ đầu.

Câu hỏi thường gặp về /seo-pipeline

Mình không rành code có dùng được không?

Được phần lớn. Chạy lệnh + đọc báo cáo thì ai cũng làm được. Phần áp fix MANUAL (CDN, security header) cần người quen kỹ thuật. Nhưng đó cũng là lúc bạn đưa hướng dẫn của kit cho Claude Code làm hộ.

Audit 1 lần mất bao lâu?

Bản đầy đủ ~90-120 phút (16 agent chạy hết). Thêm --fast còn ~30 phút (bỏ 6 agent nặng). Audit 1 trang lẻ thì 5-10 phút.

Chạy lại bao lâu 1 lần?

Mình dùng lịch như này: mỗi tháng 1 lần audit đầy đủ (--mode monthly) để bắt drift. Sau mỗi lần áp fix lớn thì chạy --baseline ngay để xác nhận điểm có nhích không. Sau mỗi lần publish loạt bài mới thì chạy nhanh --fast để bắt lỗi index sớm. Bạn không cần chạy liên tục: site không đổi thì báo cáo cũng gần như y nhau.

Báo cáo có hợp với site tiếng Việt không?

Có. Kit chạy được với mọi ngôn ngữ. Bảng thang điểm và công thức không phụ thuộc vào ngôn ngữ. Phần GEO kiểm tra bot access và schema cũng áp dụng y như nhau cho site tiếng Việt. Chỉ phần “đối thủ” trong SERP cần DataForSEO có data cho thị trường VN: DataForSEO có đủ dữ liệu Google.com.vn.

Fix tự động (AUTO-SAFE) có làm hỏng site không?

Rủi ro rất thấp, vì AUTO-SAFE chỉ thêm (không xóa, không sửa HTML hiện có). Ví dụ: thêm JSON-LD vào <head>, thêm file llms.txt, thêm image sitemap. Tệ nhất là schema sai format thì Google bỏ qua, site không hỏng. Nhưng trước khi Claude Code áp, mình vẫn nhờ nó xem lại danh sách file sẽ thay đổi. An toàn hơn thì commit lên git trước, áp xong rollback được nếu cần.

Báo cáo có cho khách xem được không?

Được. File HTML tự chứa, gửi thẳng cho khách hoặc bỏ lên hosting. Xuất PDF (cờ --with-pdf) nếu cần bản in cho buổi họp.

Site không phải WordPress có audit được không?

Được. Phần đọc HTML + chấm điểm chạy với mọi nền tảng (Shopify, Webflow, Next.js, static). Chỉ tính năng tự đẩy fix lên là riêng WordPress.

Khác gì so với chỉ hỏi ChatGPT “audit site giúp tôi”?

Khác ở bằng chứng. ChatGPT nhìn vài thứ rồi đoán. Kit chạy 16 agent, mỗi lỗi có bằng chứng grep/curl thật, qua 10 cổng kiểm chứng cấm bịa số. Đó là lý do báo cáo đủ tin để đưa lại cho AI sửa.

Audit nội dung blog thì sao?

Bài này lo hạ tầng site. Soi từng bài viết (chất lượng, E-E-A-T, độ trích dẫn AI) là việc của blog-audit-pipeline: xem bài riêng.

FAQ khi audit cho khách / quản nhiều site

Bạn mua kit có thể audit nhiều site của mình, hoặc chạy cho khách như một agency. Mấy câu hay gặp khi làm vậy:

Số trong report là thật hay AI bịa ra?

Thật. Kit dùng 16 agent độc lập, mỗi lỗi có bằng chứng curl/grep cụ thể đính kèm, qua 10 cổng kiểm chứng. Cổng nào không có bằng chứng thật thì không được ghi vào report.

Data site (của mình hoặc của khách) có bị gửi đi đâu không?

Không. Kit chạy hoàn toàn local trên máy bạn, chỉ đọc URL công khai của site (đúng như Googlebot). Report là file trên máy bạn, không upload đi đâu.

Khác gì thuê người dùng Ahrefs hay Semrush?

Ba thứ Ahrefs/Semrush không làm: phân tích GEO (ChatGPT/Perplexity có trích site bạn không), sinh code fix sẵn để áp luôn, và gói toàn bộ thành 1 lệnh ra báo cáo + roadmap trong 1-2 giờ.

Fix xong bao lâu thấy kết quả?

Tùy lỗi: fix kỹ thuật nặng có thể vài tuần, fix nội dung nhẹ hơn. Chạy lại --baseline để so điểm trước–sau bằng số, không nói miệng.

Mình quản nhiều site, audit từng site có lẫn lộn không?

Không. Thêm cờ --client tên-site cho mỗi site: mỗi site ra một thư mục riêng sites/[tên]/, report và lịch sử baseline tách bạch, không lẫn nhau.

Làm cho khách: report gắn brand mình được không?

Có. Cấu hình qua file BRAND.md: logo, tên, màu gắn vào report trước khi gửi khách.

Tóm lại

Cả hành trình gói gọn trong một vòng: gõ 1 lệnh, đọc báo cáo 3 điểm, đưa báo cáo cho Claude Code áp fix, rồi chạy lại để xác nhận điểm nhích. Không cần mở 5-6 tab tool, không tự ghép số liệu.

Điểm khác biệt là báo cáo soi cả hai mặt cùng lúc: SEO truyền thống (lên Google) và GEO (ChatGPT, Perplexity, AI Overview có trích site bạn không). Đa số tool cũ chỉ nhìn nửa bức tranh, nên bạn vá xong vẫn hụt phần AI search.

Bắt đầu nhẹ nhàng: làm theo bài setup tool/API/MCP một lần cho máy, rồi chạy thử /seo-pipeline site.com --fast để xem báo cáo ra sao trước khi chạy đầy đủ.

Để hiểu sâu cơ chế hoạt động và tác động SEO của tính năng này, đọc thêm bài kiến thức AI Overview — giải thích chi tiết Gemini pipeline, so sánh với ChatGPT Search/Perplexity, và 5 giới hạn thật.