Skill Forge: Tạo Claude Code Skill Chuyên Nghiệp Từ A-Z (2026)

Theo Stack Overflow Developer Survey 2025, 82% developer sử dụng AI coding tools ít nhất một lần mỗi tuần. Claude Code nằm trong top 3 công cụ phổ biến nhất. Nhưng mình nhận thấy một vấn đề: tạo Skills chất lượng cao vẫn là quá trình thủ công, tốn thời gian và thiếu chuẩn hóa.
Skill Forge giải quyết đúng pain point này. Đây là bộ công cụ mã nguồn mở giúp bạn plan, build, review, evolve, và publish Claude Code Skills theo quy trình chuyên nghiệp. Thay vì viết SKILL.md bằng tay rồi hy vọng nó hoạt động tốt, bạn có pipeline hoàn chỉnh với health score, eval assertions, và benchmark testing.
Bài viết này hướng dẫn bạn sử dụng Skill Forge từ A đến Z. Từ cài đặt, 8 lệnh chính, 4 complexity tiers, đến ví dụ thực tế tạo DevOps Skill Tier 3. Nếu bạn đã biết cách tạo skill thủ công, đây là bước tiến tiếp theo.
Skill Forge là bộ công cụ mã nguồn mở với 8 lệnh và 4 complexity tiers để tạo Claude Code Skills chuyên nghiệp. Review cho health score 0-100, eval pipeline kiểm tra chất lượng, và convert cross-platform sang Codex, Gemini CLI, Cursor. Cài đặt chỉ cần git clone + bash install.sh. Theo GitHub repo, tool hỗ trợ từ skill đơn giản đến hệ thống enterprise-grade.
slash commands
tiers
review audit
cross-platform





Skill Forge Là Gì Và Tại Sao Bạn Cần Nó?
Skill Forge là bộ công cụ mã nguồn mở trên GitHub, cung cấp 8 lệnh để tạo, kiểm tra và phân phối Claude Code là gì Skills theo quy trình chuẩn hóa. Theo Stack Overflow Developer Survey 2025, 76% developer cho rằng AI tools cần có workflow có cấu trúc để đảm bảo chất lượng đầu ra (Stack Overflow, 2025).
Hãy hình dung thế này. Bạn đã biết cách viết file SKILL.md bằng tay. Bạn cũng biết cách dùng slash commands để gọi skill. Nhưng khi số lượng skill tăng lên, bạn gặp vấn đề: skill nào viết tốt, skill nào cần sửa? Làm sao đo lường chất lượng? Làm sao chia sẻ cho team?
Skill Forge trả lời tất cả các câu hỏi đó. Nó cung cấp pipeline hoàn chỉnh gồm 8 giai đoạn: Plan, Build, Review, Evolve, Publish, Convert, Eval, Benchmark. Mỗi giai đoạn là một lệnh riêng, chạy độc lập hoặc nối tiếp nhau.
Vấn đề khi tạo skill thủ công
Mình đã từng tạo hơn 10 skill bằng tay trong vài tháng đầu dùng Claude Code. Kết quả? Một số skill chạy rất tốt, một số thì output không ổn định. Không có cách nào biết skill nào cần cải thiện, ngoài việc chạy thử rồi đoán.
Skill Forge giải quyết vấn đề này bằng health score 0-100. Nó đánh giá skill theo 6 tiêu chí chất lượng, từ cấu trúc frontmatter đến độ rõ ràng của instructions. Bạn biết chính xác điểm yếu nằm ở đâu và cần sửa gì.
Cài Đặt Skill Forge Như Thế Nào?
Quá trình cài đặt chỉ mất khoảng 2 phút với 3 lệnh terminal. Theo tài liệu chính thức, Skill Forge yêu cầu Git, Bash, và Claude Code đã cài sẵn trên máy. Không cần Docker hay dependencies phức tạp nào khác.
Bước 1: Clone repository
Mở terminal và chạy lệnh sau:
git clone https://github.com/AgriciDaniel/skill-forge.git
cd skill-forge
Bước 2: Chạy install script
Script cài đặt sẽ tự động copy slash commands vào thư mục .claude/commands/ của bạn:
bash install.sh
Sau khi chạy xong, bạn có thể gọi /skill-forge trực tiếp trong Claude Code. Lệnh này mở interactive wizard, hướng dẫn bạn từng bước.
Bước 3: Kiểm tra cài đặt
Gõ /skill-forge trong Claude Code. Nếu thấy menu wizard hiện ra với danh sách 8 lệnh, bạn đã cài thành công. Nếu báo lỗi “command not found”, kiểm tra lại đường dẫn .claude/commands/ trong home directory.
bash install.sh trong Git Bash hoặc WSL. PowerShell thuần sẽ không chạy được shell script này.

8 Lệnh Skill Forge Gồm Những Gì?
Skill Forge cung cấp 8 lệnh chuyên biệt, mỗi lệnh đảm nhận một giai đoạn trong lifecycle của skill. Theo GitHub repo, tất cả 8 lệnh đều chạy qua prefix /skill-forge và có thể kết hợp tuần tự thành pipeline hoàn chỉnh.
Workflow phổ biến nhất là: plan → build → review → evolve → publish. Bạn không cần dùng hết 8 lệnh cho mọi skill. Skill đơn giản chỉ cần build + review là đủ.
Lệnh nào quan trọng nhất?
Theo kinh nghiệm của mình, review và evolve là hai lệnh bạn sẽ dùng nhiều nhất. Review cho bạn health score để biết skill đang ở đâu. Evolve tự động cải thiện dựa trên feedback. Hai lệnh này tạo thành vòng lặp liên tục: review, sửa, review lại.
Còn convert thì đặc biệt hữu ích nếu team bạn dùng nhiều AI tools khác nhau. Viết skill một lần cho Claude Code, rồi convert sang Codex, Gemini CLI, Antigravity, hoặc Cursor. Không cần viết lại từ đầu cho mỗi nền tảng.
4 Complexity Tiers: Nên Chọn Tier Nào?
Skill Forge phân loại skill thành 4 complexity tiers, từ đơn giản đến enterprise-grade. Theo tài liệu Skill Forge, khoảng 70% use cases chỉ cần Tier 1 hoặc Tier 2. Tier 3 và 4 dành cho hệ thống phức tạp cần orchestration và multi-agent.
Tier 1: Minimal, bắt đầu từ đây
Tier 1 chỉ có một file SKILL.md duy nhất. Không scripts, không sub-skills, không phức tạp gì cả. Đây là điểm khởi đầu cho hầu hết mọi người. Ví dụ: skill viết commit message, skill tạo PR description, skill format code theo convention.
Bạn sẽ ngạc nhiên với mức độ hiệu quả của Tier 1. Chỉ cần instructions rõ ràng trong SKILL.md, Claude Code đã có thể thực hiện tốt phần lớn tác vụ lặp lại. Đừng nhảy lên Tier 2 trước khi thực sự cần scripts.
Tier 2: Workflow, khi cần logic xác định
Tier 2 thêm thư mục scripts/ chứa các file bash hoặc python. Khi nào cần? Khi bạn muốn validation mà LLM không nên làm: kiểm tra syntax, chạy linter, đọc database schema. Logic xác định nên đẩy vào scripts, không phải prompt.
Ví dụ, mình có skill review blog post. SKILL.md chứa instructions cho Claude, còn scripts/analyze_blog.py chạy phân tích readability score. Claude đọc kết quả script rồi đưa ra gợi ý. Deterministic work trong code, quyết định trong LLM.
Tier 3: Multi-Skill cho domain phức tạp
Tier 3 giới thiệu khái niệm orchestrator và sub-skills. Một skill chính điều phối nhiều skill con. Ví dụ: DevOps toolkit gồm sub-skills cho Docker, Kubernetes, monitoring. Orchestrator quyết định gọi sub-skill nào dựa trên context.
Mô hình này giống Sub-agents trong Claude Code. Skill chính là conductor, sub-skills là musicians. Khi user yêu cầu “deploy lên k8s”, orchestrator gọi sub-skill Kubernetes. Khi yêu cầu “check logs”, nó gọi sub-skill monitoring.
Tier 4: Ecosystem, dành cho enterprise
Tier 4 là cấp cao nhất, bao gồm full system với agents, governance policies, và cross-team coordination. Phần lớn developer cá nhân không cần đến tier này. Nó dành cho tổ chức lớn muốn chuẩn hóa AI workflow trên toàn bộ engineering team.

Tạo Skill Đầu Tiên Với /skill-forge build Thế Nào?
Lệnh /skill-forge build scaffold toàn bộ cấu trúc thư mục và file SKILL.md cho bạn. Theo tài liệu Skill Forge, build command tự động tạo đúng cấu trúc theo tier bạn chọn, bao gồm frontmatter, references, và scripts nếu cần.
Build skill Tier 1
Cách đơn giản nhất là gọi build trong Claude Code:
/skill-forge build commit-message
Skill Forge sẽ hỏi bạn vài câu: mô tả skill làm gì, tier nào, cần allowed-tools gì. Sau đó nó tạo file .claude/skills/commit-message/SKILL.md với frontmatter đầy đủ và body instructions.
Build skill với plan trước
Với skill phức tạp hơn, nên chạy plan trước build:
/skill-forge plan devops
# Claude phân tích domain, đề xuất kiến trúc
# Sau đó:
/skill-forge build devops-toolkit
Plan command phân tích domain bạn chọn, đề xuất nên dùng tier nào, cần bao nhiêu sub-skills, và kiến trúc tổng thể. Đây là bước quan trọng cho Tier 3 và Tier 4.
Quick scaffold bằng CLI script
Nếu muốn nhanh hơn, Skill Forge cũng cung cấp Python script cho việc scaffold:
python skill-forge/scripts/init_skill.py devops-toolkit --tier 3 --sub docker,k8s,monitor
Lệnh này tạo ngay thư mục skill với orchestrator và 3 sub-skills (docker, k8s, monitor). Bạn chỉ cần mở file SKILL.md và điền instructions cụ thể cho từng sub-skill. Tiết kiệm rất nhiều thời gian so với tạo tay từng file.
/skill-forge review để kiểm tra health score. Skill mới build thường đạt 50-70 điểm. Dùng evolve để nâng lên 80+ trước khi sử dụng thực tế.

Review Và Evolve: Nâng Cấp Skill Như Thế Nào?
Lệnh /skill-forge review đánh giá skill theo 6 tiêu chí chất lượng, cho health score từ 0 đến 100. Theo Skill Forge docs, skill đạt trên 80 điểm được coi là production-ready. Dưới 60 điểm cần cải thiện đáng kể.
6 tiêu chí health score
Review command phân tích skill qua 6 khía cạnh:
- Cấu trúc frontmatter: Đầy đủ fields bắt buộc? Đúng format YAML?
- Độ rõ ràng instructions: Claude có hiểu chính xác cần làm gì không?
- Scope phù hợp: Skill có quá rộng hoặc quá hẹp không?
- Error handling: Có xử lý edge cases không?
- Testability: Có thể viết eval assertions không?
- Reusability: Skill có tái sử dụng được trong nhiều context không?
Cách dùng review
/skill-forge review .claude/skills/commit-message/
Output sẽ hiển thị điểm tổng, điểm từng tiêu chí, và danh sách cụ thể những gì cần sửa. Ví dụ: “Frontmatter thiếu allowed-tools field (trừ 5 điểm)”, “Instructions quá mơ hồ ở section 3 (trừ 10 điểm)”.
Evolve: tự động cải thiện
Sau khi review, chạy evolve để Skill Forge tự động cải thiện dựa trên feedback:
/skill-forge evolve .claude/skills/commit-message/
Evolve đọc kết quả review, sửa từng vấn đề được chỉ ra, rồi chạy review lại. Quá trình này có thể lặp nhiều lần cho đến khi đạt threshold bạn đặt. Mình thường để threshold 85 điểm.
Cách tiếp cận “review rồi evolve” này rất giống evaluator-optimizer pattern trong AI engineering. Bạn có thể đọc thêm về Skills vs Hooks vs MCP để hiểu cách kết hợp skill với các thành phần khác trong Claude Code.

Publish Và Convert Cross-Platform Được Không?
Lệnh /skill-forge publish đóng gói skill thành package sẵn sàng phân phối. /skill-forge convert chuyển đổi skill sang 5+ nền tảng AI khác. Theo Skill Forge, convert hỗ trợ Codex CLI, Gemini CLI, Antigravity, Cursor, và có thể mở rộng thêm.
Publish: đóng gói để chia sẻ
/skill-forge publish .claude/skills/commit-message/
Publish tạo package gọn gàng, bao gồm tất cả file cần thiết: SKILL.md, scripts, references, và metadata. Bạn có thể push package này lên GitHub, share qua npm, hoặc đơn giản copy vào repo của team. Ai clone repo về là có skill sẵn.
Convert: một lần viết, nhiều nền tảng dùng
/skill-forge convert .claude/skills/commit-message/ --target codex
Convert phân tích skill của bạn và tạo phiên bản tương đương cho nền tảng đích. Mỗi nền tảng có format riêng: Codex dùng agents.md, Gemini CLI dùng custom instructions, Cursor dùng .cursorrules. Skill Forge xử lý hết phần chuyển đổi.
Tại sao tính năng này quan trọng? Vì trong thực tế, team bạn có thể dùng Claude Code, nhưng đối tác lại dùng Cursor hay Codex. Viết skill một lần, convert ra nhiều format, ai cũng dùng được cùng workflow.
Eval Và Benchmark: Kiểm Tra Chất Lượng Như Thế Nào?
Eval pipeline chạy test assertions trên output của skill, còn benchmark thực hiện multiple trials với variance analysis. Theo Skill Forge documentation, eval hỗ trợ assertions, grading rubrics, và multi-agent execution để đảm bảo skill hoạt động đúng trong mọi scenario.
Eval: kiểm tra output có đúng không
/skill-forge eval .claude/skills/commit-message/
Eval chạy skill với các test cases bạn định nghĩa, rồi kiểm tra output theo assertions. Ví dụ: skill commit-message phải output đúng Conventional Commits format, không quá 72 ký tự ở dòng đầu, có scope nếu được cung cấp.
Bạn viết assertions trong file eval config. Mỗi assertion kiểm tra một khía cạnh cụ thể của output. Nếu bất kỳ assertion nào fail, eval report chỉ ra chính xác vấn đề ở đâu.
Benchmark: đo performance qua nhiều lần chạy
/skill-forge benchmark .claude/skills/commit-message/
Benchmark khác eval ở chỗ nó chạy nhiều trials (thường 5-10 lần), rồi phân tích variance. LLM output không deterministic, nên cùng một input có thể cho output khác nhau mỗi lần. Benchmark đo mức độ ổn định đó.
Kết quả benchmark bao gồm: mean score, standard deviation, và threshold gating. Nếu variance quá cao (output quá khác nhau giữa các lần chạy), benchmark fail. Bạn cần quay lại sửa instructions cho rõ ràng hơn.
Khi nào dùng eval, khi nào dùng benchmark?
Dùng eval khi bạn muốn kiểm tra “output có đúng không”. Dùng benchmark khi bạn muốn kiểm tra “output có ổn định không”. Trong thực tế, nên chạy eval trước. Nếu eval pass, chạy thêm benchmark để đảm bảo độ ổn định. Đặc biệt quan trọng với skill Tier 3-4 phức tạp.
Quy trình eval-benchmark này giống cách mình kiểm tra Hooks trong Claude Code. Viết test, chạy nhiều lần, đo variance. Không có gì mới, chỉ là best practice được đóng gói sẵn.
Ví Dụ Thực Tế: Tạo DevOps Skill Tier 3 Như Thế Nào?
Mình sẽ hướng dẫn tạo một DevOps toolkit Tier 3 với orchestrator và 3 sub-skills. Đây là ví dụ thực tế mình đã dùng trong project của mình, cho health score 87/100 sau 2 vòng evolve.
Bước 1: Plan domain
/skill-forge plan devops
Skill Forge phân tích domain “devops” và đề xuất kiến trúc Tier 3 với 3 sub-skills: docker (build + deploy containers), k8s (Kubernetes management), monitor (log analysis + alerting). Orchestrator nhận yêu cầu từ user và route đến sub-skill phù hợp.
Bước 2: Scaffold với init script
python skill-forge/scripts/init_skill.py devops-toolkit --tier 3 --sub docker,k8s,monitor
Script tạo cấu trúc thư mục sau:
.claude/skills/devops-toolkit/
├── SKILL.md # Orchestrator chính
├── scripts/
│ └── validate.sh # Validation scripts
├── sub-skills/
│ ├── docker/
│ │ └── SKILL.md # Docker sub-skill
│ ├── k8s/
│ │ └── SKILL.md # Kubernetes sub-skill
│ └── monitor/
│ └── SKILL.md # Monitoring sub-skill
└── references/
└── conventions.md # Shared conventions
Bước 3: Viết orchestrator SKILL.md
File SKILL.md chính đóng vai orchestrator. Nó chứa routing logic: khi user hỏi về containers thì gọi docker sub-skill, khi hỏi về deployment thì gọi k8s sub-skill. Ví dụ:
---
name: devops-toolkit
description: DevOps orchestrator cho Docker, K8s, và Monitoring
tier: 3
sub-skills:
- docker
- k8s
- monitor
allowed-tools:
- Bash
- Read
- Write
---
## Routing Rules
- Nếu user hỏi về container, image, Dockerfile → gọi sub-skill docker
- Nếu user hỏi về deploy, pod, service, ingress → gọi sub-skill k8s
- Nếu user hỏi về logs, metrics, alerts → gọi sub-skill monitor
- Nếu không rõ → hỏi user để clarify
## Shared Conventions
Đọc file references/conventions.md trước khi thực hiện bất kỳ tác vụ nào.
Luôn kiểm tra scripts/validate.sh sau khi tạo config files.
Bước 4: Review và evolve
# Review lần 1
/skill-forge review .claude/skills/devops-toolkit/
# Kết quả: 68/100 - thiếu error handling, sub-skills quá mơ hồ
# Evolve tự động sửa
/skill-forge evolve .claude/skills/devops-toolkit/
# Review lần 2
/skill-forge review .claude/skills/devops-toolkit/
# Kết quả: 87/100 - production-ready
Sau 2 vòng review-evolve, skill đạt 87 điểm. Evolve đã tự động thêm error handling vào orchestrator, làm rõ routing rules, và bổ sung edge case handling cho từng sub-skill. Quá trình này mất khoảng 5 phút.
Bước 5: Eval và benchmark
# Kiểm tra output
/skill-forge eval .claude/skills/devops-toolkit/
# Đo độ ổn định
/skill-forge benchmark .claude/skills/devops-toolkit/
Eval pass 100% assertions. Benchmark chạy 5 trials, mean score 84, standard deviation 3.2. Variance thấp cho thấy skill output khá ổn định. Nếu bạn muốn tìm hiểu thêm về cách tối ưu skill, xem bài top 15 skills để lấy cảm hứng từ những skill được cộng đồng đánh giá cao.
Tạo Skill Thủ Công vs Dùng Skill Forge: Cái Nào Tốt Hơn?
Để bạn thấy rõ sự khác biệt, mình so sánh hai cách tạo skill. Theo kinh nghiệm thực tế qua hơn 20 skill đã tạo, Skill Forge giảm khoảng 60% thời gian và tăng chất lượng đáng kể nhờ review-evolve loop tự động.
Thủ công vẫn có chỗ đứng khi bạn cần skill rất đặc thù, không theo bất kỳ pattern nào. Nhưng với 90% use cases thông thường, Skill Forge nhanh hơn và đáng tin cậy hơn. Đặc biệt với Tier 3-4, scaffold tự động tiết kiệm rất nhiều công sức setup.
Muốn hiểu rõ hơn cách tạo skill thủ công để so sánh? Đọc bài tạo skill thủ công của mình. Nắm được cả hai cách sẽ giúp bạn chọn đúng approach cho từng tình huống.
Skill Forge vs Skill Creator Skill: Nên Chọn Cái Nào?
Tháng 4/2026, Anthropic ra mắt Skill Creator Skill làm official plugin cho Claude Code, tập trung vào build và benchmark skills. Theo Chase AI trong video top 10 Claude Code skills (19K views, 4/2026), đây là skill “quan trọng nhất” trong hệ sinh thái. Vậy so với Skill Forge thì khác nhau ra sao?
Cả hai đều phục vụ cùng một mục đích: giúp bạn tạo Claude Code Skills tốt hơn. Nhưng cách tiếp cận khá khác biệt. Skill Creator Skill là official plugin với scope hẹp hơn. Skill Forge là community tool với full lifecycle coverage. Mình đã dùng cả hai trong tháng qua và rút ra so sánh head-to-head dưới đây.
Điểm mạnh của Skill Creator Skill
Skill Creator Skill đến từ Anthropic nên có vài lợi thế rõ ràng. Cài đặt cực kỳ đơn giản, chỉ cần gõ /plugin trong Claude Code, tìm trong marketplace và nhấn install. Không cần clone repo, không cần chạy bash script. Phù hợp với người mới bắt đầu không muốn vọc terminal.
Điểm mạnh thứ hai là benchmark quantifiable. Theo Chase AI, “trước khi có skill creator skill, chúng ta không thể benchmark skills một cách dễ dàng”. Tool này đưa ra data cụ thể để bạn quyết định giữ hay bỏ thay đổi. A/B test giữa có và không có skill, hoặc so sánh các phiên bản khác nhau của cùng một skill.
Điểm cuối cùng, vì là official plugin, Skill Creator Skill được Anthropic maintain trực tiếp. Bạn không phải lo nó bị bỏ rơi hay không tương thích với Claude Code version mới. Update tự động theo marketplace.
Điểm mạnh của Skill Forge
Skill Forge vượt trội về scope. 8 lệnh cover toàn bộ lifecycle từ plan đến publish, trong khi Skill Creator Skill chỉ tập trung vào build và benchmark. Nếu bạn cần review health score, auto-fix bằng evolve, hoặc convert sang nền tảng khác, Skill Forge là lựa chọn duy nhất.
4 complexity tiers là tính năng độc quyền của Skill Forge. Tier 1 cho skill đơn giản, Tier 3-4 cho multi-agent orchestration. Skill Creator Skill không có khái niệm tier, mỗi skill được tạo theo cùng một mẫu mặc định. Điều này hạn chế khi bạn xây hệ thống phức tạp như DevOps toolkit.
Cross-platform convert là điểm khác biệt lớn thứ ba. Viết skill một lần với Skill Forge, convert sang Codex, Gemini CLI, Cursor, Antigravity. Skill Creator Skill bị khóa hoàn toàn trong hệ sinh thái Claude Code. Nếu team bạn dùng nhiều AI tools khác nhau, Skill Forge tiết kiệm rất nhiều công sức.
Nên chọn cái nào?
Câu trả lời phụ thuộc vào nhu cầu của bạn. Đây là quy tắc đơn giản mình áp dụng:
- Chọn Skill Creator Skill nếu: bạn mới học Claude Code, chỉ cần tạo vài skill đơn giản, muốn cài đặt nhanh, và không cần nhiều tính năng nâng cao.
- Chọn Skill Forge nếu: bạn đã quen Claude Code, cần tạo skill phức tạp (Tier 3-4), muốn cross-platform compatibility, hoặc xây dựng workflow professional cho team.
- Dùng cả hai nếu: bạn là power user. Skill Creator Skill cho benchmark nhanh với Anthropic official backing. Skill Forge cho full lifecycle management và cross-platform.
Cá nhân mình dùng Skill Forge là chính vì các project thường cần Tier 2-3 và cross-platform convert. Nhưng Skill Creator Skill vẫn xuất hiện trong toolkit cho những lần cần benchmark nhanh trước khi quyết định approach. Hai tool không loại trừ nhau, mà bổ trợ lẫn nhau.
Dùng Skill Forge Hiệu Quả Nhất Bằng Cách Nào?
Sau vài tháng dùng Skill Forge, mình rút ra một số bài học thực tế. Theo Stack Overflow 2025, 62% developer cho biết AI tools hiệu quả hơn đáng kể khi có workflow có cấu trúc. Skill Forge chính là cấu trúc đó.
Bắt đầu nhỏ, tăng tier sau
Đừng nhảy thẳng vào Tier 3 khi mới bắt đầu. Tạo vài Tier 1 skills trước. Khi thấy nhiều Tier 1 skills liên quan đến cùng domain, lúc đó mới nâng lên Tier 3 với orchestrator. Mình đã từng tạo Tier 3 quá sớm và phải refactor lại hoàn toàn.
Review thường xuyên, không chỉ khi tạo mới
Skill không phải “viết xong rồi quên”. Mình review lại skill mỗi 2-4 tuần. Context thay đổi, tools mới xuất hiện, convention cập nhật. Một skill đạt 90 điểm tháng trước có thể chỉ còn 75 điểm khi requirements thay đổi.
Dùng convert để backup cross-platform
Ngay cả khi team bạn chỉ dùng Claude Code, vẫn nên convert sang ít nhất 1 platform khác. Lý do? Backup workflow. Nếu Claude Code gặp sự cố hoặc đổi pricing, bạn có bản tương đương sẵn trên Codex hoặc Cursor. Chuẩn bị sẵn tốt hơn là bắt đầu từ đầu.
Kết hợp với MCP servers
Skills và MCP servers bổ trợ cho nhau rất tốt. Skill chứa instructions cho Claude, MCP server cung cấp tools và data. Ví dụ: skill review blog có thể gọi MCP server để đọc WordPress post, phân tích SEO, rồi đưa ra gợi ý. Skill Forge giúp tạo skill phần, MCP phần còn lại.
Bạn có thể tiết kiệm token đáng kể bằng cách viết skill với context mode tối ưu. Tier 2+ skills cho phép đẩy logic xác định vào scripts, giảm số lần Claude phải “suy nghĩ”.
Skill Forge giúp bạn viết skill tốt hơn. Bước tự nhiên tiếp theo là dùng AutoResearch Claude Code để benchmark skill đã tạo với nhiều prompt biến thể, giữ phiên bản win-rate cao nhất. Hai công cụ này cộng hưởng: Skill Forge lo cấu trúc, AutoResearch lo tuning.
Câu Hỏi Thường Gặp
Skill Forge có miễn phí không?
Có. Skill Forge là dự án mã nguồn mở, hoàn toàn miễn phí trên GitHub. Bạn có thể clone, sử dụng và đóng góp mà không mất phí. Tuy nhiên, khi chạy các lệnh build, eval, benchmark thì vẫn tốn Claude Code token vì Skill Forge dùng Claude làm engine xử lý.
Cần cài gì trước khi dùng Skill Forge?
Bạn cần 3 thứ: Git (để clone repo), Bash (Git Bash hoặc WSL trên Windows), và Claude Code đã cài sẵn. Python cần cho script init_skill.py nhưng không bắt buộc nếu bạn chỉ dùng slash commands.
Skill Forge có hoạt động trên Windows không?
Có, nhưng cần chạy qua Git Bash hoặc WSL. PowerShell thuần không chạy được bash install.sh. Mình dùng Windows 11 với Git Bash và mọi thứ hoạt động bình thường. Các lệnh /skill-forge trong Claude Code thì chạy được trên mọi nền tảng.
Skill tạo bằng Skill Forge có khác gì skill tạo tay?
Về mặt kỹ thuật, output cuối cùng giống nhau: đều là file SKILL.md với frontmatter và body. Khác biệt nằm ở quy trình: Skill Forge có review score, eval pipeline, và benchmark. Skill tạo tay phụ thuộc hoàn toàn vào kinh nghiệm người viết.
Convert sang Codex/Cursor có mất chức năng gì không?
Có thể mất một số tính năng đặc thù của Claude Code như context fork hoặc allowed-tools granularity. Convert command cố gắng map tương đương, nhưng mỗi nền tảng có giới hạn riêng. Nên review output sau khi convert và điều chỉnh thủ công nếu cần.
Health score bao nhiêu là đủ tốt?
Trên 80 điểm được coi là production-ready. 60-80 là acceptable nhưng nên cải thiện. Dưới 60 cần sửa đáng kể. Mình nhắm tối thiểu 85 cho skill dùng hàng ngày. Đừng chạy theo điểm 100, vì đôi khi skill quá cứng nhắc lại không linh hoạt khi context thay đổi.
Có thể dùng Skill Forge cho skill đã tạo sẵn không?
Có. Chạy /skill-forge review trên bất kỳ thư mục skill nào đã tồn tại. Nó sẽ đánh giá health score và đề xuất cải thiện. Sau đó dùng evolve để tự động nâng cấp. Đây là cách tốt nhất để cải thiện skill cũ mà không cần viết lại từ đầu.
Kết Luận
Skill Forge biến việc tạo Claude Code Skills từ quá trình thủ công thành pipeline chuyên nghiệp. 8 lệnh cover toàn bộ lifecycle: plan, build, review, evolve, publish, convert, eval, benchmark. 4 complexity tiers giúp bạn chọn đúng mức độ phức tạp cho từng use case.
Điểm mình thích nhất là vòng lặp review-evolve. Thay vì đoán xem skill có tốt không, bạn có health score cụ thể và feedback chi tiết. Evolve tự động sửa, review lại, lặp cho đến khi đạt chuẩn. Quy trình này giúp mình nâng skill từ 68 lên 87 điểm chỉ trong 5 phút.
Bước tiếp theo? Cài đặt Skill Forge, tạo một Tier 1 skill đơn giản, chạy review để xem health score. Khi đã quen, thử Tier 2 với scripts. Rồi đến Tier 3 khi domain đủ phức tạp. Không cần vội, skill tốt cần thời gian.
Nếu bạn chưa biết Skills là gì trong Claude Code, đọc bài đó trước. Nếu đã biết và muốn tạo skill thủ công trước khi dùng tool, đọc bài tạo skill thủ công. Skill Forge là bước tiến tiếp theo sau khi bạn đã nắm vững nền tảng. Đọc thêm lộ trình 6 levels Claude Code để biết bạn đang ở đâu.
