Save Ingest Defuddle Capture Flow: 3 Skill 2026
AgriciDaniel claude-obsidian xử lý mọi loại nguồn nhập vào vault Obsidian: chat conversation (/save), source URL/file (/wiki-ingest), và web pages clutter strip (/defuddle). Combo này tiết kiệm 40-60% token mỗi lần ingest so với load raw content thẳng vào Claude Code, và đảm bảo wiki pages được tạo đúng convention 3-layer architecture.
Bài này deep-dive 3 skill, workflow tích hợp, edge cases khi capture không hoạt động đúng, và pattern phù hợp cho daily routine của developer. Bài 11 skills overview cover tất cả 11 skill ở mức high-level, bài này focus deep mechanics 3 skill capture trio.
TL;DR
/saveskill capture cuộc trò chuyện Claude Code đang diễn ra thành structured wiki page (synthesis, concept, hoặc source type). Auto-detect type theo nội dung, file vào wiki/sources/./wiki-ingestskill nhập source bên ngoài (URL, PDF, image, transcript) vào .raw/, sau đó Claude tự tạo summary page + entity pages + cross-references trong wiki/./defuddleskill strip clutter web pages (ads, navigation, cookies banner) trước khi ingest. Tiết kiệm 40-60% token, content cleaner.- Combo workflow:
/defuddleweb URL →/wiki-ingestcleaned content →/savechat insights. Daily flow capture hết mọi nguồn không miss idea quan trọng.
/defuddleCapture Trio Trong Plugin claude-obsidian Là Gì?
Capture trio là 3 skill /save, /wiki-ingest, /defuddle của AgriciDaniel claude-obsidian, đảm nhận toàn bộ pipeline đưa content từ nguồn ngoài vào wiki structure. Tách 3 skill thay vì 1 vì mỗi loại nguồn có đặc thù riêng cần xử lý khác nhau, tránh skill phình to khó maintain.
/save xử lý chat conversation đang diễn ra trong Claude Code. Khi bạn đang chat với Claude và muốn lưu insight, gõ /save thay vì copy-paste manual. Skill detect nội dung thuộc loại nào (synthesis cross-source, concept new, hoặc source summary) và tạo wiki page đúng folder.
/wiki-ingest xử lý nguồn external: URL web page, PDF file, transcript YouTube, image OCR, slack export. Skill đọc source, generate summary page trong wiki/sources/, tạo entity pages cho người/tổ chức/sản phẩm mention, và link cross-reference với pages có sẵn.
/defuddle xử lý web pages có clutter (ads, popup, navigation menu, cookies banner, footer noise). Skill strip clutter trước khi pass cho /wiki-ingest, giảm token cost 40-60% cho mỗi lần ingest. Đây là pre-processing layer optional nhưng strong recommended cho web content.
3 skill này phụ thuộc vào folder structure mà /wiki bootstrap vault đã tạo. Không có /wiki chạy đầu tiên, capture trio không tìm được wiki/sources/ folder để write, fail silent. Đây là dependency rõ ràng cần follow đúng order.
/save Skill Capture Chat Conversation Như Thế Nào?
/save là skill đơn giản nhất trong trio, capture cuộc trò chuyện đang chat với Claude Code thành wiki page có cấu trúc. Workflow: bạn chat với Claude về topic X, đến lúc cảm thấy có insight đáng lưu, gõ /save, skill tạo page tự động.
Quy trình internal của /save 4 bước. Một, đọc context window hiện tại của Claude Code session. Hai, identify type content (synthesis, concept, source). Ba, generate frontmatter chuẩn theo CLAUDE.md schema. Bốn, write file vào wiki/sources/ với naming convention YYYY-MM-DD-topic-slug.md.
Type auto-detection logic. Nếu chat tổng hợp từ nhiều nguồn → synthesis. Nếu chat giải thích 1 ý tưởng abstract → concept. Nếu chat tóm tắt 1 source cụ thể → source. Mỗi type có template frontmatter khác nhau, save vào folder phù hợp (sources/, concepts/, hoặc synthesis/).
Use case daily điển hình. Sáng research topic, chat với Claude về architecture pattern. Đến lúc có insight rõ ràng, gõ /save. Skill tạo wiki/concepts/2026-05-04-architecture-pattern.md với content tổng hợp từ chat. File có frontmatter type: concept, tags, sources reference. Sau /save, hot cache (wiki/hot.md) tự update với key facts mới.
Edge case: chat dài 50+ messages. Default /save lấy 10-15 messages gần nhất. Bạn có thể specify scope: /save last 30 messages hoặc /save từ "khi mình hỏi về MCP". Scope chính xác giúp output focused, không lan man.
Mình dùng /save trung bình 5-7 lần mỗi ngày khi viết blog hoặc research. Mỗi /save mất 10-15 giây, tạo wiki page hoàn chỉnh. Sau 1 tháng, wiki có ~150 pages từ /save, mỗi page là một insight đáng nhớ. Không có /save, mình sẽ phải copy-paste manual mỗi insight, dễ miss vì friction cao.
/wiki-ingest Skill Process Source Ra Sao?
/wiki-ingest là skill phức tạp nhất trong trio, xử lý source external (URL, file, image) thành wiki ecosystem hoàn chỉnh. Skill có 6 bước: fetch source, parse content, identify entities + concepts, generate summary page, create cross-references, update index.
Workflow detail:
- Fetch source. Skill detect input type (URL fetch via curl, PDF parse via pdfminer, image OCR via tesseract, transcript đã có sẵn). Save raw content vào
.raw/YYYY-MM-DD-source-slug.md.
- Parse content. Extract structure: title, author, sections, key claims, citations. Cho web pages, skill chạy
/defuddlengầm nếu detect clutter.
- Identify entities + concepts. Claude scan content, list ra entities (người, công ty, sản phẩm) và concepts (ý tưởng, pattern, framework). So sánh với pages có sẵn trong wiki/entities/ và wiki/concepts/.
- Generate summary page. Tạo
wiki/sources/2026-05-04-source-slug.mdvới cấu trúc chuẩn: TL;DR (2-3 câu), Key Claims (5-7 bullet), Methods (nếu paper), Strengths/Weaknesses, Related Concepts.
- Create cross-references. Cho mỗi entity/concept identify, hoặc tạo page mới (nếu chưa có) hoặc link vào page existing (nếu đã có). Update wikilinks 2 chiều: source → entities, entities → source.
- Update index. Add entry vào wiki/index.md, append entry vào wiki/log.md, update hot cache với key facts mới.
Performance benchmark cho web article 2000 từ. Direct ingest (no /defuddle): ~3,200 tokens. Với /defuddle pre-processing: ~1,400 tokens. Tiết kiệm 56% theo measurement của mình. Một số source đặc biệt (academic paper PDF với formula) có overhead cao hơn vì cần OCR + LaTeX parsing.
Edge cases handle. Source duplicate (đã ingest từ trước): skill detect, skip ingest, chỉ update wiki page existing nếu content thay đổi. Source quá lớn (PDF 100+ pages): split thành nhiều ingest, tạo multiple summary pages liên kết. Source content sensitive (NDA): skill warn và refuse ingest, suggest manual review.
/defuddle Skill Strip Clutter Web Pages Như Thế Nào?
/defuddle là skill pre-processing wrap quanh /wiki-ingest cho web content. Khi bạn paste URL web vào ingest, /defuddle (có thể chạy ngầm hoặc explicit) strip clutter trước khi pass cho ingest.
Clutter types skill identify và strip:
- Navigation menu (header, sidebar): không add value cho content.
- Ads + sponsored content: thường có “Ad”, “Sponsored”, iframe.
- Cookie consent banner: GDPR popup chiếm space lớn.
- Newsletter signup overlay: “Subscribe to our newsletter” modal.
- Related posts widget: “You might also like” section.
- Footer + copyright: legal text, social media links.
- Tracking pixels + analytics scripts: hidden but contribute size.
- Comments section: nếu user không cần discussion.
Skill dùng combo Mozilla Readability algorithm + custom heuristics cho ngôn ngữ Việt. Output là markdown clean chỉ có content chính + author + publication date + headings.
Token saving measurement. URL trang TechCrunch 1500-từ article: trước /defuddle ~3,500 tokens (full HTML), sau /defuddle ~1,400 tokens (clean markdown). Tiết kiệm 60%. URL Medium article 2000-từ: 3,200 → 1,500 tokens, tiết kiệm 53%. URL forum Reddit thread: ít cải thiện vì content chính nằm trong nested comments hard to strip.
Khi nào /defuddle KHÔNG cần. Single page text article minimal clutter (Substack, personal blog). overhead /defuddle tương đương lợi ích. RSS feed already clean. Markdown export từ Notion/Obsidian. already structured. PDF. /defuddle skip, /wiki-ingest dùng pdfminer trực tiếp.
Edge case fail. Sites với client-side rendering (heavy JavaScript): /defuddle có thể miss content render qua JS. Workaround: dùng headless browser (Puppeteer) để pre-render trước khi /defuddle. Sites với paywall: skill detect và stop, không bypass. User phải bypass paywall manual trước.
Workflow Tích Hợp 3 Skill Cho Daily Routine Như Thế Nào?
để recover context.
/wiki-ingest cho list URL: skill chạy ngầm trong khi bạn làm việc khác. Mỗi URL ngầm dùng /defuddle pre-processing.In-day capture (mỗi 1-2 giờ):
- Chat với Claude về topic đang research.
- Khi có insight, gõ
/savecapture chat thành wiki page. - Nếu phát hiện source mới (Twitter thread, Medium article), copy URL paste vào notes folder,
/wiki-ingestsau.
Evening reflection 5 phút:
- Run
/wiki-lintcheck vault health (orphan pages, broken links). - Process bất kỳ URL còn pending trong notes folder qua
/wiki-ingest. - Review wiki/log.md xem hôm nay capture gì, có insight pattern không.
Weekly review:
- Run
/wiki-fold-cachesummarize tuần qua thành meta-page. - Inspect
/wiki-ingestoutput: có source nào miss không, có cross-reference miss không. - Manual edit wiki page nếu thấy info quan trọng skill miss.
Mình áp dụng workflow này 1 tháng, vault grow 0 → 200 notes (mix /save và /wiki-ingest). Daily capture ~10-15 minutes total. Compound effect xuất hiện sau tuần thứ 4: Claude trả lời câu hỏi chỉ trong 5-10 giây vì knowledge đã compile sẵn trong wiki structure.
Edge Cases Khi Capture Không Hoạt Động Đúng Là Gì?
Capture trio production-quality nhưng có 5 edge cases dev gặp thường nhất. Knowing edge case giúp debug nhanh khi skill fail silent.
Edge case 1: /save tạo page wrong type. Khi chat covers nhiều topic, skill phân loại sai (concept thay vì synthesis). Workaround: explicit type hint khi chạy: /save as synthesis hoặc /save as concept name="custom-name". Override default detection.
Edge case 2: /wiki-ingest skip duplicate khi source đã update. Skill detect duplicate qua URL hash, không re-ingest. Nhưng nếu source update content (ví dụ blog edit thêm section), skip miss new info. Workaround: force re-ingest với /wiki-ingest --force https://url. Skill ingest lại, merge với page existing.
Edge case 3: /defuddle break formatting. Skill strip clutter aggressive đôi khi xóa cả code blocks hoặc table quan trọng (false positive). Workaround: dùng /wiki-ingest --no-defuddle skip pre-processing cho specific URL. Cost token cao hơn nhưng content giữ nguyên.
Edge case 4: Cross-reference creation slow cho vault lớn. Khi vault qua 500 pages, /wiki-ingest match entities/concepts với existing pages mất 30-60s. Workaround: maintain wiki/index.md clean với /wiki-lint định kỳ. Index outdated làm matching slow.
Edge case 5: Source language conflict. Source tiếng Anh, vault config tiếng Việt → wiki page nửa Anh nửa Việt awkward. Workaround: explicit language hint: /wiki-ingest https://url --lang vi force translate to Vietnamese trong summary. Original quote giữ tiếng Anh.
Mỗi edge case này mình đã encounter ít nhất 1 lần trong vault 300 notes. Knowing workaround tránh được debug thời gian. Skill có verbose mode (--verbose flag) log mọi step để identify exactly nơi fail.
Capture Trio Khác Manual Capture Ra Sao?
Capture trio vs manual copy-paste khác nhau ở 4 chiều: time, quality, structure, compound effect. Quan trọng để justify investment learn skill thay vì stick với manual.
| Chiều | Manual capture | Capture trio (3 skills) |
|---|---|---|
| Time per source | 5-10 phút | 30-60 giây |
| Quality consistency | Variable (mood-dependent) | Stable (skill rules) |
| Cross-reference | Forget often | Auto-create |
| Token cost (web) | Full content | -40-60% via /defuddle |
| Wiki structure | Drift over time | Self-enforce |
| Index update | Manual, forget | Automatic |
Time saving cộng dồn impressive. Manual 5-10 phút × 10 sources/day = 60-120 phút/day. Skill 30-60s × 10 sources = 5-10 phút/day. Tiết kiệm 50-110 phút/day, quy ra ~25-50 giờ/tháng.
Quality consistency là benefit ít người nhận ra. Manual capture phụ thuộc mood, energy. Hôm có hứng viết summary kỹ, hôm mệt copy-paste sơ sài. Skill enforce template chuẩn cho mọi capture, page nào cũng đầy đủ TL;DR, Key Claims, Related. Không dependent mood.
Compound effect là benefit lớn nhất sau 2-3 tháng. Manual vault thường drift: index outdated, entities missing pages, cross-references sparse. Skill maintain structure invariant. Knowledge graph dày dần theo thời gian thay vì sparse.
Investment learn 3 skill: ~2-3 giờ đọc docs + practice. ROI break-even sau 1 tuần (saving 5-7 giờ manual capture). Sau 3 tháng, skill đã pay back 30-50x investment time.
✍️ Workflow capture knowledge mình học từ community này
Daily-notes routine + capture flow (save / ingest / query) mình dùng hằng ngày học từ AI Marketing Hub Pro. Mình join group với Daniel Agrici từ rất sớm và đây là cộng đồng SEO + Claude Code mình active + contribute nhiều nhất so với tất cả group mình từng tham gia.
Sub-skill /wiki, /save, /wiki-ingest, /wiki-query ship update liên tục, pro member có early access trước khi lên public. Nếu bạn xây hệ thống capture knowledge từ daily notes, đây là chỗ nên tham gia.
Câu Hỏi Thường Gặp
Cần chạy /wiki trước khi dùng capture trio không?
Có. Capture trio đều assume folder structure /wiki tạo (wiki/sources/, wiki/entities/, etc). Skip /wiki, các skill này tạo file ở location wrong, vault drift. Đầu tư 2 phút /wiki upfront tránh debug 2 giờ sau. Bài /wiki bootstrap vault cover detail.
/defuddle có chính xác cho tiếng Việt không?
Có với caveat. Algorithm dựa Mozilla Readability + custom heuristics, work tốt cho HTML well-structured. Trang tiếng Việt với layout phổ biến (Substack, Medium, WordPress) work tốt. Trang custom design Việt (báo điện tử Việt với layout cụ thể) đôi khi miss content. Test trên test URL trước khi rely.
Capture trio dùng được trên mobile không?
Một phần. Skill yêu cầu Claude Code CLI desktop. Mobile workflow: capture URL/text vào Obsidian mobile (Notes section daily note), về desktop chạy /wiki-ingest batch process. Không có native mobile capture. Bài sync mobile workflow cover workaround SSH remote.
Source đã ingest có thể re-organize sau không?
Có. Wiki pages là markdown thuần, edit manual hoặc qua /wiki-lint refactor được. /wiki-ingest tạo initial structure, sau đó bạn customize. Manual edit không break skill subsequent vì skill đọc page hiện tại trước khi update.
Tốn bao nhiêu token mỗi capture?
/save chat ~500-1000 tokens (chỉ context window, không call thêm). /wiki-ingest URL với /defuddle: 1,400-1,800 tokens cho 2000-từ article. /wiki-ingest PDF 20 pages: ~5,000-8,000 tokens. Daily total cho 10 ingests: 15,000-25,000 tokens, cost ~$0.03-0.08/day với Claude Pro pricing.
Capture có duplicate source detection không?
Có. /wiki-ingest hash URL/file content, detect duplicate, skip re-ingest mặc định. Force re-ingest nếu source update với --force flag. /save không có duplicate detection vì chat conversation luôn unique theo session.
Bạn Bắt Đầu Dùng Capture Trio Như Thế Nào?
Bắt đầu với /save trong tuần đầu. Mỗi khi chat với Claude và có insight đáng nhớ, gõ /save thay vì copy-paste. Tuần thứ hai add /wiki-ingest cho 1-2 source/day, observe output vào wiki/sources/. Tuần thứ ba add /defuddle pre-processing cho web URL. Sau 3 tuần bạn có rhythm capture stable.
Cluster Obsidian + Claude Code của ongboit cover các bài liên quan: pillar setup, Karpathy LLM Wiki story, 3-layer architecture, /wiki bootstrap, 11 skills overview, daily notes workflow. Bài này (D-3) là deep-dive cho 3 skill capture core trong plugin AgriciDaniel claude-obsidian.
Tài liệu tham khảo bên ngoài
- AgriciDaniel/claude-obsidian, source code
/save,/wiki-ingest,/defuddleskills. - defuddle library, HTML-to-clean-text engine.
