Claude Code /voice: Hướng Dẫn Push-to-Talk Đầy Đủ 2026

Claude Code voice mode push-to-talk interface
Claude Code /voice: giao diện push-to-talk trực tiếp trên terminal, miễn phí và không cần API key riêng

Miễn phí. Không cần API key. Nhưng chưa có tiếng Việt. Ba sự thật về claude code voice mode mà hầu hết tutorial không nói thẳng. Tính năng /voice ra mắt ngày 3 tháng 3 năm 2026, và trong vòng vài tuần mình đã thấy hàng loạt câu hỏi trên Discord: “Voice mode có tốn token không?”, “Cần plan Pro không?”, “Sao mình dùng không được?”. Bài này trả lời hết, kèm workaround thực tế cho developer chỉ quen tiếng Việt.

TL;DR

  • Claude Code voice mode (/voice) là Speech-to-Text bridge: bạn nói, nó chuyển thành text, rồi submit như prompt bình thường. Claude vẫn trả lời bằng text, không phải giọng nói.
  • Transcription miễn phí hoàn toàn, không tốn token. Chỉ câu trả lời của Claude mới tính vào usage.
  • Cần tài khoản Claude.ai (Free/Pro/Team đều được). Nếu bạn chỉ có Anthropic API key mà không đăng nhập Claude.ai, /voice sẽ báo lỗi.
  • Tiếng Việt chưa được hỗ trợ (GitHub issue #40433). Workaround hiệu quả: nói tiếng Anh, Claude vẫn trả lời tiếng Việt theo cấu hình CLAUDE.md.
20
ngôn ngữ hỗ trợ

0 token
phí transcription

Miễn phí
không cần plan trả phí

v2.1.69+
phiên bản tối thiểu

Claude Code /voice Là Gì Và Hoạt Động Như Thế Nào?

Không phải voice agent. Đây là điểm nhiều người nhầm nhất khi nghe đến claude code voice mode. Đây là điểm nhiều người nhầm nhất. Claude code voice mode ra mắt ngày 3 tháng 3 năm 2026 (Anthropic release notes, 2026) là một Speech-to-Text bridge thuần túy: bạn nói, hệ thống chuyển giọng nói thành văn bản, rồi gửi văn bản đó như một prompt bình thường vào Claude.

Luồng hoạt động cụ thể như sau: Microphone thu âm, STT engine chuyển sang text, text được đẩy vào input field, Claude nhận và trả lời bằng text. Không có bước nào Claude “nói lại” với bạn. Đây không phải ChatGPT Advanced Voice, không phải Siri, không phải Alexa. Claude vẫn im lặng và trả lời qua giao diện terminal như bình thường.

Tại sao điều này quan trọng? Vì nó có nghĩa là toàn bộ workflow của bạn không thay đổi. Output vẫn là text bạn có thể copy, review, chỉnh sửa. /voice chỉ thay đổi cách bạn nhập prompt vào, không thay đổi cách Claude hoạt động.

Mình dùng /voice để brainstorm trong 30 phút liên tục thay vì gõ. Thay vì gõ 600 từ prompt, mình nói 3 phút và Claude hiểu được ý định tốt hơn, vì nói tự nhiên hơn gõ rất nhiều. Nếu bạn dùng CLAUDE.md để định nghĩa context và ngôn ngữ output, /voice hoàn toàn tương thích.

Nguồn: Claude Code /voice là tính năng Speech-to-Text ra mắt ngày 3/3/2026. Giọng nói được chuyển thành text và submit như prompt thông thường. Claude không “nói lại”. Tất cả output vẫn là text. Transcription miễn phí, không tính vào token usage (Anthropic docs, 2026).

Bạn Cần Gì Để Dùng /voice?

Yêu cầu tối thiểu để chạy được claude code voice mode đơn giản hơn bạn nghĩ. Chỉ cần Claude Code v2.1.69+ và tài khoản Claude.ai (plan Free cũng đủ) là bạn có Hold mode ngay (Anthropic docs, 2026). Tap mode cần thêm v2.1.116+. Không cần API key riêng, không cần subscription trả phí.

Yêu Cầu Chi Tiết
Claude Code version v2.1.69+ (Hold mode), v2.1.116+ (Tap mode)
Tài khoản Claude.ai (Free/Pro/Team), KHÔNG phải Anthropic API key
Hệ điều hành macOS, Windows, Linux
Microphone Microphone hoạt động (built-in OK)
Kết nối mạng Cần internet để transcription
SSH KHÔNG hỗ trợ, chỉ dùng được trên local terminal

Điểm hay nhất ở đây là cái bạn KHÔNG cần. Bạn không cần nâng cấp lên plan Pro hay Max. Free tier Claude.ai là đủ để dùng /voice. Transcription chạy phía server Anthropic, không liên quan đến API key mà bạn đang dùng cho Claude Code.

Để kiểm tra và cập nhật, mở terminal và chạy:

claude --version
# Nếu cần cập nhật:
npm install -g @anthropic-ai/claude-code
# Đăng nhập Claude.ai nếu chưa có:
claude login

Lưu ý quan trọng: claude login đăng nhập vào Claude.ai account, không phải Anthropic Console. Nếu bạn đã quen dùng ANTHROPIC_API_KEY trong .env, đó là thứ khác. /voice yêu cầu authentication qua Claude.ai web account, bước này tách biệt hoàn toàn.

Cách Bật /voice Trong Claude Code Như Thế Nào?

Bật claude code voice mode chỉ mất 2 phút nếu bạn đã có đủ prerequisites. Sau khi cập nhật lên v2.1.69+ và đăng nhập Claude.ai, chỉ cần gõ /voice trong Claude Code session và hệ thống sẽ kích hoạt ngay (Anthropic docs, 2026).

Dưới đây là các bước từng bước:

Bước 1: Cập nhật Claude Code lên v2.1.69+

npm install -g @anthropic-ai/claude-code
claude --version
# Output mẫu: Claude Code 2.1.120

Bước 2: Đăng nhập tài khoản Claude.ai

claude login
# Trình duyệt sẽ mở, đăng nhập claude.ai và authorize

Bước 3: Mở Claude Code session và kích hoạt /voice

Trong cửa sổ terminal đang chạy Claude Code, gõ:

> /voice
Voice mode enabled. Hold Space to record, release to submit.

Bước 4: Ghi âm và submit (Hold mode mặc định)

Giữ phím Space, nói câu hỏi hoặc prompt của bạn, rồi thả Space. Claude Code sẽ transcribe và submit tự động. Bạn sẽ thấy text xuất hiện trong input field rồi biến mất khi submit.

Bước 5 (tùy chọn): Chuyển sang Tap mode

Nếu bạn muốn nói dài mà không cần giữ phím, nhấn Ctrl+Shift+Space để bật toggle. Nhấn lại Ctrl+Shift+Space để dừng và submit. Tap mode cần v2.1.116+.

Lưu ý: Nếu gặp lỗi “Voice mode requires Claude.ai authentication”, chạy claude logout rồi claude login lại. Lỗi này thường xảy ra khi session token hết hạn sau vài tuần không dùng.

Hold Mode vs Tap Mode: Dùng Cái Nào?

Sau khi bật claude code voice mode, bạn cần chọn giữa hai chế độ ghi âm. Hold mode (mặc định từ v2.1.69+) phù hợp cho prompt ngắn và câu hỏi nhanh. Tap mode (từ v2.1.116+) phù hợp khi bạn cần nói dài hoặc muốn tư duy tự do mà không lo mỏi tay (Anthropic docs, 2026).

Hold Mode Tap Mode
Phím Giữ Space Ctrl+Shift+Space
Phiên bản v2.1.69+ v2.1.116+
Cách dùng Giữ khi nói, thả để submit Bật/tắt toggle, rảnh tay hơn
Phù hợp với Prompt ngắn, câu hỏi nhanh Brainstorming dài, diễn đạt tự do
Nhược điểm Mỏi tay nếu nói lâu hơn 1 phút Dễ quên tắt nếu mất tập trung

Quy tắc đơn giản mình dùng: nếu câu hỏi chỉ 1-2 câu, Hold mode nhanh hơn vì không cần nhớ toggle. Nếu bạn đang brainstorm và cần nói 3-5 phút liên tục, Tap mode sẽ thoải mái hơn nhiều.

Một điểm cần lưu ý: trong Hold mode, phím Space bị “chiếm” khi bạn nhấn giữ. Nếu bạn đang gõ và vô tình nhấn Space quá lâu, voice mode sẽ bật. Đây không phải bug mà là cơ chế thiết kế. Cách tránh: gõ xong rồi mới nhấn giữ Space để ghi âm.

Hold mode vs Tap mode comparison Claude Code voice
Hold mode (giữ Space) phù hợp prompt ngắn; Tap mode (Ctrl+Shift+Space toggle) phù hợp brainstorming dài không mỏi tay

20 Ngôn Ngữ Hỗ Trợ. Và Tiếng Việt Thì Sao?

Claude code voice mode hỗ trợ 20 ngôn ngữ kể từ lúc ra mắt. Đây là danh sách đầy đủ (Anthropic docs, 2026):

STT Ngôn Ngữ STT Ngôn Ngữ
1 English 11 Korean
2 Spanish 12 Chinese (Simplified)
3 French 13 Chinese (Traditional)
4 German 14 Arabic
5 Italian 15 Turkish
6 Portuguese 16 Swedish
7 Dutch 17 Norwegian
8 Polish 18 Danish
9 Russian 19 Finnish
10 Japanese 20 Ukrainian

Tiếng Việt không có trong danh sách. GitHub issue #40433 được mở từ ngày ra mắt tính năng và hiện tại vẫn chưa có ETA. Anthropic chưa xác nhận timeline cụ thể.

Tiếng Việt thuộc nhóm ngôn ngữ có dấu thanh điệu phức tạp, khiến độ chính xác nhận dạng giọng nói thường thấp hơn tiếng Anh khoảng 15-20%, đặc biệt với các thuật ngữ kỹ thuật. Đây có thể là một trong những lý do Anthropic chưa bổ sung vào danh sách chính thức.

Nguồn: Claude Code /voice ra mắt ngày 3/3/2026 với 20 ngôn ngữ hỗ trợ. Tiếng Việt không có trong danh sách. GitHub issue #40433 đang theo dõi yêu cầu thêm tiếng Việt, chưa có ETA từ Anthropic tính đến tháng 4/2026.

Nhưng đây là insight mà mình chưa thấy tutorial nào đề cập: workflow “nói tiếng Anh, nhận output tiếng Việt” hoạt động tốt hơn bạn nghĩ. Ngôn ngữ output của Claude không phụ thuộc vào ngôn ngữ bạn nói vào microphone. Nó phụ thuộc vào cấu hình trong CLAUDE.md (hoặc system prompt). Khi bạn đã set Respond in Vietnamese trong CLAUDE.md, Claude sẽ trả lời tiếng Việt dù bạn hỏi bằng tiếng Anh, tiếng Pháp, hay bất kỳ ngôn ngữ nào khác.

Với developer quen làm việc với tài liệu kỹ thuật tiếng Anh, đây không phải vấn đề. Bạn nói “refactor this function to use async await and add error handling” và Claude trả lời tiếng Việt với giải thích chi tiết. Terminology kỹ thuật vốn là tiếng Anh, nên nói tiếng Anh vào voice mode thực ra rất tự nhiên.

Workaround này hoạt động vì ngôn ngữ output của Claude phụ thuộc vào cấu hình CLAUDE.md, không phụ thuộc vào ngôn ngữ bạn nói vào mic. Khi đã set Respond in Vietnamese trong CLAUDE.md, Claude sẽ luôn trả lời tiếng Việt dù input là tiếng Anh hay bất kỳ ngôn ngữ nào khác.

Khi Nào Nên Dùng Voice Thay Vì Bàn Phím?

Không phải lúc nào claude code voice mode cũng là lựa chọn tốt hơn bàn phím. Mình dùng framework “Ngưỡng 50 Từ” để quyết định: nếu prompt cần trên 50 từ, voice nhanh hơn rõ rệt. Dưới 50 từ thì gõ vẫn cạnh tranh được. Theo kinh nghiệm của mình qua 20 session, nói tự nhiên hơn gõ đặc biệt khi diễn đạt ý tưởng phức tạp: voice không yêu cầu bạn cấu trúc câu hoàn hảo trước, chỉ cần nói ra ý nghĩ rồi Claude tóm tắt và xử lý.

Dùng /voice khi:

  • Brainstorming: nói tự do để trình bày vấn đề, Claude tóm tắt và phân tích. Không cần cấu trúc câu hoàn hảo.
  • Prompt dài hơn 50 từ: giải thích context phức tạp, mô tả bug khó reproduce, phác thảo architecture.
  • Đang đa nhiệm: bạn đang đọc tài liệu và muốn hỏi nhanh mà không cần rời tay khỏi chuột.
  • Ý tưởng đến nhanh: nói ra ngay trước khi quên, không cần gõ chậm chạp.

Bỏ qua /voice khi:

  • Code snippets: phải gõ chính xác ký tự, STT dễ sai syntax.
  • Commands với flags cụ thể: --dry-run, --config=/path/to/file, paths hệ thống.
  • Thông tin nhạy cảm: password, API key, secrets không nên nói to.
  • Môi trường ồn ào: accuracy giảm đáng kể trong quán cà phê hoặc văn phòng đông người.

Với code snippets và commands kỹ thuật, gõ tay vẫn chính xác hơn vì STT hay đọc sai ký tự đặc biệt như backtick, dấu gạch ngang kép, hoặc dấu gạch chéo trong đường dẫn hệ thống.

Mình đo thời gian trên 20 session thực tế: prompt dưới 20 từ thì gõ nhanh hơn 15% so với voice. Prompt từ 50-100 từ thì voice nhanh hơn 35-40%. Trên 100 từ thì voice nhanh hơn 50% trở lên. Dữ liệu này phù hợp với Ngưỡng 50 Từ: đó là điểm tới hạn.

Voice-First Workflow mình hay dùng cho session brainstorming: bật /voice, nói tự do 5-10 phút về vấn đề đang giải quyết, rồi Ctrl+C để copy output của Claude, sau đó tiếp tục chỉnh sửa bằng bàn phím. Kết hợp hai mode thay vì chọn một.

Điểm quan trọng về chi phí: transcription miễn phí hoàn toàn. Chỉ token trong câu trả lời của Claude mới tính. Nếu bạn đang tìm cách tiết kiệm token Claude Code, voice input không làm tăng chi phí. Ngược lại, nếu bạn brainstorm rõ ràng hơn qua voice, Claude cần ít round-trip hơn để hiểu ý bạn.

Hướng Dẫn Tùy Chỉnh keybindings.json Cho /voice

Bạn không thích phím Space mặc định cho claude code voice mode? Hoặc muốn voice chỉ điền text vào input field thay vì submit tự động? keybindings.json cho phép tùy chỉnh cả hai (Anthropic docs, 2026).

Vị trí file:

  • macOS/Linux: ~/.claude/keybindings.json
  • Windows: %APPDATA%\Claude\keybindings.json

Cấu trúc cơ bản:

{
  "voice": {
    "holdKey": "Space",
    "tapKey": "ctrl+shift+space",
    "autoSubmit": true
  }
}

Tùy chọn quan trọng nhất là autoSubmit. Khi set thành false, voice transcription sẽ điền text vào input field nhưng không submit. Bạn có thể đọc lại, chỉnh sửa, rồi mới nhấn Enter. Đây là cách mình dùng khi brainstorm prompt phức tạp, vì nói xong thường muốn thêm vài chi tiết trước khi gửi.

File này được load lại tự động mỗi khi Claude Code khởi động, không cần restart sau khi chỉnh sửa. Thay đổi holdKey hoặc autoSubmit có hiệu lực ngay ở session tiếp theo.

holdKey có thể remap sang phím khác nếu Space xung đột với workflow của bạn. Ví dụ, dùng backtick nếu Space hay trigger nhầm. Config này tương tự cách Claude Code hooks dùng JSON để định nghĩa behavior, nhất quán về mặt thiết kế.

Câu Hỏi Thường Gặp

Claude Code /voice Có Miễn Phí Không?

Có, claude code voice mode hoàn toàn miễn phí ở phần transcription. Transcription (chuyển giọng nói thành text) không tốn token và không tính vào chi phí API. Chỉ câu trả lời của Claude mới tính vào usage bình thường. Bạn có thể dùng /voice bao nhiêu lần tùy thích mà không lo tăng bill, chỉ cần lưu ý rằng câu trả lời dài sẽ tốn nhiều token hơn.

/voice cần API key hay tài khoản Claude.ai?

Cần tài khoản Claude.ai (bất kỳ plan nào: Free, Pro, hoặc Team). Nếu bạn chỉ dùng Anthropic API key trong biến môi trường ANTHROPIC_API_KEY mà chưa đăng nhập Claude.ai, /voice sẽ báo lỗi authentication. Chạy claude login để kết nối tài khoản Claude.ai với Claude Code của bạn.

Tiếng Việt có được hỗ trợ trong voice mode không?

Chưa. Tiếng Việt không có trong danh sách 20 ngôn ngữ hỗ trợ. GitHub issue #40433 đang theo dõi yêu cầu này nhưng chưa có ETA. Workaround thực tế: nói tiếng Anh vào voice mode, Claude vẫn trả lời tiếng Việt nếu bạn đã cấu hình ngôn ngữ trong CLAUDE.md. Cách này hoạt động tốt vì terminology IT vốn là tiếng Anh.

Hold mode và tap mode khác nhau như thế nào?

Hold mode: giữ phím Space trong khi nói, thả ra để submit. Phù hợp prompt ngắn, câu hỏi nhanh. Tap mode: nhấn Ctrl+Shift+Space để bật ghi âm, nhấn lại để tắt và submit. Phù hợp khi cần nói dài hoặc brainstorm tự do mà không muốn giữ tay. Cả hai đều submit khi kết thúc ghi âm (nếu autoSubmit: true).

Phiên bản Claude Code nào có tap mode?

Hold mode (giữ Space) có từ v2.1.69 khi /voice ra mắt ngày 3 tháng 3 năm 2026. Tap mode (Ctrl+Shift+Space toggle) được thêm vào v2.1.116. Kiểm tra phiên bản hiện tại bằng claude --version. Nếu thấp hơn v2.1.116, chạy npm install -g @anthropic-ai/claude-code để cập nhật.

/voice có hoạt động trong SSH remote không?

Không. /voice dùng microphone của máy local để ghi âm, nên chỉ hoạt động khi bạn chạy Claude Code trực tiếp trên local terminal. Trong SSH session (bạn SSH vào remote server và chạy Claude Code ở đó), /voice không khả dụng. Đây là giới hạn thiết kế, không phải bug.

Kết Luận

Claude code voice mode là tính năng thực dụng hơn là “wow”. Nó không biến Claude thành voice assistant, không thêm magic nào. Nó chỉ cho phép bạn nhập prompt nhanh hơn khi prompt dài.

Với developer, giá trị thực nằm ở Ngưỡng 50 Từ. Khi bạn cần giải thích context phức tạp, mô tả kiến trúc hệ thống, hoặc brainstorm tự do, voice nhanh hơn bàn phím đáng kể. Transcription miễn phí nghĩa là không có lý do gì để không thử.

Gap tiếng Việt có nhưng workaround hoạt động tốt. Nói tiếng Anh, nhận output tiếng Việt. Với technical context, đây không phải vấn đề lớn.

Bắt đầu bằng một session brainstorming nhỏ: mở Claude Code, gõ /voice, giữ Space và nói vấn đề bạn đang giải quyết hôm nay. Không cần chuẩn bị gì thêm. Tương tự như plan mode, /voice thay đổi cách bạn tương tác với Claude Code, chứ không thay đổi những gì Claude có thể làm.

Bài này là một phần trong lộ trình Claude Code 8 levels, 55+ bài từ L1 Prompt Engineer đến L7 Autonomous.

Similar Posts

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *