

Cách Tạo Video Thuyết Trình Có Lồng Tiếng AI với 2Slides
Nếu các slide của bạn có thể tự nói — theo đúng nghĩa đen thì sao? Với 2Slides, bạn có thể chuyển đổi bất kỳ bản trình bày nào được tạo bởi AI thành video có lồng tiếng chuyên nghiệp, với giọng nói AI nghe tự nhiên, chỉ trong vài phút.
Hướng dẫn này sẽ đưa bạn qua quy trình hoàn chỉnh: từ tạo slide đến thêm lồng tiếng và xuất video MP4 chỉn chu.
Video Thuyết Trình Có Lồng Tiếng AI Là Gì?
Video thuyết trình có lồng tiếng AI kết hợp ba yếu tố:
- Hình ảnh slide do AI tạo — thiết kế chuyên nghiệp được tạo từ nội dung văn bản của bạn
- Lồng tiếng AI — giọng nói tự nhiên được tạo ra từ nội dung slide của bạn
- Đầu ra video — video MP4 tự động phát đồng bộ slide với âm thanh lồng tiếng
Kết quả là một video thuyết trình trông và nghe như được sản xuất bởi một studio chuyên nghiệp — nhưng chỉ mất vài phút thay vì hàng giờ.
Tại Sao Nên Tạo Video Thuyết Trình Có Lồng Tiếng?
Video có lồng tiếng giải quyết những vấn đề thực tế trong nhiều lĩnh vực:
- Giao tiếp không đồng bộ: Chia sẻ thông tin mà không cần sắp xếp cuộc họp
- Đào tạo & giới thiệu nhân viên mới: Tạo tài liệu học tập tự định hướng
- Kể chuyện bằng dữ liệu: Để câu chuyện dữ liệu của bạn triển khai với hướng dẫn bằng giọng nói
- Nội dung mạng xã hội: Sản xuất video dọc (9:16) cho Instagram, TikTok và LinkedIn
- Hỗ trợ bán hàng: Gửi video giới thiệu cá nhân hóa mà khách hàng tiềm năng có thể xem bất cứ lúc nào
- Khả năng tiếp cận: Lồng tiếng giúp nội dung dễ tiếp cận hơn với người học bằng thị giác và những người gặp khó khăn trong việc đọc
Hướng Dẫn Từng Bước: Tạo Video Có Thuyết Minh Bằng 2Slides
Bước 1: Tạo Slide Của Bạn
Bắt đầu bằng cách tạo bài thuyết trình trong không gian làm việc của 2Slides:
- Nhập chủ đề hoặc dán nội dung của bạn
- Chọn mẫu thiết kế (hơn 15 phong cách chuyên nghiệp bao gồm McKinsey, Apple, Saul Bass)
- Hoặc sử dụng Create-Like-This để sao chép bất kỳ thiết kế slide hiện có nào
- AI tạo tất cả các trang slide với hình ảnh chuyên nghiệp
Bước 2: Cấu Hình Giọng Nói Thuyết Minh
Khi slide của bạn đã sẵn sàng, hãy cấu hình cài đặt giọng nói:
Chọn chế độ thuyết minh:
- Single Speaker (Một Người Nói): Một người thuyết minh nhất quán xuyên suốt bài thuyết trình
- Multi-Speaker (Nhiều Người Nói): Hai người nói theo định dạng hội thoại tự nhiên — lý tưởng cho podcast, phỏng vấn và kể chuyện hấp dẫn
Chọn từ 30 giọng nói AI:
2Slides cung cấp 30 giọng nói tự nhiên được hỗ trợ bởi các mô hình TTS mới nhất của Google. Mỗi giọng nói có cá tính riêng biệt:
| Giọng Nói | Giọng Điệu | Phù Hợp Nhất Cho |
|---|---|---|
| Puck | Sôi nổi, năng động | Marketing, demo sản phẩm |
| Kore | Ấm áp, chuyên nghiệp | Đào tạo doanh nghiệp |
| Charon | Vững chãi, có thẩm quyền | Báo cáo tài chính |
| Fenrir | Hào hứng, năng động | Giáo dục, kể chuyện |
| Aoede | Thoải mái, trò chuyện | Nội dung kiểu podcast |
| Zephyr | Tươi sáng, rõ ràng | Bài thuyết trình bán hàng |
...và 24 giọng nói khác để phù hợp với bất kỳ giọng điệu nào.
Chọn mật độ nội dung:
- Concise (Ngắn Gọn): Thuyết minh ngắn, theo điểm chính (~30 giây mỗi slide)
- Standard (Tiêu Chuẩn): Giải thích chi tiết, hấp dẫn (~60-90 giây mỗi slide)
Bước 3: Tạo Văn Bản Giọng Nói
Nhấp Generate Voice Text để tạo kịch bản thuyết minh. AI sẽ:
- Phân tích nội dung và các yếu tố hình ảnh của từng slide
- Viết bài thuyết minh tự nhiên liền mạch giữa các slide
- Thêm chuyển tiếp, nhấn mạnh và các yếu tố kể chuyện
- Trong chế độ nhiều người nói, tạo đối thoại tự nhiên giữa hai giọng nói
Chi phí: 10 credits mỗi trang slide
Bạn có thể xem lại và chỉnh sửa văn bản được tạo trước khi tiếp tục.
Bước 4: Tạo Âm Thanh Giọng Nói
Nhấp Generate Voice Audio để tổng hợp giọng nói:
- Mỗi slide nhận một tệp âm thanh WAV chất lượng cao
- Xem trước từng đoạn âm thanh bằng trình phát tích hợp
- Tạo lại từng slide riêng lẻ nếu cần
Chi phí: 200 credits mỗi trang slide
Bước 5: Xuất Video
Với tất cả các slide đã có thuyết minh, nhấp Generate Video từ menu Export:
-
Chọn tỷ lệ khung hình:
- 16:9 (1920x1080) — bài thuyết trình tiêu chuẩn, YouTube, webinar
- 4:5 (1080x1350) — bài đăng Instagram, nguồn cấp LinkedIn
-
Tạo video chạy phía client bằng FFmpeg.wasm — dữ liệu của bạn không bao giờ rời khỏi trình duyệt
-
Tải xuống video MP4 H.264 hoàn chỉnh
Chi phí: 20 credits mỗi trang slide
Ví Dụ Tổng Chi Phí
Đối với một video có thuyết minh 10 slide:
| Bước | Mỗi Slide | Tổng |
|---|---|---|
| Tạo slide | ~100 credits | 1.000 |
| Văn bản giọng nói | 10 credits | 100 |
| Âm thanh giọng nói | 200 credits | 2.000 |
| Xuất video | 20 credits | 200 |
| Tổng cộng | 3.300 credits |
Với 2Slides Pro ở mức $12.50/tháng (10.000 credits), bạn có thể tạo 3 video có thuyết minh đầy đủ mỗi tháng — hoặc nhiều hơn với các bài thuyết trình ngắn hơn.
Tích hợp API: Tự động hóa Video có Lồng tiếng
Các nhà phát triển có thể tự động hóa toàn bộ quy trình thông qua API của 2Slides:
# Bước 1: Tạo slide với Nano Banana (bắt buộc để có lồng tiếng) POST /api/v1/slides/create-pdf-slides { "userInput": "Tổng quan Kết quả Tài chính Q1 2026", "designStyle": { "global": { "referenceImageUrl": "..." } } } # Kiểm tra định kỳ cho đến khi hoàn thành GET /api/v1/jobs/{jobId} # Bước 2: Tạo lồng tiếng cho tất cả các trang POST /api/v1/slides/generate-narration { "jobId": "your-job-id", "mode": "multi", "speaker1Name": "Nhà phân tích", "speaker2Name": "Người dẫn", "speaker1Voice": "Charon", "speaker2Voice": "Aoede", "contentMode": "standard" } # Bước 3: Tải xuống tất cả tài nguyên POST /api/v1/slides/download-slides-pages-voices { "jobId": "your-job-id" }
Lưu ý: Tính năng lồng tiếng chỉ khả dụng với các công việc Nano Banana (
hoặccreate-like-this). Các công việc Fast PPT tiêu chuẩn không hỗ trợ lồng tiếng.create-pdf-slides
API trả về một file ZIP chứa tất cả hình ảnh slide, file âm thanh lồng tiếng và bản transcript đầy đủ — sẵn sàng để lắp ráp video trong quy trình của bạn.
Lồng tiếng Đa ngôn ngữ
2Slides tự động phát hiện ngôn ngữ của nội dung slide và tạo lồng tiếng bằng ngôn ngữ tương ứng:
- Tiếng Anh — mặc định
- Tiếng Nhật — phát hiện từ hiragana, katakana, kanji
- Tiếng Trung — phát hiện từ chữ Hán
- Tiếng Hàn — phát hiện từ chữ Hangul
30 giọng nói tương tự hoạt động trên tất cả các ngôn ngữ được hỗ trợ với phát âm tự nhiên.
Câu hỏi Thường gặp
Mất bao lâu để tạo một video có lồng tiếng?
Với bài thuyết trình 10 slide: tạo văn bản lồng tiếng mất ~30 giây, tạo âm thanh ~2 phút và xuất video ~2 phút. Tổng cộng: dưới 5 phút.
Tôi có thể chỉnh sửa kịch bản lồng tiếng trước khi tạo âm thanh không?
Có. Sau khi tạo văn bản lồng tiếng, bạn có thể xem xét và chỉnh sửa nội dung lồng tiếng của từng slide trong không gian làm việc trước khi tạo âm thanh.
Những định dạng video nào được hỗ trợ?
2Slides xuất video MP4 H.264 — tương thích phổ biến với YouTube, mạng xã hội, nền tảng LMS và tất cả các trình phát video chính.
Dữ liệu của tôi có an toàn trong quá trình tạo video không?
Có. Mã hóa video diễn ra hoàn toàn trong trình duyệt của bạn bằng FFmpeg.wasm. Hình ảnh slide và file âm thanh của bạn không được gửi đến bất kỳ máy chủ bên thứ ba nào để xử lý video.
Tôi có thể sử dụng API để tạo video không?
API hỗ trợ tạo slide và lồng tiếng. Việc lắp ráp video có thể được thực hiện phía client hoặc với pipeline FFmpeg của riêng bạn sử dụng các tài nguyên đã tải xuống.
Bắt đầu Ngay
- Đăng ký 2Slides — bao gồm tín dụng dùng thử miễn phí
- Tạo bài thuyết trình đầu tiên của bạn
- Thêm lồng tiếng và xuất video
- Chia sẻ video có lồng tiếng của bạn ở bất cứ đâu
Biến đổi bài thuyết trình của bạn thành video lồng tiếng chuyên nghiệp — dùng thử 2Slides ngay.
About 2Slides
Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.
Try For Free