

Cách tạo bài thuyết trình bằng Hermes Agent + 2Slides (Hướng dẫn cài đặt đầy đủ)
Hermes Agent — agent tự chủ, tự cải thiện của Nous Research — tích hợp nguyên bản với 2Slides thông qua chuẩn skill mở agentskills.io. Chỉ cần cài gói slides-generation-2slides-skills vào ~/.hermes/skills/
Hermes Agent là gì?
Hermes Agent là một AI agent tự chủ, chạy thường trú trên server, do Nous Research phát triển. Khác với copilot nhúng trong IDE hay các wrapper chatbot, Hermes chạy như một process dài hạn trên server (hoặc một VPS giá $5), tích lũy bộ nhớ qua các phiên, và — điểm độc đáo — tự viết skill mới từ kinh nghiệm. Nó không phụ thuộc mô hình (hoạt động với Nous Portal, OpenRouter, OpenAI, Anthropic, NVIDIA NIM hoặc endpoint tùy biến), đi kèm hơn 40 công cụ có sẵn, hỗ trợ tích hợp MCP server, và cung cấp một gateway duy nhất để bạn nhắn tin với nó qua Telegram, Discord, Slack, WhatsApp, Signal, email hoặc CLI. Nguồn: github.com/NousResearch/hermes-agent.
Điểm khiến Hermes nổi bật cho quy trình tạo slide chính là vòng học khép kín: sau mỗi tác vụ phức tạp, Hermes có thể tạo ra một skill tái sử dụng được, rồi cải thiện skill đó trong những lần dùng sau. Đây chính là vòng lặp khiến việc tạo slide ngày càng tốt hơn theo thời gian.
Vì sao nên kết hợp Hermes với 2Slides?
Sự kết hợp này đồng vận một cách khác thường vì ba lý do:
- Hermes không có công cụ tạo slide gốc. Hơn 40 công cụ sẵn có của nó bao phủ tìm kiếm web, tự động hóa trình duyệt, thị giác máy, tạo ảnh, TTS — nhưng không có tạo slide. 2Slides lấp đúng khoảng trống năng lực đó.
- 2Slides đưa toàn bộ API ra làm công cụ, không chỉ một endpoint duy nhất. Gói skill 2Slides đóng gói bảy chế độ tạo slide khác biệt (văn bản, nhập PDF, nhân bản từ ảnh tham chiếu, thuyết minh, xuất file, tìm theme, kiểm tra trạng thái), nên Hermes có thể chọn đúng chế độ theo ý định thay vì đẩy mọi yêu cầu qua một endpoint generate duy nhất.
- Vòng tự cải thiện của Hermes tinh chỉnh tích hợp này theo thời gian. Lần đầu bạn yêu cầu tạo slide, Hermes gọi với thiết lập mặc định. Đến lần thứ năm, nó đã học được rằng deck board quý 1 của bạn cần 4K, họp toàn công ty cần 16:9, còn bản cập nhật cho khách hàng cần thuyết minh đa giọng — và nó ghi những ưu tiên này vào một skill hậu nhiệm tự sinh.
generate
Đây là một mô hình khác biệt thực sự so với tích hợp Claude MCP, nơi LLM gọi công cụ không trạng thái. Hermes thì nhớ.
Yêu cầu chuẩn bị
Trước khi bắt đầu, bạn cần:
- Máy Linux/macOS hoặc VPS có Python 3.10+ và Bash
- Tài khoản và API key 2Slides — đăng ký tại 2slides.com/api (tài khoản mới được tặng 500 credit miễn phí, đủ cho ~50 trang text-to-slide hoặc 5 trang Nano Banana 2K)
- Một key của nhà cung cấp LLM (Nous Portal, OpenRouter, OpenAI hoặc Anthropic) để Hermes dùng cho vòng suy luận
- Khoảng 15 phút cho lần cài đặt đầu tiên
Bước 1 — Cài Hermes Agent
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash source ~/.bashrc hermes setup
Trình hướng dẫn
hermes setuphermesBước 2 — Cài skill 2Slides
Skill 2Slides nằm tại github.com/2slides/slides-generation-2slides-skills và tuân theo chuẩn mở agentskills.io mà Hermes hỗ trợ nguyên bản. Thả nó vào thư mục skill người dùng:
mkdir -p ~/.hermes/skills cd ~/.hermes/skills git clone https://github.com/2slides/slides-generation-2slides-skills.git slides-2slides
Rồi thêm API key 2Slides vào môi trường shell để các script trong skill có thể xác thực:
echo 'export SLIDES_2SLIDES_API_KEY="sk-2s-..."' >> ~/.bashrc source ~/.bashrc
Khởi động lại Hermes CLI và gõ
/skillsslides-2slidesBước 3 — Tạo bộ slide đầu tiên
Cách gọi đơn giản nhất là một yêu cầu bằng ngôn ngữ tự nhiên trong Hermes:
> Create a 10-slide presentation about the State of AI Agents in 2026, focusing on autonomous agents vs chatbots, and use a modern dark theme
Hermes sẽ:
- Gọi với truy vấn "modern dark" để chọn theme ID
search-themes - Gọi với nội dung của bạn và theme đó
generate - Poll mỗi 5 giây cho đến khi job hoàn tất
jobs/:id - Trả về một có thể chia sẻ và một
slideUrlpdfUrl
Tổng thời gian thực cho bộ slide 10 trang: 30–60 giây ở chế độ sync. Phản hồi bao gồm
slideUrlNăm mẫu lệnh hữu dụng nhất
Không phải yêu cầu nào cũng nên đi qua
generate| Ý định | Prompt Hermes | Endpoint đằng sau |
|---|---|---|
| Soạn deck từ đầu | "Make slides about X" | POST /api/v1/slides/generate |
| Chuyển PDF / whitepaper | "Turn this research paper into a deck: /path/to/paper.pdf" | POST /api/v1/slides/create-pdf-slides |
| Khớp phong cách hình ảnh | "Create slides about X in the style of this screenshot: https://…" | POST /api/v1/slides/create-like-this |
| Thêm thuyết minh AI | "Add a professional narration with the Aoede voice to my last deck" | POST /api/v1/slides/generate-narration |
| Xuất ra ZIP | "Download all slides and voiceovers from that job as a ZIP" | POST /api/v1/slides/download-slides-pages-voices |
Tất cả endpoint đều dùng chung một cấu trúc bất đồng bộ — gửi → nhận
jobIdGET /api/v1/jobs/:idGọi API trực tiếp (cho công cụ tùy biến)
Nếu bạn muốn xây dựng một công cụ Hermes tùy biến thay vì dùng skill đóng gói — ví dụ một công cụ theo ngữ cảnh cụ thể "Tạo deck OKR quý với theme thương hiệu của chúng ta" — bạn có thể gọi trực tiếp API 2Slides từ một script Python do Hermes chạy.
Mẫu generate-and-wait tối giản:
import os, time, requests API = "https://2slides.com/api/v1" H = {"Authorization": f"Bearer {os.environ['SLIDES_2SLIDES_API_KEY']}"} resp = requests.post(f"{API}/slides/generate", headers=H, json={ "content": "Q1 2026 board update: ARR, retention, roadmap", "themeId": "theme_modern_dark", "mode": "async", "aspectRatio": "16:9", "resolution": "2K", }).json() job_id = resp["jobId"] while True: job = requests.get(f"{API}/jobs/{job_id}", headers=H).json() if job["status"] in ("completed", "failed"): break time.sleep(5) print(job["slideUrl"], job["pdfUrl"])
Xem Build an AI Presentation Agent: Developer Guide để có kiến trúc job bất đồng bộ đầy đủ và các mẫu retry. Về các mẫu system prompt mà Hermes dùng để quyết định chọn chế độ nào, xem System Prompts for AI Presentation Agents.
Vòng tự cải thiện trong thực tế
Đây là mẫu hành vi tách Hermes khỏi các runtime agent khác. Lần đầu bạn yêu cầu một deck hướng khách hàng, Hermes sẽ cho ra một sản phẩm khá chung chung. Nhưng Hermes có thể — và sẽ — tạo ra một skill hậu nhiệm sau khi tác vụ hoàn tất:
/skills new customer-update-deck
Skill tự sinh này ghi lại những gì đã hiệu quả: theme ID bạn duyệt, tỷ lệ khung hình, tên giọng cho thuyết minh, và cách diễn đạt cụ thể bạn yêu cầu cho slide mở đầu. Lần tới khi bạn nói "customer update deck," Hermes gọi skill này thay vì hàm
slides-2slides.generateĐây chính là lý do vì sao kết hợp một agent tự cải thiện với một API nhiều endpoint — chứ không phải một bộ sinh một-phát — lại quan trọng. Vòng học có thứ để mà học.
Lên lịch job tạo slide định kỳ
Hermes có sẵn một bộ scheduler cron tích hợp. Bạn có thể thiết lập job định kỳ chỉ với một dòng:
> Every Monday at 9am, generate a weekly status deck from our internal status doc, add narration with the Puck voice, and post the PDF to #exec-updates on Slack
Hermes lưu đây thành một tác vụ đã lên lịch (dùng
hermes cron listCác vấn đề thường gặp và cách khắc phục
Skill không xuất hiện trong /skills
~/.hermes/skills/slides-2slides/SKILL.mdhermes tools"401 Unauthorized" từ 2Slides. Biến môi trường
SLIDES_2SLIDES_API_KEY~/.config/hermes/env.bashrcJob tạo deck kẹt ở pending
--mode asyncjobs/:idThuyết minh thất bại sau khi tạo slide thành công. Narration cần
jobIdslideUrljobIdHermes chọn sai theme. Trong giai đoạn đầu của vòng học, điều này là bình thường. Sau khi bạn chỉnh theme một hai lần, Hermes ghi ưu tiên vào bộ nhớ và làm đúng ở các lần gọi sau. Bạn có thể tăng tốc quá trình này bằng cách nói thẳng: "remember that all my customer decks should use the Executive Minimal theme."
Câu hỏi thường gặp
Hermes Agent có hoạt động với 2Slides ở gói miễn phí không?
Có. Tài khoản 2Slides mới nhận 500 credit miễn phí, đủ cho khoảng 50 trang text-to-slide tiêu chuẩn (10 credit/trang), hoặc khoảng 5 trang Nano Banana 2K (100 credit/trang), hoặc ~2 trang có thuyết minh đầy đủ (210 credit/trang). Bản thân Hermes dùng giấy phép MIT và miễn phí; bạn chỉ phải trả cho nhà cung cấp LLM mà bạn định tuyến tới.
Skill 2Slides là MCP server hay skill agentskills.io?
Đó là một skill agentskills.io — chuẩn mở mà Hermes, OpenClaw và vài agent khác hỗ trợ nguyên bản. 2Slides cũng phát hành một MCP server riêng (xem How MCP Is Changing Presentation Workflows), nhưng đối với Hermes, gói skill là con đường nhanh hơn vì nó đi thẳng vào
~/.hermes/skills/Điều này khác gì so với dùng Claude + 2Slides MCP?
Claude qua MCP gọi công cụ không trạng thái — mỗi cuộc hội thoại bắt đầu lại từ đầu. Hermes duy trì bộ nhớ dài hạn và viết skill mới từ kinh nghiệm, nên tích hợp ngày càng tốt hơn theo thời gian thay vì lặp đi lặp lại cùng một thiết lập mặc định ở mỗi lần gọi. Cho các tác vụ một lần, hai cách tiếp cận tương đương. Cho quy trình định kỳ (báo cáo tuần, deck board tháng, cập nhật khách hàng định kỳ), vòng học của Hermes vượt trội rõ rệt vì nó ghi nhớ các ưu tiên mà agent không trạng thái phải được dặn lại mỗi lần.
Hermes có tự bàn giao deck tới Slack hay Telegram được không?
Có. Kiến trúc gateway đơn của Hermes nghĩa là cùng một process tạo deck cũng có thể nhắn nó về bất kỳ nền tảng đã kết nối nào. Sau khi bạn cấu hình gateway Telegram hoặc Slack qua
hermes setupHỗ trợ những ngôn ngữ và độ phân giải đầu ra nào?
Skill 2Slides hỗ trợ 19 ngôn ngữ (Auto, Anh, Tây Ban Nha, Pháp, Đức, Ý, Bồ Đào Nha, Nga, Nhật, Hàn, Trung giản thể/phồn thể, Ả Rập, Hindi, Indonesia, Việt, Thổ Nhĩ Kỳ, Ba Lan, Thái, Hy Lạp), độ phân giải 1K / 2K / 4K, và tỷ lệ khung hình từ 1:1 đến 21:9 kể cả dọc (9:16) cho khán giả ưu tiên thiết bị di động. Chi phí credit thay đổi theo độ phân giải: 10 credit/trang cho Fast PPT, 100 cho Nano Banana 2K, 200 cho Nano Banana 4K.
Vòng tự cải thiện của Hermes có bị quá khớp không?
Trong thực tế, không — skill thuộc phạm vi người dùng và có thể xem xét thủ công. Bạn có thể kiểm tra các skill tự sinh bằng
/skills/skills edit <name>/skills remove <name>Điểm mấu chốt
Hermes Agent cộng với 2Slides không phải chỉ là "một tích hợp AI" khác — đó là sự kết hợp đầu tiên nơi một agent tự chủ, tự cải thiện được ghép với một API thuyết trình nhiều endpoint có đủ bề mặt để nó học theo. Mọi kết hợp khác hoặc là gọi công cụ không trạng thái (Claude MCP, plugin ChatGPT), hoặc là một bộ sinh một-endpoint không có đủ bề rộng năng lực để tinh chỉnh. Bộ nhớ của Hermes cộng với bảy endpoint khác biệt của 2Slides mới là hình dạng thực sự tận dụng được vòng học.
Lộ trình thực tế trong năm 2026 là: cài cả hai trong 15 phút, tạo ba bốn deck thủ công để Hermes quan sát sở thích của bạn, rồi để scheduler tự vận hành. Trong vòng một tháng, Hermes sẽ tự tạo báo cáo tuần, deck board quý và deck cập nhật khách hàng của bạn ở chế độ tự động — với đúng theme, đúng giọng, đúng tỷ lệ khung hình và đúng kênh phân phối — vì nó tự viết skill cho từng loại.
Sẵn sàng chuyển giao quy trình làm slide? Lấy API key 2Slides (500 credit miễn phí) và cài Hermes Agent ngay hôm nay — setup đầy đủ dưới 15 phút.
About 2Slides
Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.
Try For Free