2Slides Logo
Cách tạo bài thuyết trình bằng Hermes Agent + 2Slides (Hướng dẫn cài đặt đầy đủ)
2Slides Team
14 min read

Cách tạo bài thuyết trình bằng Hermes Agent + 2Slides (Hướng dẫn cài đặt đầy đủ)

Hermes Agent — agent tự chủ, tự cải thiện của Nous Research — tích hợp nguyên bản với 2Slides thông qua chuẩn skill mở agentskills.io. Chỉ cần cài gói slides-generation-2slides-skills vào

~/.hermes/skills/
, thêm API key 2Slides vào biến môi trường, Hermes có thể tạo một bộ slide 16:9 hoàn chỉnh chỉ từ một câu mô tả trong 30–60 giây. Cùng lúc đó, bản cài này còn đưa bảy endpoint API của 2Slides — text-to-slides, PDF-to-slides, nhân bản phong cách từ ảnh tham chiếu, thuyết minh đa giọng, tìm theme, theo dõi job và xuất asset — trở thành các công cụ gốc của Hermes. Vì Hermes có vòng học khép kín tự viết skill mới từ kinh nghiệm, nó liên tục tinh chỉnh cách dùng 2Slides theo thời gian: chọn theme phù hợp hơn với khán giả, ưu tiên xuất 4K cho pitch deck gọi vốn, tự chuyển sang Create-Like-This khi bạn dán ảnh chụp màn hình và tự động lên lịch báo cáo định kỳ mà không cần nhắc lại lần thứ hai. Bài viết này hướng dẫn cài đặt, năm mẫu lệnh hay dùng nhất, cách gọi API trực tiếp cho người dùng nâng cao và những lỗi thường gặp khi tích hợp lần đầu.

Hermes Agent là gì?

Hermes Agent là một AI agent tự chủ, chạy thường trú trên server, do Nous Research phát triển. Khác với copilot nhúng trong IDE hay các wrapper chatbot, Hermes chạy như một process dài hạn trên server (hoặc một VPS giá $5), tích lũy bộ nhớ qua các phiên, và — điểm độc đáo — tự viết skill mới từ kinh nghiệm. Nó không phụ thuộc mô hình (hoạt động với Nous Portal, OpenRouter, OpenAI, Anthropic, NVIDIA NIM hoặc endpoint tùy biến), đi kèm hơn 40 công cụ có sẵn, hỗ trợ tích hợp MCP server, và cung cấp một gateway duy nhất để bạn nhắn tin với nó qua Telegram, Discord, Slack, WhatsApp, Signal, email hoặc CLI. Nguồn: github.com/NousResearch/hermes-agent.

Điểm khiến Hermes nổi bật cho quy trình tạo slide chính là vòng học khép kín: sau mỗi tác vụ phức tạp, Hermes có thể tạo ra một skill tái sử dụng được, rồi cải thiện skill đó trong những lần dùng sau. Đây chính là vòng lặp khiến việc tạo slide ngày càng tốt hơn theo thời gian.

Vì sao nên kết hợp Hermes với 2Slides?

Sự kết hợp này đồng vận một cách khác thường vì ba lý do:

  1. Hermes không có công cụ tạo slide gốc. Hơn 40 công cụ sẵn có của nó bao phủ tìm kiếm web, tự động hóa trình duyệt, thị giác máy, tạo ảnh, TTS — nhưng không có tạo slide. 2Slides lấp đúng khoảng trống năng lực đó.
  2. 2Slides đưa toàn bộ API ra làm công cụ, không chỉ một endpoint duy nhất. Gói skill 2Slides đóng gói bảy chế độ tạo slide khác biệt (văn bản, nhập PDF, nhân bản từ ảnh tham chiếu, thuyết minh, xuất file, tìm theme, kiểm tra trạng thái), nên Hermes có thể chọn đúng chế độ theo ý định thay vì đẩy mọi yêu cầu qua một endpoint generate duy nhất.
  3. Vòng tự cải thiện của Hermes tinh chỉnh tích hợp này theo thời gian. Lần đầu bạn yêu cầu tạo slide, Hermes gọi
    generate
    với thiết lập mặc định. Đến lần thứ năm, nó đã học được rằng deck board quý 1 của bạn cần 4K, họp toàn công ty cần 16:9, còn bản cập nhật cho khách hàng cần thuyết minh đa giọng — và nó ghi những ưu tiên này vào một skill hậu nhiệm tự sinh.

Đây là một mô hình khác biệt thực sự so với tích hợp Claude MCP, nơi LLM gọi công cụ không trạng thái. Hermes thì nhớ.

Yêu cầu chuẩn bị

Trước khi bắt đầu, bạn cần:

  • Máy Linux/macOS hoặc VPS có Python 3.10+ và Bash
  • Tài khoản và API key 2Slides — đăng ký tại 2slides.com/api (tài khoản mới được tặng 500 credit miễn phí, đủ cho ~50 trang text-to-slide hoặc 5 trang Nano Banana 2K)
  • Một key của nhà cung cấp LLM (Nous Portal, OpenRouter, OpenAI hoặc Anthropic) để Hermes dùng cho vòng suy luận
  • Khoảng 15 phút cho lần cài đặt đầu tiên

Bước 1 — Cài Hermes Agent

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash source ~/.bashrc hermes setup

Trình hướng dẫn

hermes setup
hỏi về nhà cung cấp LLM, model mặc định và thông tin tùy chọn cho messaging gateway (có thể bỏ qua gateway ở lần đầu — bạn có thể bật Telegram/Slack sau). Sau khi setup xong, xác nhận cài đặt bằng
hermes
— bạn sẽ vào một prompt CLI tương tác.

Bước 2 — Cài skill 2Slides

Skill 2Slides nằm tại github.com/2slides/slides-generation-2slides-skills và tuân theo chuẩn mở agentskills.io mà Hermes hỗ trợ nguyên bản. Thả nó vào thư mục skill người dùng:

mkdir -p ~/.hermes/skills cd ~/.hermes/skills git clone https://github.com/2slides/slides-generation-2slides-skills.git slides-2slides

Rồi thêm API key 2Slides vào môi trường shell để các script trong skill có thể xác thực:

echo 'export SLIDES_2SLIDES_API_KEY="sk-2s-..."' >> ~/.bashrc source ~/.bashrc

Khởi động lại Hermes CLI và gõ

/skills
— bạn sẽ thấy
slides-2slides
trong danh sách cùng với bảy hàm khả dụng (generate, create-pdf-slides, create-like-this, generate-narration, download-slides-pages-voices, search-themes, get-job-status).

Bước 3 — Tạo bộ slide đầu tiên

Cách gọi đơn giản nhất là một yêu cầu bằng ngôn ngữ tự nhiên trong Hermes:

> Create a 10-slide presentation about the State of AI Agents in 2026, focusing on autonomous agents vs chatbots, and use a modern dark theme

Hermes sẽ:

  1. Gọi
    search-themes
    với truy vấn "modern dark" để chọn theme ID
  2. Gọi
    generate
    với nội dung của bạn và theme đó
  3. Poll
    jobs/:id
    mỗi 5 giây cho đến khi job hoàn tất
  4. Trả về một
    slideUrl
    có thể chia sẻ và một
    pdfUrl

Tổng thời gian thực cho bộ slide 10 trang: 30–60 giây ở chế độ sync. Phản hồi bao gồm

slideUrl
, số trang và chế độ tạo.

Năm mẫu lệnh hữu dụng nhất

Không phải yêu cầu nào cũng nên đi qua

generate
. Skill 2Slides cung cấp các chế độ riêng biệt để Hermes (và bạn) có thể chọn đúng cái phù hợp. Đây là năm mẫu lệnh bạn sẽ dùng nhiều nhất, kèm prompt ví dụ:

Ý địnhPrompt HermesEndpoint đằng sau
Soạn deck từ đầu"Make slides about X"
POST /api/v1/slides/generate
Chuyển PDF / whitepaper"Turn this research paper into a deck: /path/to/paper.pdf"
POST /api/v1/slides/create-pdf-slides
Khớp phong cách hình ảnh"Create slides about X in the style of this screenshot: https://…"
POST /api/v1/slides/create-like-this
Thêm thuyết minh AI"Add a professional narration with the Aoede voice to my last deck"
POST /api/v1/slides/generate-narration
Xuất ra ZIP"Download all slides and voiceovers from that job as a ZIP"
POST /api/v1/slides/download-slides-pages-voices

Tất cả endpoint đều dùng chung một cấu trúc bất đồng bộ — gửi → nhận

jobId
→ poll
GET /api/v1/jobs/:id
→ nhận URL file. Chính vì hình dạng nhất quán này mà Hermes xử lý chúng gọn gàng như một bộ skill thay vì bảy công cụ rời rạc không tương thích.

Gọi API trực tiếp (cho công cụ tùy biến)

Nếu bạn muốn xây dựng một công cụ Hermes tùy biến thay vì dùng skill đóng gói — ví dụ một công cụ theo ngữ cảnh cụ thể "Tạo deck OKR quý với theme thương hiệu của chúng ta" — bạn có thể gọi trực tiếp API 2Slides từ một script Python do Hermes chạy.

Mẫu generate-and-wait tối giản:

import os, time, requests API = "https://2slides.com/api/v1" H = {"Authorization": f"Bearer {os.environ['SLIDES_2SLIDES_API_KEY']}"} resp = requests.post(f"{API}/slides/generate", headers=H, json={ "content": "Q1 2026 board update: ARR, retention, roadmap", "themeId": "theme_modern_dark", "mode": "async", "aspectRatio": "16:9", "resolution": "2K", }).json() job_id = resp["jobId"] while True: job = requests.get(f"{API}/jobs/{job_id}", headers=H).json() if job["status"] in ("completed", "failed"): break time.sleep(5) print(job["slideUrl"], job["pdfUrl"])

Xem Build an AI Presentation Agent: Developer Guide để có kiến trúc job bất đồng bộ đầy đủ và các mẫu retry. Về các mẫu system prompt mà Hermes dùng để quyết định chọn chế độ nào, xem System Prompts for AI Presentation Agents.

Vòng tự cải thiện trong thực tế

Đây là mẫu hành vi tách Hermes khỏi các runtime agent khác. Lần đầu bạn yêu cầu một deck hướng khách hàng, Hermes sẽ cho ra một sản phẩm khá chung chung. Nhưng Hermes có thể — và sẽ — tạo ra một skill hậu nhiệm sau khi tác vụ hoàn tất:

/skills new customer-update-deck

Skill tự sinh này ghi lại những gì đã hiệu quả: theme ID bạn duyệt, tỷ lệ khung hình, tên giọng cho thuyết minh, và cách diễn đạt cụ thể bạn yêu cầu cho slide mở đầu. Lần tới khi bạn nói "customer update deck," Hermes gọi skill này thay vì hàm

slides-2slides.generate
thô. Qua mười lần lặp lại, skill tích lũy các ưu tiên mà một công cụ không trạng thái sẽ không bao giờ nhớ được.

Đây chính là lý do vì sao kết hợp một agent tự cải thiện với một API nhiều endpoint — chứ không phải một bộ sinh một-phát — lại quan trọng. Vòng học có thứ để mà học.

Lên lịch job tạo slide định kỳ

Hermes có sẵn một bộ scheduler cron tích hợp. Bạn có thể thiết lập job định kỳ chỉ với một dòng:

> Every Monday at 9am, generate a weekly status deck from our internal status doc, add narration with the Puck voice, and post the PDF to #exec-updates on Slack

Hermes lưu đây thành một tác vụ đã lên lịch (dùng

hermes cron list
để kiểm tra) và thực thi tự động. Vì messaging gateway hỗ trợ sẵn Slack, Discord, Telegram và WhatsApp, bộ slide hoàn thiện có thể được gửi đến bất kỳ kênh nào mà không cần thêm tích hợp — link deck hoặc PDF đến dưới dạng tin nhắn từ bot trên nền tảng bạn chỉ định.

Các vấn đề thường gặp và cách khắc phục

Skill không xuất hiện trong

/skills
. Kiểm tra xem clone đã nằm dưới
~/.hermes/skills/slides-2slides/
chưa và
SKILL.md
có nằm ở cấp cao nhất của thư mục đó không. Chạy
hermes tools
để làm mới.

"401 Unauthorized" từ 2Slides. Biến môi trường

SLIDES_2SLIDES_API_KEY
không hiển thị với tiến trình Python con của skill. Với launchd trên macOS, hãy thêm key vào
~/.config/hermes/env
(nơi Hermes nạp không điều kiện) thay vì
.bashrc
.

Job tạo deck kẹt ở

pending
hơn 120 giây. Có thể bạn đã gửi ở chế độ sync vào giờ cao điểm. Gửi lại với
--mode async
và poll
jobs/:id
— các request bất đồng bộ được xếp hàng độc lập và thường hoàn tất dưới 90 giây ngay cả khi tải cao.

Thuyết minh thất bại sau khi tạo slide thành công. Narration cần

jobId
của một job generate đã hoàn tất, không phải
slideUrl
. Kiểm tra xem skill Hermes có đang truyền
jobId
(UUID) chứ không phải URL deck.

Hermes chọn sai theme. Trong giai đoạn đầu của vòng học, điều này là bình thường. Sau khi bạn chỉnh theme một hai lần, Hermes ghi ưu tiên vào bộ nhớ và làm đúng ở các lần gọi sau. Bạn có thể tăng tốc quá trình này bằng cách nói thẳng: "remember that all my customer decks should use the Executive Minimal theme."

Câu hỏi thường gặp

Hermes Agent có hoạt động với 2Slides ở gói miễn phí không?

Có. Tài khoản 2Slides mới nhận 500 credit miễn phí, đủ cho khoảng 50 trang text-to-slide tiêu chuẩn (10 credit/trang), hoặc khoảng 5 trang Nano Banana 2K (100 credit/trang), hoặc ~2 trang có thuyết minh đầy đủ (210 credit/trang). Bản thân Hermes dùng giấy phép MIT và miễn phí; bạn chỉ phải trả cho nhà cung cấp LLM mà bạn định tuyến tới.

Skill 2Slides là MCP server hay skill agentskills.io?

Đó là một skill agentskills.io — chuẩn mở mà Hermes, OpenClaw và vài agent khác hỗ trợ nguyên bản. 2Slides cũng phát hành một MCP server riêng (xem How MCP Is Changing Presentation Workflows), nhưng đối với Hermes, gói skill là con đường nhanh hơn vì nó đi thẳng vào

~/.hermes/skills/
mà không cần quản lý tiến trình MCP server nào.

Điều này khác gì so với dùng Claude + 2Slides MCP?

Claude qua MCP gọi công cụ không trạng thái — mỗi cuộc hội thoại bắt đầu lại từ đầu. Hermes duy trì bộ nhớ dài hạn và viết skill mới từ kinh nghiệm, nên tích hợp ngày càng tốt hơn theo thời gian thay vì lặp đi lặp lại cùng một thiết lập mặc định ở mỗi lần gọi. Cho các tác vụ một lần, hai cách tiếp cận tương đương. Cho quy trình định kỳ (báo cáo tuần, deck board tháng, cập nhật khách hàng định kỳ), vòng học của Hermes vượt trội rõ rệt vì nó ghi nhớ các ưu tiên mà agent không trạng thái phải được dặn lại mỗi lần.

Hermes có tự bàn giao deck tới Slack hay Telegram được không?

Có. Kiến trúc gateway đơn của Hermes nghĩa là cùng một process tạo deck cũng có thể nhắn nó về bất kỳ nền tảng đã kết nối nào. Sau khi bạn cấu hình gateway Telegram hoặc Slack qua

hermes setup
, một prompt kiểu "generate this deck and post the PDF to #board-updates on Slack" hoạt động đầu-cuối mà không cần tích hợp gì thêm — Hermes gọi 2Slides, poll job, tải PDF và đăng lên kênh.

Hỗ trợ những ngôn ngữ và độ phân giải đầu ra nào?

Skill 2Slides hỗ trợ 19 ngôn ngữ (Auto, Anh, Tây Ban Nha, Pháp, Đức, Ý, Bồ Đào Nha, Nga, Nhật, Hàn, Trung giản thể/phồn thể, Ả Rập, Hindi, Indonesia, Việt, Thổ Nhĩ Kỳ, Ba Lan, Thái, Hy Lạp), độ phân giải 1K / 2K / 4K, và tỷ lệ khung hình từ 1:1 đến 21:9 kể cả dọc (9:16) cho khán giả ưu tiên thiết bị di động. Chi phí credit thay đổi theo độ phân giải: 10 credit/trang cho Fast PPT, 100 cho Nano Banana 2K, 200 cho Nano Banana 4K.

Vòng tự cải thiện của Hermes có bị quá khớp không?

Trong thực tế, không — skill thuộc phạm vi người dùng và có thể xem xét thủ công. Bạn có thể kiểm tra các skill tự sinh bằng

/skills
và chỉnh hoặc xóa chúng bằng
/skills edit <name>
hoặc
/skills remove <name>
. Nếu Hermes ưu tiên quá mức một theme hay giọng mà bạn không còn thích, chỉnh một lần trong cuộc hội thoại là skill sẽ cập nhật. Để tìm hiểu sâu hơn về cách các agent như Hermes phù hợp với bức tranh tự động hóa AI rộng hơn, xem The Future of AI Agents in Presentation Creation2Slides Agent Skills: Automate AI Slide Workflows.

Điểm mấu chốt

Hermes Agent cộng với 2Slides không phải chỉ là "một tích hợp AI" khác — đó là sự kết hợp đầu tiên nơi một agent tự chủ, tự cải thiện được ghép với một API thuyết trình nhiều endpoint có đủ bề mặt để nó học theo. Mọi kết hợp khác hoặc là gọi công cụ không trạng thái (Claude MCP, plugin ChatGPT), hoặc là một bộ sinh một-endpoint không có đủ bề rộng năng lực để tinh chỉnh. Bộ nhớ của Hermes cộng với bảy endpoint khác biệt của 2Slides mới là hình dạng thực sự tận dụng được vòng học.

Lộ trình thực tế trong năm 2026 là: cài cả hai trong 15 phút, tạo ba bốn deck thủ công để Hermes quan sát sở thích của bạn, rồi để scheduler tự vận hành. Trong vòng một tháng, Hermes sẽ tự tạo báo cáo tuần, deck board quý và deck cập nhật khách hàng của bạn ở chế độ tự động — với đúng theme, đúng giọng, đúng tỷ lệ khung hình và đúng kênh phân phối — vì nó tự viết skill cho từng loại.

Sẵn sàng chuyển giao quy trình làm slide? Lấy API key 2Slides (500 credit miễn phí) và cài Hermes Agent ngay hôm nay — setup đầy đủ dưới 15 phút.

About 2Slides

Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.

Try For Free