2Slides Logo
วิธีสร้างพรีเซนเทชันด้วย Hermes Agent + 2Slides (คู่มือติดตั้งฉบับสมบูรณ์)
2Slides Team
8 min read

วิธีสร้างพรีเซนเทชันด้วย Hermes Agent + 2Slides (คู่มือติดตั้งฉบับสมบูรณ์)

Hermes Agent — agent อัตโนมัติที่เรียนรู้และพัฒนาตัวเองจาก Nous Research — จับคู่กับ 2Slides ได้โดยตรงผ่านมาตรฐาน skill แบบเปิด agentskills.io เพียงติดตั้งแพ็กเกจ slides-generation-2slides-skills ลงใน

~/.hermes/skills/
เพิ่ม API key ของ 2Slides เข้าไปในสภาพแวดล้อม Hermes ก็สามารถสร้างสไลด์ 16:9 เต็มรูปแบบจากประโยคเดียวได้ภายใน 30–60 วินาที การติดตั้งเดียวกันนี้ยังเปิดให้ใช้ endpoint ของ 2Slides API ทั้งเจ็ดแบบ — แปลงข้อความเป็นสไลด์, แปลง PDF เป็นสไลด์, จับคู่สไตล์จากรูปอ้างอิง, เสียงบรรยายแบบหลายผู้พูด, ค้นหา theme, ติดตามสถานะ job และดาวน์โหลด asset — ในฐานะ tool ชั้นหนึ่งของ Hermes ด้วย และเพราะ Hermes มี learning loop แบบปิดที่เขียน skill ใหม่จากประสบการณ์ได้เอง มันจึงปรับวิธีใช้ 2Slides ให้ดีขึ้นเรื่อย ๆ ตามกาลเวลา: เลือก theme ที่เหมาะกับผู้ฟังของคุณมากขึ้น เลือก output 4K สำหรับสไลด์พิตช์นักลงทุน สลับไปใช้ Create-Like-This เมื่อคุณวางภาพหน้าจอ และตั้งเวลาสร้างรายงานซ้ำ ๆ โดยไม่ต้องสั่งซ้ำสอง คู่มือนี้จะพาคุณไล่ตั้งแต่การติดตั้ง รูปแบบการเรียกใช้ที่พบบ่อย 5 แบบ การใช้ API โดยตรงสำหรับ power user และจุดที่มือใหม่มักติดเวลาเชื่อมต่อครั้งแรก

Hermes Agent คืออะไร?

Hermes Agent คือ AI agent อัตโนมัติที่ทำงานแบบ server-resident สร้างโดย Nous Research ต่างจาก copilot ที่ฝังใน IDE หรือ wrapper แบบแชทบอท Hermes รันเป็น process ระยะยาวบนเซิร์ฟเวอร์ของคุณ (หรือ VPS ราคา $5 ก็ได้) สะสมความจำข้ามเซสชัน และที่พิเศษคือ — เขียน skill ของตัวเองขึ้นมาจากประสบการณ์ มันเป็นแบบ model-agnostic (ใช้งานได้กับ Nous Portal, OpenRouter, OpenAI, Anthropic, NVIDIA NIM หรือ endpoint กำหนดเอง) มาพร้อม tool ในตัว 40+ รายการ รองรับ MCP server integration และเปิด gateway เดียวที่ให้คุณส่งข้อความถึงมันผ่าน Telegram, Discord, Slack, WhatsApp, Signal, อีเมล หรือ CLI ก็ได้ แหล่งข้อมูล: github.com/NousResearch/hermes-agent

ฟีเจอร์ที่ทำให้ Hermes น่าสนใจเป็นพิเศษสำหรับเวิร์กโฟลว์พรีเซนเทชันคือ closed learning loop: หลังจบงานที่ซับซ้อนแต่ละงาน Hermes สามารถสร้าง skill ที่นำกลับมาใช้ซ้ำได้ แล้วปรับปรุง skill นั้นระหว่างการใช้งานครั้งถัดไป นี่คือ loop เดียวกันที่ทำให้การสร้างสไลด์ดีขึ้นเรื่อย ๆ ตามเวลา

ทำไมต้องจับคู่ Hermes กับ 2Slides?

การผสมนี้เสริมกันอย่างผิดปกติด้วยเหตุผลสามข้อ:

  1. Hermes ไม่มี tool สร้างสไลด์ในตัว tool ในตัว 40+ รายการของมันครอบคลุมการค้นหาเว็บ, browser automation, vision, image generation, TTS — แต่ไม่มีการสร้าง deck 2Slides เติมเต็มช่องว่างความสามารถนี้พอดี
  2. 2Slides เปิด API ทั้งชุดให้ใช้เป็น tool ไม่ใช่แค่ endpoint เดียว แพ็กเกจ skill 2Slides ห่อหุ้มโหมดการสร้างที่แตกต่างกัน 7 โหมด (text, นำเข้า PDF, โคลนจากรูปอ้างอิง, เสียงบรรยาย, export, ค้นหา theme, ติดตามสถานะ) Hermes จึงเลือกโหมดที่ถูกต้องตามเจตนาได้ แทนที่จะบังคับให้ทุก request ไหลผ่าน endpoint generate เดียว
  3. Loop พัฒนาตัวเองของ Hermes ปรับปรุง integration ตามเวลา ครั้งแรกที่คุณสั่งให้ทำ deck Hermes เรียก
    generate
    ด้วยค่า default พอถึงครั้งที่ห้า มันเรียนรู้แล้วว่า deck คณะกรรมการไตรมาสหนึ่งของคุณต้องการ 4K, deck all-hands ต้องการ 16:9, และ deck อัปเดตลูกค้าต้องการเสียงบรรยายแบบหลายผู้พูด — แล้วเขียน preference เหล่านั้นลงใน skill ต่อยอดที่สร้างอัตโนมัติ

นี่เป็นรูปแบบที่แตกต่างอย่างแท้จริงจาก Claude MCP integration ที่ LLM เรียก tool แบบ stateless ส่วน Hermes จำได้

สิ่งที่ต้องเตรียมก่อน

ก่อนเริ่มคุณต้องมี:

  • เครื่อง Linux/macOS หรือ VPS ที่มี Python 3.10+ และ Bash
  • บัญชี 2Slides และ API key — สมัครได้ที่ 2slides.com/api (บัญชีใหม่ได้รับเครดิตฟรี 500 เครดิต เพียงพอสำหรับสไลด์แบบ text-to-slide ประมาณ 50 หน้า หรือ Nano Banana 2K ประมาณ 5 หน้า)
  • Key ผู้ให้บริการ LLM (Nous Portal, OpenRouter, OpenAI หรือ Anthropic) ที่ Hermes จะใช้สำหรับ reasoning loop
  • เวลาประมาณ 15 นาทีสำหรับตั้งค่าครั้งแรก

ขั้นตอนที่ 1 — ติดตั้ง Hermes Agent

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash source ~/.bashrc hermes setup

ตัวช่วย

hermes setup
จะถามผู้ให้บริการ LLM โมเดล default และข้อมูล credential สำหรับ messaging gateway (ตัวเลือก) (ข้ามการตั้งค่า gateway ในรอบแรกไปก่อนก็ได้ — คุณเปิด Telegram/Slack ภายหลังได้) เมื่อตั้งค่าเสร็จ ยืนยันการติดตั้งด้วย
hermes
— คุณควรเข้าสู่ prompt CLI แบบโต้ตอบได้

ขั้นตอนที่ 2 — ติดตั้ง skill 2Slides

Skill 2Slides อยู่ที่ github.com/2slides/slides-generation-2slides-skills และเป็นไปตามมาตรฐานเปิด agentskills.io ที่ Hermes รองรับโดยตรง วางลงในโฟลเดอร์ skill ของผู้ใช้:

mkdir -p ~/.hermes/skills cd ~/.hermes/skills git clone https://github.com/2slides/slides-generation-2slides-skills.git slides-2slides

จากนั้นเพิ่ม API key ของ 2Slides ลงในสภาพแวดล้อม shell เพื่อให้สคริปต์ skill สามารถยืนยันตัวตนได้:

echo 'export SLIDES_2SLIDES_API_KEY="sk-2s-..."' >> ~/.bashrc source ~/.bashrc

รีสตาร์ต Hermes CLI แล้วพิมพ์

/skills
— คุณควรเห็น
slides-2slides
ในรายการพร้อมฟังก์ชันเจ็ดรายการที่ใช้ได้ (generate, create-pdf-slides, create-like-this, generate-narration, download-slides-pages-voices, search-themes, get-job-status)

ขั้นตอนที่ 3 — สร้าง deck แรกของคุณ

การเรียกใช้ที่ง่ายที่สุดคือส่งคำขอด้วยภาษาธรรมชาติใน Hermes:

> Create a 10-slide presentation about the State of AI Agents in 2026, focusing on autonomous agents vs chatbots, and use a modern dark theme

Hermes จะ:

  1. เรียก
    search-themes
    ด้วย query "modern dark" เพื่อเลือก theme ID
  2. เรียก
    generate
    พร้อมเนื้อหาและ theme นั้น
  3. Poll
    jobs/:id
    ทุก 5 วินาทีจนกว่า job จะเสร็จ
  4. คืนค่า
    slideUrl
    ที่แชร์ได้และ
    pdfUrl

เวลาที่ใช้รวมทั้งหมดสำหรับ deck 10 หน้า: 30–60 วินาที ในโหมด sync การตอบกลับประกอบด้วย

slideUrl
, จำนวนหน้า และโหมดการสร้าง

รูปแบบการเรียกใช้ที่มีประโยชน์มากที่สุด 5 แบบ

ไม่ใช่ทุกคำขอควรผ่าน

generate
Skill 2Slides เปิดโหมดที่แตกต่างกันเพื่อให้ Hermes (และคุณ) เลือกโหมดที่ถูกต้องได้ ต่อไปนี้คือห้าโหมดที่คุณจะใช้บ่อยที่สุด พร้อมตัวอย่าง prompt:

เจตนาPrompt ที่ส่งให้ HermesEndpoint ที่อยู่เบื้องหลัง
ร่าง deck จากศูนย์"Make slides about X"
POST /api/v1/slides/generate
แปลง PDF / whitepaper"Turn this research paper into a deck: /path/to/paper.pdf"
POST /api/v1/slides/create-pdf-slides
จับคู่สไตล์ภาพ"Create slides about X in the style of this screenshot: https://…"
POST /api/v1/slides/create-like-this
เพิ่มเสียงบรรยาย AI"Add a professional narration with the Aoede voice to my last deck"
POST /api/v1/slides/generate-narration
Export เป็น ZIP"Download all slides and voiceovers from that job as a ZIP"
POST /api/v1/slides/download-slides-pages-voices

Endpoint ทั้งหมดใช้ envelope แบบ async เดียวกัน — submit → รับ

jobId
→ poll
GET /api/v1/jobs/:id
→ รับ URL ไฟล์ โครงสร้างที่สม่ำเสมอนี้คือเหตุผลที่ Hermes จัดการพวกมันเป็นชุด skill เดียวได้อย่างสวยงาม แทนที่จะเป็น tool เจ็ดตัวที่ไม่เข้ากัน

การเรียก API โดยตรง (สำหรับ tool กำหนดเอง)

ถ้าคุณอยากสร้าง Hermes tool แบบกำหนดเองแทนการใช้ skill สำเร็จรูป — เช่น tool เฉพาะโดเมนแบบ "Generate quarterly OKR deck with our brand theme" — คุณเรียก 2Slides API ได้โดยตรงจากสคริปต์ Python ที่ Hermes รัน

รูปแบบ generate-and-wait ขั้นต่ำ:

import os, time, requests API = "https://2slides.com/api/v1" H = {"Authorization": f"Bearer {os.environ['SLIDES_2SLIDES_API_KEY']}"} resp = requests.post(f"{API}/slides/generate", headers=H, json={ "content": "Q1 2026 board update: ARR, retention, roadmap", "themeId": "theme_modern_dark", "mode": "async", "aspectRatio": "16:9", "resolution": "2K", }).json() job_id = resp["jobId"] while True: job = requests.get(f"{API}/jobs/{job_id}", headers=H).json() if job["status"] in ("completed", "failed"): break time.sleep(5) print(job["slideUrl"], job["pdfUrl"])

ดู Build an AI Presentation Agent: Developer Guide สำหรับสถาปัตยกรรม async-job ฉบับเต็มและรูปแบบ retry และสำหรับรูปแบบ system prompt ที่ Hermes ใช้ตัดสินใจระหว่างโหมดต่าง ๆ ดู System Prompts for AI Presentation Agents

Loop พัฒนาตัวเองในการทำงานจริง

นี่คือรูปแบบที่แยก Hermes ออกจาก agent runtime อื่น ๆ ครั้งแรกที่คุณขอ deck ที่ใช้กับลูกค้า Hermes จะออกของที่ดูทั่วไป แต่ Hermes สามารถ — และจะ — สร้าง skill ต่อยอดหลังจบงาน:

/skills new customer-update-deck

Skill ที่สร้างอัตโนมัติจะเก็บสิ่งที่ได้ผล: theme ID ที่คุณอนุมัติ อัตราส่วนภาพ ชื่อเสียงสำหรับการบรรยาย และวลีเฉพาะที่คุณขอในสไลด์เปิด ครั้งถัดไปที่คุณพูดว่า "customer update deck" Hermes จะเรียก skill นี้แทนฟังก์ชัน

slides-2slides.generate
ดิบ ๆ เมื่อครบสิบรอบการใช้งาน skill จะสะสม preference ที่ tool แบบ stateless ไม่มีวันจำได้

นี่คือเหตุผลที่การจับคู่ agent ที่พัฒนาตัวเองได้กับ API หลาย endpoint — แทนที่จะเป็น generator นัดเดียว — มีความสำคัญ learning loop มีอะไรให้ เรียน

กำหนดเวลา job สร้างสไลด์ซ้ำ ๆ

Hermes มาพร้อม cron scheduler ในตัว คุณตั้ง job แบบซ้ำได้ในบรรทัดเดียว:

> Every Monday at 9am, generate a weekly status deck from our internal status doc, add narration with the Puck voice, and post the PDF to #exec-updates on Slack

Hermes จะเก็บคำสั่งนี้เป็น scheduled task (

hermes cron list
เพื่อตรวจสอบ) และรันแบบอัตโนมัติ และเพราะ messaging gateway รองรับ Slack, Discord, Telegram และ WhatsApp โดยตรง deck ที่เสร็จแล้วสามารถส่งไปยังช่องทางใดก็ได้โดยไม่ต้องเชื่อม integration เพิ่ม — ลิงก์ deck หรือ PDF จะมาในรูปข้อความบอทบนแพลตฟอร์มที่คุณระบุ

ปัญหาที่พบบ่อยและวิธีแก้

Skill ไม่ปรากฏใน

/skills
ตรวจสอบว่า clone อยู่ภายใต้
~/.hermes/skills/slides-2slides/
และ
SKILL.md
อยู่ที่ระดับบนสุดของโฟลเดอร์นั้น รัน
hermes tools
เพื่อรีเฟรช

"401 Unauthorized" จาก 2Slides ตัวแปรสภาพแวดล้อม

SLIDES_2SLIDES_API_KEY
มองไม่เห็นจาก Python subprocess ของ skill บน macOS launchd ให้เพิ่ม key ลงใน
~/.config/hermes/env
(ซึ่ง Hermes โหลดเสมอโดยไม่มีเงื่อนไข) แทนที่จะใส่ใน
.bashrc

การสร้าง deck ค้างอยู่ในสถานะ

pending
นานกว่า 120 วินาที คุณน่าจะ submit ในโหมด sync ระหว่างช่วง peak ให้ส่งใหม่ด้วย
--mode async
และ poll
jobs/:id
— request แบบ async จะถูกจัด queue แยกต่างหากและมักเสร็จใน 90 วินาทีแม้อยู่ภายใต้โหลดสูง

เสียงบรรยายล้มเหลวหลังการสร้างสำเร็จ เสียงบรรยายต้องใช้

jobId
จาก job การสร้างที่เสร็จแล้ว ไม่ใช่
slideUrl
ตรวจสอบว่า Hermes skill ส่ง
jobId
(UUID) ไม่ใช่ URL ของ deck

Hermes เลือก theme ผิด ช่วงต้นของ learning loop เรื่องนี้ถือว่าปกติ หลังจากคุณแก้ theme หนึ่งหรือสองครั้ง Hermes จะเขียน preference ลงในความจำและทำถูกต้องในการเรียกครั้งต่อ ๆ ไป คุณเร่งกระบวนการนี้ได้โดยบอกมันตรง ๆ: "remember that all my customer decks should use the Executive Minimal theme"

คำถามที่พบบ่อย

Hermes Agent ทำงานกับ 2Slides บนแพ็กเกจฟรีได้ไหม?

ได้ บัญชี 2Slides ใหม่ได้รับเครดิตฟรี 500 เครดิต ซึ่งครอบคลุมการสร้าง text-to-slide มาตรฐานประมาณ 50 หน้า (10 เครดิต/หน้า) หรือ Nano Banana 2K ประมาณ 5 หน้า (100 เครดิต/หน้า) หรือ output แบบมีเสียงบรรยายครบประมาณ 2 หน้า (210 เครดิต/หน้า) Hermes เองเป็น MIT-licensed และฟรี คุณจ่ายเฉพาะค่าผู้ให้บริการ LLM ที่คุณ route ไปใช้เท่านั้น

Skill 2Slides เป็น MCP server หรือ skill แบบ agentskills.io?

มันเป็น skill แบบ agentskills.io — มาตรฐานเปิดที่ Hermes, OpenClaw และ agent อื่น ๆ อีกหลายตัวรองรับโดยตรง 2Slides ยังมี MCP server แยกต่างหาก (ดู How MCP Is Changing Presentation Workflows) แต่สำหรับ Hermes โดยเฉพาะ แพ็กเกจ skill เป็นเส้นทางที่เร็วกว่าเพราะวางลงใน

~/.hermes/skills/
ได้ตรง ๆ โดยไม่ต้องจัดการ process MCP server แยก

มันต่างจาก Claude + 2Slides MCP ยังไง?

Claude ผ่าน MCP เรียก tool แบบ stateless — ทุกบทสนทนาเริ่มใหม่ตั้งแต่ต้น ส่วน Hermes เก็บความจำถาวรและเขียน skill ใหม่จากประสบการณ์ การเชื่อมต่อจึงดีขึ้นตามเวลา แทนที่จะย้ำค่า default เดิม ๆ ทุกครั้ง สำหรับการสร้างครั้งเดียวจบ สองแนวทางเทียบเท่ากัน สำหรับเวิร์กโฟลว์ซ้ำ ๆ (รายงานรายสัปดาห์ deck คณะกรรมการรายเดือน อัปเดตลูกค้าประจำ) learning loop ของ Hermes เหนือกว่าชัดเจน เพราะจับ preference ที่ agent แบบ stateless ต้องถูกบอกทุกครั้ง

Hermes ส่งมอบ deck ไปยัง Slack หรือ Telegram อัตโนมัติได้ไหม?

ได้ สถาปัตยกรรม gateway เดียวของ Hermes หมายความว่า process เดียวกันที่สร้าง deck สามารถส่งมันกลับไปยังแพลตฟอร์มใดก็ได้ที่เชื่อมต่อไว้ หลังจากคุณตั้งค่า Telegram หรือ Slack gateway ผ่าน

hermes setup
prompt แบบ "generate this deck and post the PDF to #board-updates on Slack" จะทำงานครบวงจร — Hermes เรียก 2Slides, poll job, ดาวน์โหลด PDF และโพสต์ไปยังช่อง

รองรับภาษาและความละเอียด output อะไรบ้าง?

Skill 2Slides รองรับ 19 ภาษา (Auto, อังกฤษ, สเปน, ฝรั่งเศส, เยอรมัน, อิตาลี, โปรตุเกส, รัสเซีย, ญี่ปุ่น, เกาหลี, จีนตัวย่อ/ตัวเต็ม, อาหรับ, ฮินดี, อินโดนีเซีย, เวียดนาม, ตุรกี, โปแลนด์, ไทย, กรีก), ความละเอียด 1K / 2K / 4K และอัตราส่วนภาพตั้งแต่ 1:1 ถึง 21:9 รวมถึงแนวตั้ง (9:16) สำหรับผู้ชมแบบ mobile-first ค่าเครดิตขยายตามความละเอียด: 10 เครดิต/หน้าสำหรับ Fast PPT, 100 สำหรับ Nano Banana 2K, 200 สำหรับ Nano Banana 4K

Loop พัฒนาตัวเองของ Hermes มีโอกาส overfit ไหม?

ในทางปฏิบัติ ไม่ — skill มีขอบเขตเฉพาะผู้ใช้และมนุษย์ตรวจสอบได้ คุณดู skill ที่สร้างอัตโนมัติได้ด้วย

/skills
และแก้ไขหรือลบได้ด้วย
/skills edit <name>
หรือ
/skills remove <name>
ถ้า Hermes ชอบ theme หรือเสียงที่คุณไม่ชอบแล้วมากไป แก้ไขครั้งเดียวในบทสนทนา skill จะอัปเดต สำหรับการอภิปรายเชิงลึกว่า agent แบบ Hermes เข้ากับภาพรวม AI automation ยังไง ดู The Future of AI Agents in Presentation Creation และ 2Slides Agent Skills: Automate AI Slide Workflows

สรุป

Hermes Agent บวกกับ 2Slides ไม่ใช่แค่ "AI integration" อีกตัวหนึ่ง — มันคือคู่แรกที่ agent อัตโนมัติซึ่งพัฒนาตัวเองได้ ถูกจับคู่กับ API พรีเซนเทชันหลาย endpoint ที่มีพื้นผิวกว้างพอจะให้มันเรียนรู้ได้จริง การจับคู่แบบอื่นล้วนเป็นการเรียก tool แบบ stateless (Claude MCP, ChatGPT plugins) หรือ generator endpoint เดียวที่ไม่มีความกว้างของความสามารถให้ปรับแต่ง ความจำของ Hermes บวกกับเจ็ด endpoint ของ 2Slides คือรูปทรงที่ให้ผลตอบแทนกับ learning loop อย่างแท้จริง

เส้นทางปฏิบัติในปี 2026 คือ: ติดตั้งทั้งสองตัวใน 15 นาที สร้าง deck สามถึงสี่ชุดด้วยตัวเองเพื่อให้ Hermes สังเกต preference ของคุณ แล้วปล่อยให้ scheduler เข้ามาแทนที่ ภายในหนึ่งเดือน Hermes จะผลิตรายงานรายสัปดาห์ deck คณะกรรมการรายไตรมาส และ deck อัปเดตลูกค้าของคุณแบบ autopilot — ด้วย theme ของคุณ เสียงของคุณ อัตราส่วนภาพของคุณ และช่องทางส่งมอบของคุณ — เพราะมันเขียน skill สำหรับแต่ละตัวขึ้นมาเอง

พร้อมส่งต่อเวิร์กโฟลว์การทำ deck ให้ agent หรือยัง? รับ API key ของ 2Slides (เครดิตฟรี 500 เครดิต) แล้วติดตั้ง Hermes Agent ได้เลยวันนี้ — ตั้งค่าครบในไม่ถึง 15 นาที

About 2Slides

Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.

Try For Free