

Hermes Agent + 2Slides 完整設定指南:用 AI 代理自動生成簡報
Hermes Agent 是 Nous Research 推出的自我進化自主代理,透過開放的 agentskills.io skill 標準與 2Slides 原生整合。只要把 slides-generation-2slides-skills 套件放到 ~/.hermes/skills/
什麼是 Hermes Agent?
Hermes Agent 是由 Nous Research 打造的自主型、常駐伺服器 AI 代理。不同於嵌入 IDE 的 copilot 或聊天機器人的包裝層,Hermes 以長時間執行的行程跑在你自己的伺服器(甚至一台 5 美元的 VPS)上,能跨 session 累積記憶,而且獨特的一點是——它能從經驗中寫出自己的 skill。Hermes 不綁特定模型(支援 Nous Portal、OpenRouter、OpenAI、Anthropic、NVIDIA NIM 或自訂端點),內建 40 多種工具,支援 MCP server 整合,並提供單一的訊息閘道,讓你可以透過 Telegram、Discord、Slack、WhatsApp、Signal、電子郵件或 CLI 與它互動。來源:github.com/NousResearch/hermes-agent。
對於簡報工作流程來說,Hermes 最有意思的特色就是它的封閉式學習迴圈:每完成一個複雜任務後,Hermes 可以建立一個可重複使用的 skill,並在後續使用中不斷優化它。這正是讓投影片生成能隨時間愈來愈好的關鍵迴圈。
為什麼要把 Hermes 與 2Slides 搭配?
這個組合之所以特別互補,有三個原因:
- Hermes 沒有原生的投影片工具。 它內建的 40 多種工具涵蓋網路搜尋、瀏覽器自動化、視覺、圖像生成、TTS——但就是沒有簡報製作。2Slides 剛好補上這塊能力缺口。
- 2Slides 把完整 API 開放為工具,不是只有單一端點。2Slides skill 套件 封裝了七種不同的生成模式(文字、PDF 匯入、參考圖片複製、配音、匯出、主題搜尋、狀態輪詢),讓 Hermes 能根據意圖挑選最合適的模式,而不是把每個需求都硬塞進一個通用的 generate 端點。
- Hermes 的自我進化迴圈會隨時間細緻化整合方式。 第一次要你做簡報時,Hermes 會用預設值呼叫 。到了第五次,它已經學會你的 Q1 董事會簡報要 4K、全員會議要 16:9、客戶更新需要多語者配音——並把這些偏好寫進自動生成的後續 skill 裡。
generate
這和 Claude MCP 整合 是截然不同的模式——在 Claude MCP 中,LLM 呼叫工具是無狀態的。Hermes 則會記住。
前置條件
開始之前,你需要:
- 一台 Linux/macOS 機器或 VPS,具備 Python 3.10+ 與 Bash
- 一個 2Slides 帳號與 API 金鑰——到 2slides.com/api 註冊(新帳號獲贈 500 點免費點數,足以產生約 50 頁文字轉投影片,或 5 頁 Nano Banana 2K 投影片)
- 一把 LLM 供應商金鑰(Nous Portal、OpenRouter、OpenAI 或 Anthropic),作為 Hermes 推理迴圈使用
- 初次設定大約需要 15 分鐘
步驟 1——安裝 Hermes Agent
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash source ~/.bashrc hermes setup
hermes setuphermes步驟 2——安裝 2Slides skill
2Slides skill 放在 github.com/2slides/slides-generation-2slides-skills,遵循 Hermes 原生支援的開放 agentskills.io 標準。將它 clone 到使用者 skills 資料夾:
mkdir -p ~/.hermes/skills cd ~/.hermes/skills git clone https://github.com/2slides/slides-generation-2slides-skills.git slides-2slides
接著把 2Slides API 金鑰加到 shell 環境變數,讓 skill 腳本可以認證:
echo 'export SLIDES_2SLIDES_API_KEY="sk-2s-..."' >> ~/.bashrc source ~/.bashrc
重啟 Hermes CLI 並輸入
/skillsslides-2slides步驟 3——生成你的第一份簡報
最簡單的呼叫方式,就是在 Hermes 中用自然語言下指令:
> Create a 10-slide presentation about the State of AI Agents in 2026, focusing on autonomous agents vs chatbots, and use a modern dark theme
Hermes 會:
- 用「modern dark」查詢 來挑選主題 ID
search-themes - 用你的內容與該主題呼叫
generate - 每 5 秒輪詢一次 ,直到任務完成
jobs/:id - 回傳一組可分享的 與
slideUrlpdfUrl
10 頁簡報的總耗時:同步模式下為 30 到 60 秒。回應內容包含
slideUrl五種最實用的呼叫模式
並非每個需求都該走
generate| 意圖 | Hermes prompt | 對應的端點 |
|---|---|---|
| 從零開始起草簡報 | 「Make slides about X」 | POST /api/v1/slides/generate |
| 轉換 PDF / 白皮書 | 「Turn this research paper into a deck: /path/to/paper.pdf」 | POST /api/v1/slides/create-pdf-slides |
| 比對視覺風格 | 「Create slides about X in the style of this screenshot: https://…」 | POST /api/v1/slides/create-like-this |
| 加上 AI 配音 | 「Add a professional narration with the Aoede voice to my last deck」 | POST /api/v1/slides/generate-narration |
| 匯出為 ZIP | 「Download all slides and voiceovers from that job as a ZIP」 | POST /api/v1/slides/download-slides-pages-voices |
所有端點共用同一套非同步封包格式——送出請求 → 取得
jobIdGET /api/v1/jobs/:id直接呼叫 API(自訂工具用)
如果你想自行打造 Hermes 工具,而不是使用現成 skill——例如一個特定領域的「用我們的品牌主題生成季度 OKR 簡報」工具——可以從 Hermes 執行的 Python 腳本裡直接呼叫 2Slides API。
最精簡的生成加等待模式:
import os, time, requests API = "https://2slides.com/api/v1" H = {"Authorization": f"Bearer {os.environ['SLIDES_2SLIDES_API_KEY']}"} resp = requests.post(f"{API}/slides/generate", headers=H, json={ "content": "Q1 2026 board update: ARR, retention, roadmap", "themeId": "theme_modern_dark", "mode": "async", "aspectRatio": "16:9", "resolution": "2K", }).json() job_id = resp["jobId"] while True: job = requests.get(f"{API}/jobs/{job_id}", headers=H).json() if job["status"] in ("completed", "failed"): break time.sleep(5) print(job["slideUrl"], job["pdfUrl"])
完整的非同步任務架構與重試模式,請參考 打造 AI 簡報代理:開發者指南。想看 Hermes 如何用 system prompt 決定要用哪個模式,請見 AI 簡報代理的 System Prompt 模式。
自我進化迴圈的實際運作
這裡就是 Hermes 與其他 agent runtime 不同的地方。第一次請它做一份對外客戶簡報,Hermes 產出的會是較通用的版本。但 Hermes 在任務完成後會(也一定會)建立後續 skill:
/skills new customer-update-deck
自動生成的 skill 會把這次成功的配置全部記錄下來:你核准的主題 ID、長寬比、配音使用的 voice 名稱,以及你在開頭投影片指定的特定措辭。下次你再說「customer update deck」時,Hermes 就會改呼叫這個 skill,而不是原始的
slides-2slides.generate這就是為什麼把自我進化的代理與多端點 API 搭配——而不是搭配一個單發式生成器——如此重要。學習迴圈必須有東西可以「學」,它才有意義。
排程週期性投影片任務
Hermes 內建 cron 排程器,你用一行指令就能設定週期任務:
> Every Monday at 9am, generate a weekly status deck from our internal status doc, add narration with the Puck voice, and post the PDF to #exec-updates on Slack
Hermes 會把這項任務儲存成排程(用
hermes cron list常見問題與修正方式
/skills
~/.hermes/skills/slides-2slides/SKILL.mdhermes tools2Slides 回傳「401 Unauthorized」。 通常是
SLIDES_2SLIDES_API_KEY~/.config/hermes/env.bashrc簡報生成卡在 pending
--mode asyncjobs/:id生成成功但配音失敗。 配音需要的是已完成生成任務的
jobIdslideUrljobIdHermes 選錯主題。 學習迴圈早期出現這種情況很正常。糾正一兩次後,Hermes 就會把偏好寫進記憶,之後都會選對。你也可以直接告訴它來加快這個過程:「記得我所有的客戶簡報都要用 Executive Minimal 主題」。
常見問題
Hermes Agent 能在 2Slides 免費方案下使用嗎?
可以。新的 2Slides 帳號會獲得 500 點免費點數,大約可產出 50 頁標準文字轉投影片(每頁 10 點)、約 5 頁 Nano Banana 2K 簡報(每頁 100 點),或約 2 頁含完整配音的輸出(每頁 210 點)。Hermes 本身採用 MIT 授權且免費;你只需要支付串接的 LLM 供應商費用。
2Slides skill 是 MCP server 還是 agentskills.io skill?
它是 agentskills.io skill——Hermes、OpenClaw 及其他幾個代理原生支援的開放標準。2Slides 也另外提供 MCP server(見 MCP 如何改變簡報工作流程),但以 Hermes 而言,skill 套件是更快的路徑,因為它會直接放進
~/.hermes/skills/這跟 Claude + 2Slides MCP 有什麼不同?
Claude 透過 MCP 呼叫工具是無狀態的——每次對話都從頭開始。Hermes 會維持持久記憶並從經驗寫出新 skill,因此整合會隨時間愈來愈好,而不是每次呼叫都重複相同的預設值。對於一次性生成,兩種方式效果相當;但對於週期性工作流程(週報、月度董事會簡報、固定的客戶更新),Hermes 的學習迴圈就會明顯勝出,因為它會記住偏好,而無狀態代理每次都要重新被告知。
Hermes 能自動把簡報交付給 Slack 或 Telegram 嗎?
可以。Hermes 的單一閘道架構意謂著:生成簡報的同一個行程,可以把結果送回任何已連線的平台。只要你透過
hermes setup支援哪些語言與輸出解析度?
2Slides skill 支援 19 種語言(自動偵測、英文、西班牙文、法文、德文、義大利文、葡萄牙文、俄文、日文、韓文、簡體中文/繁體中文、阿拉伯文、印地文、印尼文、越南文、土耳其文、波蘭文、泰文、希臘文)、1K / 2K / 4K 解析度,以及從 1:1 到 21:9 的長寬比,也包含直式 9:16(為行動優先觀眾設計)。點數費用隨解析度調整:Fast PPT 每頁 10 點、Nano Banana 2K 每頁 100 點、Nano Banana 4K 每頁 200 點。
Hermes 的自我進化迴圈會不會過度擬合?
實務上不會——skill 是使用者層級、可供人檢視的。你可以用
/skills/skills edit <name>/skills remove <name>結語
Hermes Agent 搭配 2Slides 不只是「另一個 AI 整合」——這是第一個讓自我進化自主代理,與擁有足夠能力面讓它去學的多端點簡報 API 配對的組合。其他搭配不是無狀態的工具呼叫(Claude MCP、ChatGPT plugin),就是沒有能力廣度可供優化的單端點生成器。Hermes 的記憶加上 2Slides 的七個不同端點,才是真正能回饋學習迴圈的形狀。
2026 年的務實路徑是:15 分鐘內安裝好兩者,手動生成三、四份簡報讓 Hermes 觀察你的偏好,接著把工作交給排程器。不出一個月,Hermes 就能自動產出你的週報、季度董事會簡報與客戶更新簡報——用你偏好的主題、你指定的 voice、你要求的長寬比、你選擇的交付管道——因為每一個 skill 都是它自己寫出來的。
準備好把簡報工作流程交給代理了嗎?取得 2Slides API 金鑰(500 點免費點數),今天就安裝 Hermes Agent——15 分鐘內完成全部設定。
About 2Slides
Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.
Try For Free