2Slides Logo
Hermes Agent + 2Slides 完整設定指南:用 AI 代理自動生成簡報
2Slides Team
5 min read

Hermes Agent + 2Slides 完整設定指南:用 AI 代理自動生成簡報

Hermes Agent 是 Nous Research 推出的自我進化自主代理,透過開放的 agentskills.io skill 標準與 2Slides 原生整合。只要把 slides-generation-2slides-skills 套件放到

~/.hermes/skills/
,再將 2Slides API 金鑰加入環境變數,Hermes 就能在 30 至 60 秒內,從一句話生成完整的 16:9 簡報。同一份安裝也會把 2Slides 的七個 API 端點——文字轉投影片、PDF 轉投影片、參考圖片風格比對、多語者配音、主題搜尋、任務輪詢、資源匯出——全部轉成 Hermes 的一級工具。由於 Hermes 擁有封閉式學習迴圈,能從經驗中寫出新的 skill,它會持續優化使用 2Slides 的方式:為你的受眾挑選更合適的主題、為投資人簡報偏好 4K 輸出、在你貼上截圖時自動切換到 Create-Like-This,甚至無須你再交代第二次就能排定週期性報告。本指南將帶你走過安裝流程、五種最常見的呼叫模式、給進階使用者的直接 API 用法,以及多數人首次整合時會踩到的坑。

什麼是 Hermes Agent?

Hermes Agent 是由 Nous Research 打造的自主型、常駐伺服器 AI 代理。不同於嵌入 IDE 的 copilot 或聊天機器人的包裝層,Hermes 以長時間執行的行程跑在你自己的伺服器(甚至一台 5 美元的 VPS)上,能跨 session 累積記憶,而且獨特的一點是——它能從經驗中寫出自己的 skill。Hermes 不綁特定模型(支援 Nous Portal、OpenRouter、OpenAI、Anthropic、NVIDIA NIM 或自訂端點),內建 40 多種工具,支援 MCP server 整合,並提供單一的訊息閘道,讓你可以透過 Telegram、Discord、Slack、WhatsApp、Signal、電子郵件或 CLI 與它互動。來源:github.com/NousResearch/hermes-agent

對於簡報工作流程來說,Hermes 最有意思的特色就是它的封閉式學習迴圈:每完成一個複雜任務後,Hermes 可以建立一個可重複使用的 skill,並在後續使用中不斷優化它。這正是讓投影片生成能隨時間愈來愈好的關鍵迴圈。

為什麼要把 Hermes 與 2Slides 搭配?

這個組合之所以特別互補,有三個原因:

  1. Hermes 沒有原生的投影片工具。 它內建的 40 多種工具涵蓋網路搜尋、瀏覽器自動化、視覺、圖像生成、TTS——但就是沒有簡報製作。2Slides 剛好補上這塊能力缺口。
  2. 2Slides 把完整 API 開放為工具,不是只有單一端點。2Slides skill 套件 封裝了七種不同的生成模式(文字、PDF 匯入、參考圖片複製、配音、匯出、主題搜尋、狀態輪詢),讓 Hermes 能根據意圖挑選最合適的模式,而不是把每個需求都硬塞進一個通用的 generate 端點。
  3. Hermes 的自我進化迴圈會隨時間細緻化整合方式。 第一次要你做簡報時,Hermes 會用預設值呼叫
    generate
    。到了第五次,它已經學會你的 Q1 董事會簡報要 4K、全員會議要 16:9、客戶更新需要多語者配音——並把這些偏好寫進自動生成的後續 skill 裡。

這和 Claude MCP 整合 是截然不同的模式——在 Claude MCP 中,LLM 呼叫工具是無狀態的。Hermes 則會記住。

前置條件

開始之前,你需要:

  • 一台 Linux/macOS 機器或 VPS,具備 Python 3.10+ 與 Bash
  • 一個 2Slides 帳號與 API 金鑰——到 2slides.com/api 註冊(新帳號獲贈 500 點免費點數,足以產生約 50 頁文字轉投影片,或 5 頁 Nano Banana 2K 投影片)
  • 一把 LLM 供應商金鑰(Nous Portal、OpenRouter、OpenAI 或 Anthropic),作為 Hermes 推理迴圈使用
  • 初次設定大約需要 15 分鐘

步驟 1——安裝 Hermes Agent

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash source ~/.bashrc hermes setup

hermes setup
精靈會詢問你的 LLM 供應商、預設模型,以及選用的訊息閘道憑證(第一次可以先跳過閘道設定——Telegram/Slack 之後再啟用即可)。安裝完成後,執行
hermes
確認,你應該會進入互動式 CLI 提示字元。

步驟 2——安裝 2Slides skill

2Slides skill 放在 github.com/2slides/slides-generation-2slides-skills,遵循 Hermes 原生支援的開放 agentskills.io 標準。將它 clone 到使用者 skills 資料夾:

mkdir -p ~/.hermes/skills cd ~/.hermes/skills git clone https://github.com/2slides/slides-generation-2slides-skills.git slides-2slides

接著把 2Slides API 金鑰加到 shell 環境變數,讓 skill 腳本可以認證:

echo 'export SLIDES_2SLIDES_API_KEY="sk-2s-..."' >> ~/.bashrc source ~/.bashrc

重啟 Hermes CLI 並輸入

/skills
——你應該會在清單中看到
slides-2slides
,以及它提供的七個可用函式(generate、create-pdf-slides、create-like-this、generate-narration、download-slides-pages-voices、search-themes、get-job-status)。

步驟 3——生成你的第一份簡報

最簡單的呼叫方式,就是在 Hermes 中用自然語言下指令:

> Create a 10-slide presentation about the State of AI Agents in 2026, focusing on autonomous agents vs chatbots, and use a modern dark theme

Hermes 會:

  1. 用「modern dark」查詢
    search-themes
    來挑選主題 ID
  2. 用你的內容與該主題呼叫
    generate
  3. 每 5 秒輪詢一次
    jobs/:id
    ,直到任務完成
  4. 回傳一組可分享的
    slideUrl
    pdfUrl

10 頁簡報的總耗時:同步模式下為 30 到 60 秒。回應內容包含

slideUrl
、頁數與生成模式。

五種最實用的呼叫模式

並非每個需求都該走

generate
。2Slides skill 提供不同模式,讓 Hermes(以及你)能挑選最合適的那一種。以下是你最常會用到的五種,搭配範例 prompt:

意圖Hermes prompt對應的端點
從零開始起草簡報「Make slides about X」
POST /api/v1/slides/generate
轉換 PDF / 白皮書「Turn this research paper into a deck: /path/to/paper.pdf」
POST /api/v1/slides/create-pdf-slides
比對視覺風格「Create slides about X in the style of this screenshot: https://…」
POST /api/v1/slides/create-like-this
加上 AI 配音「Add a professional narration with the Aoede voice to my last deck」
POST /api/v1/slides/generate-narration
匯出為 ZIP「Download all slides and voiceovers from that job as a ZIP」
POST /api/v1/slides/download-slides-pages-voices

所有端點共用同一套非同步封包格式——送出請求 → 取得

jobId
→ 輪詢
GET /api/v1/jobs/:id
→ 取回檔案 URL。正因為形狀一致,Hermes 才能把它們當成一整組 skill 乾淨地處理,而不是七個互不相容的工具。

直接呼叫 API(自訂工具用)

如果你想自行打造 Hermes 工具,而不是使用現成 skill——例如一個特定領域的「用我們的品牌主題生成季度 OKR 簡報」工具——可以從 Hermes 執行的 Python 腳本裡直接呼叫 2Slides API。

最精簡的生成加等待模式:

import os, time, requests API = "https://2slides.com/api/v1" H = {"Authorization": f"Bearer {os.environ['SLIDES_2SLIDES_API_KEY']}"} resp = requests.post(f"{API}/slides/generate", headers=H, json={ "content": "Q1 2026 board update: ARR, retention, roadmap", "themeId": "theme_modern_dark", "mode": "async", "aspectRatio": "16:9", "resolution": "2K", }).json() job_id = resp["jobId"] while True: job = requests.get(f"{API}/jobs/{job_id}", headers=H).json() if job["status"] in ("completed", "failed"): break time.sleep(5) print(job["slideUrl"], job["pdfUrl"])

完整的非同步任務架構與重試模式,請參考 打造 AI 簡報代理:開發者指南。想看 Hermes 如何用 system prompt 決定要用哪個模式,請見 AI 簡報代理的 System Prompt 模式

自我進化迴圈的實際運作

這裡就是 Hermes 與其他 agent runtime 不同的地方。第一次請它做一份對外客戶簡報,Hermes 產出的會是較通用的版本。但 Hermes 在任務完成後會(也一定會)建立後續 skill:

/skills new customer-update-deck

自動生成的 skill 會把這次成功的配置全部記錄下來:你核准的主題 ID、長寬比、配音使用的 voice 名稱,以及你在開頭投影片指定的特定措辭。下次你再說「customer update deck」時,Hermes 就會改呼叫這個 skill,而不是原始的

slides-2slides.generate
函式。經過十次迭代,這個 skill 會累積出一整套偏好——無狀態工具永遠記不起來的那種偏好。

這就是為什麼把自我進化的代理與多端點 API 搭配——而不是搭配一個單發式生成器——如此重要。學習迴圈必須有東西可以「學」,它才有意義。

排程週期性投影片任務

Hermes 內建 cron 排程器,你用一行指令就能設定週期任務:

> Every Monday at 9am, generate a weekly status deck from our internal status doc, add narration with the Puck voice, and post the PDF to #exec-updates on Slack

Hermes 會把這項任務儲存成排程(用

hermes cron list
可查看),並自主執行。由於訊息閘道原生支援 Slack、Discord、Telegram 與 WhatsApp,完成的簡報可以送到任何頻道,不需要額外整合——簡報連結或 PDF 會以機器人訊息的形式出現在你指定的平台上。

常見問題與修正方式

/skills
看不到 skill。 請確認 clone 的位置是
~/.hermes/skills/slides-2slides/
,且
SKILL.md
位於該資料夾的最上層。執行
hermes tools
重新整理。

2Slides 回傳「401 Unauthorized」。 通常是

SLIDES_2SLIDES_API_KEY
環境變數沒傳進 skill 的 Python 子行程。macOS launchd 的情況下,請把金鑰加到
~/.config/hermes/env
(Hermes 一定會載入這個檔案),而不是
.bashrc

簡報生成卡在

pending
超過 120 秒。 你很可能在尖峰時段用了同步模式。改用
--mode async
重送,並輪詢
jobs/:id
——非同步請求會獨立排隊,即使在高負載下通常也能在 90 秒內完成。

生成成功但配音失敗。 配音需要的是已完成生成任務的

jobId
,而不是
slideUrl
。請檢查 Hermes skill 傳入的是
jobId
(UUID),不是簡報的 URL。

Hermes 選錯主題。 學習迴圈早期出現這種情況很正常。糾正一兩次後,Hermes 就會把偏好寫進記憶,之後都會選對。你也可以直接告訴它來加快這個過程:「記得我所有的客戶簡報都要用 Executive Minimal 主題」。

常見問題

Hermes Agent 能在 2Slides 免費方案下使用嗎?

可以。新的 2Slides 帳號會獲得 500 點免費點數,大約可產出 50 頁標準文字轉投影片(每頁 10 點)、約 5 頁 Nano Banana 2K 簡報(每頁 100 點),或約 2 頁含完整配音的輸出(每頁 210 點)。Hermes 本身採用 MIT 授權且免費;你只需要支付串接的 LLM 供應商費用。

2Slides skill 是 MCP server 還是 agentskills.io skill?

它是 agentskills.io skill——Hermes、OpenClaw 及其他幾個代理原生支援的開放標準。2Slides 也另外提供 MCP server(見 MCP 如何改變簡報工作流程),但以 Hermes 而言,skill 套件是更快的路徑,因為它會直接放進

~/.hermes/skills/
,不需要另外管理一個 MCP server 行程。

這跟 Claude + 2Slides MCP 有什麼不同?

Claude 透過 MCP 呼叫工具是無狀態的——每次對話都從頭開始。Hermes 會維持持久記憶並從經驗寫出新 skill,因此整合會隨時間愈來愈好,而不是每次呼叫都重複相同的預設值。對於一次性生成,兩種方式效果相當;但對於週期性工作流程(週報、月度董事會簡報、固定的客戶更新),Hermes 的學習迴圈就會明顯勝出,因為它會記住偏好,而無狀態代理每次都要重新被告知。

Hermes 能自動把簡報交付給 Slack 或 Telegram 嗎?

可以。Hermes 的單一閘道架構意謂著:生成簡報的同一個行程,可以把結果送回任何已連線的平台。只要你透過

hermes setup
設定好 Telegram 或 Slack 閘道,像「generate this deck and post the PDF to #board-updates on Slack」這類 prompt 就能端到端運作——Hermes 會呼叫 2Slides、輪詢任務、下載 PDF,然後貼到頻道。

支援哪些語言與輸出解析度?

2Slides skill 支援 19 種語言(自動偵測、英文、西班牙文、法文、德文、義大利文、葡萄牙文、俄文、日文、韓文、簡體中文/繁體中文、阿拉伯文、印地文、印尼文、越南文、土耳其文、波蘭文、泰文、希臘文)、1K / 2K / 4K 解析度,以及從 1:1 到 21:9 的長寬比,也包含直式 9:16(為行動優先觀眾設計)。點數費用隨解析度調整:Fast PPT 每頁 10 點、Nano Banana 2K 每頁 100 點、Nano Banana 4K 每頁 200 點。

Hermes 的自我進化迴圈會不會過度擬合?

實務上不會——skill 是使用者層級、可供人檢視的。你可以用

/skills
查看自動生成的 skill,並用
/skills edit <name>
/skills remove <name>
編輯或刪除它們。如果 Hermes 太偏好某個你已經不喜歡的主題或 voice,只要在對話中糾正一次,skill 就會更新。想更深入了解 Hermes 這類代理在整體 AI 自動化生態中的定位,請參考 AI 代理在簡報製作的未來2Slides Agent Skills:自動化 AI 投影片工作流程

結語

Hermes Agent 搭配 2Slides 不只是「另一個 AI 整合」——這是第一個讓自我進化自主代理,與擁有足夠能力面讓它去學的多端點簡報 API 配對的組合。其他搭配不是無狀態的工具呼叫(Claude MCP、ChatGPT plugin),就是沒有能力廣度可供優化的單端點生成器。Hermes 的記憶加上 2Slides 的七個不同端點,才是真正能回饋學習迴圈的形狀。

2026 年的務實路徑是:15 分鐘內安裝好兩者,手動生成三、四份簡報讓 Hermes 觀察你的偏好,接著把工作交給排程器。不出一個月,Hermes 就能自動產出你的週報、季度董事會簡報與客戶更新簡報——用你偏好的主題、你指定的 voice、你要求的長寬比、你選擇的交付管道——因為每一個 skill 都是它自己寫出來的。

準備好把簡報工作流程交給代理了嗎?取得 2Slides API 金鑰(500 點免費點數),今天就安裝 Hermes Agent——15 分鐘內完成全部設定。

About 2Slides

Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.

Try For Free