

Hermes Agent + 2Slides 生成 PPT 完整教程(含安装与调用示例)
Hermes Agent 是 Nous Research 推出的可自我进化的自主智能体,它通过开放的 agentskills.io 技能标准原生对接 2Slides。把 slides-generation-2slides-skills 技能包放到 ~/.hermes/skills/
什么是 Hermes Agent?
Hermes Agent 是 Nous Research 打造的一款自主、常驻服务器的 AI 智能体。与 IDE 内嵌 copilot 或聊天机器人套壳不同,Hermes 以长生命周期进程的形式运行在你的服务器上(一台 5 美元的 VPS 即可),在多次会话之间积累记忆,并且——这是它独有的能力——能从经验中为自己编写新技能。它与模型解耦(可接入 Nous Portal、OpenRouter、OpenAI、Anthropic、NVIDIA NIM 或自定义端点),内置 40 多个工具,支持 MCP server 集成,并通过统一网关让你用 Telegram、Discord、Slack、WhatsApp、Signal、邮件或 CLI 向它发消息。项目地址:github.com/NousResearch/hermes-agent。
对演示文稿工作流而言,Hermes 最有意思的特性是它的 闭环学习回路:完成一个复杂任务后,Hermes 可以把它沉淀为一个可复用的技能,并在后续使用中不断打磨这个技能。正是这个回路,让幻灯片生成能力会随时间越来越贴合你的需求。
为什么把 Hermes 和 2Slides 组合起来用?
这组搭配的协同效应格外突出,原因有三:
- Hermes 自己没有原生幻灯片工具。 它内置的 40 多个工具覆盖搜索、浏览器自动化、视觉、图像生成、TTS——却唯独缺少 deck 制作。2Slides 恰好补齐了这一能力空缺。
- 2Slides 把完整的 API 全都暴露为工具,而不是只暴露一个端点。2Slides 技能包 封装了七种截然不同的生成模式(文本、PDF 导入、参考图克隆、解说、导出、主题搜索、状态轮询),这样 Hermes 就能按意图挑选合适的模式,而不必把所有请求都塞进一个 generate 端点。
- Hermes 的自我进化回路会持续打磨这次集成。 第一次要生成 deck 时,Hermes 会用默认参数调用 ;到第五次时,它已经学到你 Q1 的董事会 deck 需要 4K、全员大会需要 16:9、客户更新需要多人解说——然后自动把这些偏好写进一个派生技能里。
generate
这和 Claude MCP 集成 是两种截然不同的模式,后者中 LLM 只是无状态地调用工具。Hermes 会记住。
前置条件
开始之前,你需要准备:
- 一台装有 Python 3.10+ 和 Bash 的 Linux/macOS 机器或 VPS
- 一个 2Slides 账号和 API key——前往 2slides.com/api 注册(新账号赠送 500 免费积分,够用来生成约 50 页文本幻灯片,或 5 页 Nano Banana 2K 输出)
- 一个 LLM 提供商的 key(Nous Portal、OpenRouter、OpenAI 或 Anthropic),用作 Hermes 的推理循环
- 首次安装大约需要 15 分钟
第 1 步 — 安装 Hermes Agent
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash source ~/.bashrc hermes setup
hermes setuphermes第 2 步 — 安装 2Slides 技能包
2Slides 技能包托管在 github.com/2slides/slides-generation-2slides-skills,遵循 Hermes 原生支持的开放标准 agentskills.io。直接克隆到用户技能目录即可:
mkdir -p ~/.hermes/skills cd ~/.hermes/skills git clone https://github.com/2slides/slides-generation-2slides-skills.git slides-2slides
然后把 2Slides API key 写入 shell 环境,让技能里的脚本能够通过鉴权:
echo 'export SLIDES_2SLIDES_API_KEY="sk-2s-..."' >> ~/.bashrc source ~/.bashrc
重启 Hermes CLI,输入
/skillsslides-2slides第 3 步 — 生成你的第一份 deck
最简单的用法就是在 Hermes 里直接用自然语言下达指令:
> 生成一份关于 2026 年 AI Agent 现状 的 10 页幻灯片,重点比较自主智能体与聊天机器人,使用现代深色主题
Hermes 会依次:
- 用查询词 "modern dark" 调用 选出主题 ID
search-themes - 带上你的内容和该主题调用
generate - 每 5 秒轮询一次 ,直到任务完成
jobs/:id - 返回可分享的 和
slideUrlpdfUrl
10 页 deck 的整体耗时(同步模式):30–60 秒。响应内包含
slideUrl最实用的五种调用范式
并不是每个请求都应该走
generate| 意图 | Hermes 指令 | 对应端点 |
|---|---|---|
| 从零起草 deck | "做一份关于 X 的幻灯片" | POST /api/v1/slides/generate |
| 转换 PDF / 白皮书 | "把这份研究论文转成 deck:/path/to/paper.pdf" | POST /api/v1/slides/create-pdf-slides |
| 匹配视觉风格 | "按这张截图的风格做一份关于 X 的幻灯片:https://…" | POST /api/v1/slides/create-like-this |
| 添加 AI 解说 | "给我上一份 deck 加一段使用 Aoede 音色的专业解说" | POST /api/v1/slides/generate-narration |
| 打包导出 ZIP | "把那个任务的所有幻灯片和语音打包成 ZIP 下载下来" | POST /api/v1/slides/download-slides-pages-voices |
所有端点共享同一套异步包络——提交 → 拿到
jobIdGET /api/v1/jobs/:id直接调用 API(用于自定义工具)
如果你想用自定义 Hermes 工具替代封装好的技能包——比如做一个特定业务场景的 "用我们的品牌主题生成季度 OKR deck" 工具——可以让 Hermes 直接执行一个调用 2Slides API 的 Python 脚本。
一个最小化的 "生成并等待" 模式:
import os, time, requests API = "https://2slides.com/api/v1" H = {"Authorization": f"Bearer {os.environ['SLIDES_2SLIDES_API_KEY']}"} resp = requests.post(f"{API}/slides/generate", headers=H, json={ "content": "Q1 2026 board update: ARR, retention, roadmap", "themeId": "theme_modern_dark", "mode": "async", "aspectRatio": "16:9", "resolution": "2K", }).json() job_id = resp["jobId"] while True: job = requests.get(f"{API}/jobs/{job_id}", headers=H).json() if job["status"] in ("completed", "failed"): break time.sleep(5) print(job["slideUrl"], job["pdfUrl"])
完整的异步任务架构和重试策略见 Build an AI Presentation Agent: Developer Guide。Hermes 用来决定调用哪种模式的系统提示词模式,参考 System Prompts for AI Presentation Agents。
自我进化回路实战
接下来这个模式,是 Hermes 区别于其他 agent 运行时的关键。第一次让 Hermes 做面向客户的 deck 时,它产出的东西多半比较通用。但 Hermes 能——而且会——在任务完成后创建一个派生技能:
/skills new customer-update-deck
自动生成的技能会记录下这次成功的细节:你认可的主题 ID、宽高比、解说使用的音色,以及你要求在首页使用的具体措辞。下次你说 "客户更新 deck" 时,Hermes 就会调用这个技能,而不是直接调用原始的
slides-2slides.generate这就是为什么把一个能自我进化的 agent 与一个多端点 API 配对——而不是和一个单点生成器——会如此重要。学习回路需要有东西可学。
为幻灯片任务排程
Hermes 自带一个 cron 调度器,一句话就能配好定时任务:
> 每周一早上 9 点,根据我们的内部状态文档生成一份周报 deck,使用 Puck 音色添加解说,然后把 PDF 发到 Slack 的 #exec-updates 频道
Hermes 会把它存为一个定时任务(用
hermes cron list常见问题与排查
技能没出现在 /skills
~/.hermes/skills/slides-2slides/SKILL.mdhermes tools调用 2Slides 返回 "401 Unauthorized"。 说明技能的 Python 子进程看不到
SLIDES_2SLIDES_API_KEY~/.config/hermes/env.bashrcdeck 生成卡在 pending
--mode asyncjobs/:id生成成功后解说失败。 解说需要传入已完成生成任务的
jobIdslideUrljobIdHermes 选错主题。 学习回路的早期阶段这是正常现象。你纠正一两次后,Hermes 会把偏好写进记忆,后续调用就会做对。想加速这一过程,可以直接告诉它:"记住,我所有客户 deck 都用 Executive Minimal 主题。"
常见问题
Hermes Agent 能在 2Slides 免费版上使用吗?
可以。新 2Slides 账号赠送 500 免费积分,大约够用来生成:50 页标准文本幻灯片(10 积分/页)、5 页 Nano Banana 2K 输出(100 积分/页),或约 2 页带完整解说的输出(210 积分/页)。Hermes 本身采用 MIT 许可证,完全免费,你只需要为所选 LLM 提供商付费。
2Slides 技能包是 MCP server 还是 agentskills.io 技能?
它是一个 agentskills.io 技能——Hermes、OpenClaw 等多个 agent 原生支持的开放标准。2Slides 同样提供独立的 MCP server(参见 MCP 如何改变演示文稿工作流),但对 Hermes 而言,技能包是更快的路径,因为它直接落到
~/.hermes/skills/这和使用 Claude + 2Slides MCP 有什么区别?
Claude 通过 MCP 调用工具是无状态的——每次对话都从零开始。Hermes 则保有持久记忆,并能从经验中写出新技能,集成会随时间越做越好,而不是每次都重复同样的默认配置。对一次性生成而言,两种方式效果相当。但对周期性工作流(周报、月度董事会 deck、定期客户更新)而言,Hermes 的学习回路优势明显,因为它能沉淀那些无状态 agent 每次都需要被重新告知的偏好。
Hermes 能自动把 deck 投递到 Slack 或 Telegram 吗?
可以。Hermes 的单网关架构意味着生成 deck 的同一个进程可以把成品回传到任何已连接的平台。在
hermes setup支持哪些语言和输出分辨率?
2Slides 技能包支持 19 种语言(Auto、英语、西班牙语、法语、德语、意大利语、葡萄牙语、俄语、日语、韩语、简体/繁体中文、阿拉伯语、印地语、印尼语、越南语、土耳其语、波兰语、泰语、希腊语),分辨率 1K / 2K / 4K,宽高比从 1:1 到 21:9,包括面向移动端观众的竖屏 9:16。积分消耗随分辨率递增:Fast PPT 10 积分/页,Nano Banana 2K 100 积分/页,Nano Banana 4K 200 积分/页。
Hermes 的自我进化会不会过拟合?
在实际使用中不会——技能是按用户隔离的,而且完全可审阅。用
/skills/skills edit <name>/skills remove <name>结语
Hermes Agent 加 2Slides 不是又一次普通的 "AI 集成"——这是首次把一个能自我进化的自主智能体,与一个足够广的多端点演示文稿 API 组合起来,让学习回路真正有东西可学。其他组合要么只是无状态的工具调用(Claude MCP、ChatGPT 插件),要么只是一个没有足够能力面可打磨的单端点生成器。Hermes 的记忆加上 2Slides 的七个端点,才是真正能让学习回路产生价值的形态。
2026 年最务实的路径是:花 15 分钟把两样都装好,手动生成三四份 deck 让 Hermes 观察你的偏好,然后把调度器打开。一个月内,Hermes 就能自动产出你的周报、季度董事会 deck 和客户更新 deck——用你的主题、你的音色、你的宽高比、你的投递渠道——因为每一个对应的技能都是它自己写出来的。
准备把 deck 工作流交给它了?领取 2Slides API key(500 免费积分),今天就装上 Hermes Agent——整体不到 15 分钟。
About 2Slides
Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.
Try For Free