2Slides Logo
Hermes Agent + 2Slides 生成 PPT 完整教程(含安装与调用示例)
2Slides Team
5 min read

Hermes Agent + 2Slides 生成 PPT 完整教程(含安装与调用示例)

Hermes Agent 是 Nous Research 推出的可自我进化的自主智能体,它通过开放的 agentskills.io 技能标准原生对接 2Slides。把 slides-generation-2slides-skills 技能包放到

~/.hermes/skills/
,再把 2Slides API key 写入环境变量,Hermes 就能用一句话在 30–60 秒内生成完整的 16:9 幻灯片。同一次安装还会把 2Slides 的七个 API 端点——文本生成幻灯片、PDF 转幻灯片、参考图风格匹配、多人解说、主题搜索、任务轮询、素材导出——全部以一等公民工具的形式暴露给 Hermes。因为 Hermes 拥有闭环学习能力,可以从经验中写出新技能,它会随使用不断优化调用 2Slides 的方式:为你的听众挑选更合适的主题、给投资人 deck 优先使用 4K 输出、粘贴截图时自动切换到 Create-Like-This、无需重复提醒就能排程周期性报告。本教程将讲解安装流程、最常用的五种调用范式、面向进阶用户的直接 API 调用方式,以及首次集成最容易踩的坑。

什么是 Hermes Agent?

Hermes Agent 是 Nous Research 打造的一款自主、常驻服务器的 AI 智能体。与 IDE 内嵌 copilot 或聊天机器人套壳不同,Hermes 以长生命周期进程的形式运行在你的服务器上(一台 5 美元的 VPS 即可),在多次会话之间积累记忆,并且——这是它独有的能力——能从经验中为自己编写新技能。它与模型解耦(可接入 Nous Portal、OpenRouter、OpenAI、Anthropic、NVIDIA NIM 或自定义端点),内置 40 多个工具,支持 MCP server 集成,并通过统一网关让你用 Telegram、Discord、Slack、WhatsApp、Signal、邮件或 CLI 向它发消息。项目地址:github.com/NousResearch/hermes-agent

对演示文稿工作流而言,Hermes 最有意思的特性是它的 闭环学习回路:完成一个复杂任务后,Hermes 可以把它沉淀为一个可复用的技能,并在后续使用中不断打磨这个技能。正是这个回路,让幻灯片生成能力会随时间越来越贴合你的需求。

为什么把 Hermes 和 2Slides 组合起来用?

这组搭配的协同效应格外突出,原因有三:

  1. Hermes 自己没有原生幻灯片工具。 它内置的 40 多个工具覆盖搜索、浏览器自动化、视觉、图像生成、TTS——却唯独缺少 deck 制作。2Slides 恰好补齐了这一能力空缺。
  2. 2Slides 把完整的 API 全都暴露为工具,而不是只暴露一个端点。2Slides 技能包 封装了七种截然不同的生成模式(文本、PDF 导入、参考图克隆、解说、导出、主题搜索、状态轮询),这样 Hermes 就能按意图挑选合适的模式,而不必把所有请求都塞进一个 generate 端点。
  3. Hermes 的自我进化回路会持续打磨这次集成。 第一次要生成 deck 时,Hermes 会用默认参数调用
    generate
    ;到第五次时,它已经学到你 Q1 的董事会 deck 需要 4K、全员大会需要 16:9、客户更新需要多人解说——然后自动把这些偏好写进一个派生技能里。

这和 Claude MCP 集成 是两种截然不同的模式,后者中 LLM 只是无状态地调用工具。Hermes 会记住。

前置条件

开始之前,你需要准备:

  • 一台装有 Python 3.10+ 和 Bash 的 Linux/macOS 机器或 VPS
  • 一个 2Slides 账号和 API key——前往 2slides.com/api 注册(新账号赠送 500 免费积分,够用来生成约 50 页文本幻灯片,或 5 页 Nano Banana 2K 输出)
  • 一个 LLM 提供商的 key(Nous Portal、OpenRouter、OpenAI 或 Anthropic),用作 Hermes 的推理循环
  • 首次安装大约需要 15 分钟

第 1 步 — 安装 Hermes Agent

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash source ~/.bashrc hermes setup

hermes setup
向导会询问 LLM 提供商、默认模型以及可选的消息网关凭据(首次安装可以跳过网关配置——稍后再启用 Telegram/Slack 也不迟)。安装结束后,运行
hermes
确认安装成功——你应该会进入交互式 CLI 提示符。

第 2 步 — 安装 2Slides 技能包

2Slides 技能包托管在 github.com/2slides/slides-generation-2slides-skills,遵循 Hermes 原生支持的开放标准 agentskills.io。直接克隆到用户技能目录即可:

mkdir -p ~/.hermes/skills cd ~/.hermes/skills git clone https://github.com/2slides/slides-generation-2slides-skills.git slides-2slides

然后把 2Slides API key 写入 shell 环境,让技能里的脚本能够通过鉴权:

echo 'export SLIDES_2SLIDES_API_KEY="sk-2s-..."' >> ~/.bashrc source ~/.bashrc

重启 Hermes CLI,输入

/skills
——列表里应该能看到
slides-2slides
,以及它提供的七个函数(generate、create-pdf-slides、create-like-this、generate-narration、download-slides-pages-voices、search-themes、get-job-status)。

第 3 步 — 生成你的第一份 deck

最简单的用法就是在 Hermes 里直接用自然语言下达指令:

> 生成一份关于 2026 年 AI Agent 现状 的 10 页幻灯片,重点比较自主智能体与聊天机器人,使用现代深色主题

Hermes 会依次:

  1. 用查询词 "modern dark" 调用
    search-themes
    选出主题 ID
  2. 带上你的内容和该主题调用
    generate
  3. 每 5 秒轮询一次
    jobs/:id
    ,直到任务完成
  4. 返回可分享的
    slideUrl
    pdfUrl

10 页 deck 的整体耗时(同步模式):30–60 秒。响应内包含

slideUrl
、页数和生成模式。

最实用的五种调用范式

并不是每个请求都应该走

generate
。2Slides 技能包暴露了不同的模式,方便 Hermes(和你)挑选合适的入口。下面这五种是日常最常用的,每个都附带示例指令:

意图Hermes 指令对应端点
从零起草 deck"做一份关于 X 的幻灯片"
POST /api/v1/slides/generate
转换 PDF / 白皮书"把这份研究论文转成 deck:/path/to/paper.pdf"
POST /api/v1/slides/create-pdf-slides
匹配视觉风格"按这张截图的风格做一份关于 X 的幻灯片:https://…"
POST /api/v1/slides/create-like-this
添加 AI 解说"给我上一份 deck 加一段使用 Aoede 音色的专业解说"
POST /api/v1/slides/generate-narration
打包导出 ZIP"把那个任务的所有幻灯片和语音打包成 ZIP 下载下来"
POST /api/v1/slides/download-slides-pages-voices

所有端点共享同一套异步包络——提交 → 拿到

jobId
→ 轮询
GET /api/v1/jobs/:id
→ 接收文件 URL。正是这种统一的形态,让 Hermes 能把它们当作一整套技能来优雅调用,而不是七个互不兼容的工具。

直接调用 API(用于自定义工具)

如果你想用自定义 Hermes 工具替代封装好的技能包——比如做一个特定业务场景的 "用我们的品牌主题生成季度 OKR deck" 工具——可以让 Hermes 直接执行一个调用 2Slides API 的 Python 脚本。

一个最小化的 "生成并等待" 模式:

import os, time, requests API = "https://2slides.com/api/v1" H = {"Authorization": f"Bearer {os.environ['SLIDES_2SLIDES_API_KEY']}"} resp = requests.post(f"{API}/slides/generate", headers=H, json={ "content": "Q1 2026 board update: ARR, retention, roadmap", "themeId": "theme_modern_dark", "mode": "async", "aspectRatio": "16:9", "resolution": "2K", }).json() job_id = resp["jobId"] while True: job = requests.get(f"{API}/jobs/{job_id}", headers=H).json() if job["status"] in ("completed", "failed"): break time.sleep(5) print(job["slideUrl"], job["pdfUrl"])

完整的异步任务架构和重试策略见 Build an AI Presentation Agent: Developer Guide。Hermes 用来决定调用哪种模式的系统提示词模式,参考 System Prompts for AI Presentation Agents

自我进化回路实战

接下来这个模式,是 Hermes 区别于其他 agent 运行时的关键。第一次让 Hermes 做面向客户的 deck 时,它产出的东西多半比较通用。但 Hermes 能——而且会——在任务完成后创建一个派生技能:

/skills new customer-update-deck

自动生成的技能会记录下这次成功的细节:你认可的主题 ID、宽高比、解说使用的音色,以及你要求在首页使用的具体措辞。下次你说 "客户更新 deck" 时,Hermes 就会调用这个技能,而不是直接调用原始的

slides-2slides.generate
函数。经过十次迭代,这个技能会沉淀出一整套无状态工具永远也记不住的偏好。

这就是为什么把一个能自我进化的 agent 与一个多端点 API 配对——而不是和一个单点生成器——会如此重要。学习回路需要有东西可学。

为幻灯片任务排程

Hermes 自带一个 cron 调度器,一句话就能配好定时任务:

> 每周一早上 9 点,根据我们的内部状态文档生成一份周报 deck,使用 Puck 音色添加解说,然后把 PDF 发到 Slack 的 #exec-updates 频道

Hermes 会把它存为一个定时任务(用

hermes cron list
可以查看),然后自动执行。由于消息网关原生支持 Slack、Discord、Telegram 和 WhatsApp,最终 deck 可以直接投递到你指定的任意渠道,不需要额外的集成工作——成品 deck 链接或 PDF 会作为机器人消息出现在目标平台。

常见问题与排查

技能没出现在

/skills
列表里。 确认你把项目克隆到了
~/.hermes/skills/slides-2slides/
下,并且
SKILL.md
位于该目录的顶层。运行
hermes tools
刷新缓存。

调用 2Slides 返回 "401 Unauthorized"。 说明技能的 Python 子进程看不到

SLIDES_2SLIDES_API_KEY
环境变量。在 macOS launchd 环境下,把这个 key 写入
~/.config/hermes/env
(Hermes 会无条件 source 这个文件),而不是
.bashrc

deck 生成卡在

pending
状态超过 120 秒。 你多半是在高峰时段用同步模式提交的。改用
--mode async
重新提交并轮询
jobs/:id
——异步请求会进入独立的队列,即使在高负载下通常也能在 90 秒内完成。

生成成功后解说失败。 解说需要传入已完成生成任务的

jobId
,而不是
slideUrl
。检查 Hermes 技能里传入的是
jobId
(UUID)而不是 deck URL。

Hermes 选错主题。 学习回路的早期阶段这是正常现象。你纠正一两次后,Hermes 会把偏好写进记忆,后续调用就会做对。想加速这一过程,可以直接告诉它:"记住,我所有客户 deck 都用 Executive Minimal 主题。"

常见问题

Hermes Agent 能在 2Slides 免费版上使用吗?

可以。新 2Slides 账号赠送 500 免费积分,大约够用来生成:50 页标准文本幻灯片(10 积分/页)、5 页 Nano Banana 2K 输出(100 积分/页),或约 2 页带完整解说的输出(210 积分/页)。Hermes 本身采用 MIT 许可证,完全免费,你只需要为所选 LLM 提供商付费。

2Slides 技能包是 MCP server 还是 agentskills.io 技能?

它是一个 agentskills.io 技能——Hermes、OpenClaw 等多个 agent 原生支持的开放标准。2Slides 同样提供独立的 MCP server(参见 MCP 如何改变演示文稿工作流),但对 Hermes 而言,技能包是更快的路径,因为它直接落到

~/.hermes/skills/
,不需要额外管理 MCP server 进程。

这和使用 Claude + 2Slides MCP 有什么区别?

Claude 通过 MCP 调用工具是无状态的——每次对话都从零开始。Hermes 则保有持久记忆,并能从经验中写出新技能,集成会随时间越做越好,而不是每次都重复同样的默认配置。对一次性生成而言,两种方式效果相当。但对周期性工作流(周报、月度董事会 deck、定期客户更新)而言,Hermes 的学习回路优势明显,因为它能沉淀那些无状态 agent 每次都需要被重新告知的偏好。

Hermes 能自动把 deck 投递到 Slack 或 Telegram 吗?

可以。Hermes 的单网关架构意味着生成 deck 的同一个进程可以把成品回传到任何已连接的平台。在

hermes setup
里配好 Telegram 或 Slack 网关后,"生成这份 deck 并把 PDF 发到 Slack 的 #board-updates" 这样的指令就能端到端打通——Hermes 会调用 2Slides、轮询任务、下载 PDF,然后发送到目标频道。

支持哪些语言和输出分辨率?

2Slides 技能包支持 19 种语言(Auto、英语、西班牙语、法语、德语、意大利语、葡萄牙语、俄语、日语、韩语、简体/繁体中文、阿拉伯语、印地语、印尼语、越南语、土耳其语、波兰语、泰语、希腊语),分辨率 1K / 2K / 4K,宽高比从 1:1 到 21:9,包括面向移动端观众的竖屏 9:16。积分消耗随分辨率递增:Fast PPT 10 积分/页,Nano Banana 2K 100 积分/页,Nano Banana 4K 200 积分/页。

Hermes 的自我进化会不会过拟合?

在实际使用中不会——技能是按用户隔离的,而且完全可审阅。用

/skills
可以查看自动生成的技能,用
/skills edit <name>
/skills remove <name>
可以编辑或删除。如果 Hermes 过度偏好某个你已经不喜欢的主题或音色,对话里纠正一次,技能就会自动更新。想深入了解 Hermes 这类 agent 如何融入更大的 AI 自动化图景,可以阅读 The Future of AI Agents in Presentation Creation2Slides Agent Skills: Automate AI Slide Workflows

结语

Hermes Agent 加 2Slides 不是又一次普通的 "AI 集成"——这是首次把一个能自我进化的自主智能体,与一个足够广的多端点演示文稿 API 组合起来,让学习回路真正有东西可学。其他组合要么只是无状态的工具调用(Claude MCP、ChatGPT 插件),要么只是一个没有足够能力面可打磨的单端点生成器。Hermes 的记忆加上 2Slides 的七个端点,才是真正能让学习回路产生价值的形态。

2026 年最务实的路径是:花 15 分钟把两样都装好,手动生成三四份 deck 让 Hermes 观察你的偏好,然后把调度器打开。一个月内,Hermes 就能自动产出你的周报、季度董事会 deck 和客户更新 deck——用你的主题、你的音色、你的宽高比、你的投递渠道——因为每一个对应的技能都是它自己写出来的。

准备把 deck 工作流交给它了?领取 2Slides API key(500 免费积分),今天就装上 Hermes Agent——整体不到 15 分钟。

About 2Slides

Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.

Try For Free