2Slides Logo
Hermes Agent + 2Slides: jak generować prezentacje AI (pełny przewodnik)
2Slides Team
11 min read

Hermes Agent + 2Slides: jak generować prezentacje AI (pełny przewodnik)

Hermes Agent — samouczący się autonomiczny agent od Nous Research — integruje się natywnie z 2Slides poprzez otwarty standard skilli agentskills.io. Zainstaluj paczkę slides-generation-2slides-skills w katalogu

~/.hermes/skills/
, dodaj klucz API 2Slides do środowiska, a Hermes wygeneruje pełną prezentację 16:9 z jednego zdania w 30–60 sekund. Ta sama instalacja udostępnia też siedem endpointów API 2Slides — text-to-slides, PDF-to-slides, dopasowanie stylu do obrazu referencyjnego, narrację wielogłosową, wyszukiwarkę motywów, odpytywanie zadań oraz eksport zasobów — jako pełnoprawne narzędzia Hermesa. Ponieważ Hermes ma zamkniętą pętlę uczenia, która zapisuje nowe skille na podstawie doświadczenia, aktywnie doskonali sposób, w jaki używa 2Slides: dobiera trafniejsze motywy do Twojej publiczności, preferuje wyjście 4K dla decków inwestorskich, przełącza się na Create-Like-This, gdy wklejasz zrzut ekranu, i planuje cykliczne raporty bez dwukrotnego proszenia. Ten przewodnik przeprowadza Cię przez instalację, pięć najczęstszych wzorców wywołań, bezpośrednie użycie API dla zaawansowanych użytkowników oraz pułapki, które łapią większość osób przy pierwszej integracji.

Czym jest Hermes Agent?

Hermes Agent to autonomiczny agent AI rezydujący na serwerze, stworzony przez Nous Research. W odróżnieniu od copilotów wbudowanych w IDE czy nakładek na chatboty, Hermes działa jako długo żyjący proces na Twoim serwerze (lub na VPS za 5 dolarów), gromadzi pamięć pomiędzy sesjami i — co unikalne — sam zapisuje własne skille na podstawie doświadczenia. Jest niezależny od modelu (działa z Nous Portal, OpenRouter, OpenAI, Anthropic, NVIDIA NIM lub własnymi endpointami), zawiera ponad 40 wbudowanych narzędzi, obsługuje integrację z serwerami MCP i udostępnia jedną bramkę, która pozwala pisać do niego z Telegrama, Discorda, Slacka, WhatsAppa, Signala, e-maila lub CLI. Źródło: github.com/NousResearch/hermes-agent.

Funkcją, która sprawia, że Hermes jest szczególnie interesujący dla workflowów prezentacyjnych, jest jego zamknięta pętla uczenia: po każdym złożonym zadaniu Hermes może utworzyć skill wielokrotnego użytku, a następnie ulepszać go w kolejnych wywołaniach. To właśnie ta pętla sprawia, że generowanie slajdów staje się z czasem coraz lepsze.

Dlaczego łączyć Hermesa z 2Slides?

To połączenie jest wyjątkowo synergiczne z trzech powodów:

  1. Hermes nie ma natywnego narzędzia do slajdów. Jego ponad 40 wbudowanych narzędzi obejmuje wyszukiwanie w sieci, automatyzację przeglądarki, wizję, generowanie obrazów, TTS — ale nie tworzenie prezentacji. 2Slides wypełnia dokładnie tę lukę kompetencyjną.
  2. 2Slides udostępnia pełne API jako zestaw narzędzi, a nie jeden endpoint. Paczka skilli 2Slides opakowuje siedem odrębnych trybów generowania (tekst, import PDF, klonowanie obrazu referencyjnego, narracja, eksport, wyszukiwanie motywów, odpytywanie statusu), więc Hermes może wybrać właściwy tryb na podstawie intencji, zamiast przepychać każde żądanie przez jeden generyczny endpoint.
  3. Pętla samodoskonalenia Hermesa udoskonala integrację w czasie. Przy pierwszym żądaniu prezentacji Hermes wywołuje
    generate
    z domyślnymi ustawieniami. Przy piątym już wie, że Twoje kwartalne decki dla zarządu wymagają 4K, all-handsy — formatu 16:9, a aktualizacje dla klientów — narracji wielogłosowej — i zapisuje te preferencje w automatycznie wygenerowanym skillu następczym.

To prawdziwie odmienny wzorzec niż integracja Claude MCP, w której LLM wywołuje narzędzia bezstanowo. Hermes pamięta.

Wymagania wstępne

Zanim zaczniesz, potrzebujesz:

  • Maszyny z Linux/macOS lub VPS z Pythonem 3.10+ oraz Bashem
  • Konta 2Slides i klucza API — zarejestruj się na 2slides.com/api (nowe konta otrzymują 500 darmowych kredytów, co starcza na około 50 stron text-to-slide lub 5 stron Nano Banana 2K)
  • Klucza dostawcy LLM (Nous Portal, OpenRouter, OpenAI lub Anthropic), którego Hermes użyje do swojej pętli rozumowania
  • Około 15 minut na pierwszą konfigurację

Krok 1 — zainstaluj Hermes Agent

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash source ~/.bashrc hermes setup

Kreator

hermes setup
zapyta o dostawcę LLM, domyślny model oraz opcjonalne poświadczenia bramki wiadomości (pomiń konfigurację bramki przy pierwszym podejściu — Telegrama/Slacka możesz włączyć później). Po zakończeniu konfiguracji potwierdź instalację komendą
hermes
— powinieneś trafić do interaktywnego promptu CLI.

Krok 2 — zainstaluj skill 2Slides

Skill 2Slides znajduje się pod adresem github.com/2slides/slides-generation-2slides-skills i zgodny jest z otwartym standardem agentskills.io, który Hermes natywnie wspiera. Umieść go w katalogu skilli użytkownika:

mkdir -p ~/.hermes/skills cd ~/.hermes/skills git clone https://github.com/2slides/slides-generation-2slides-skills.git slides-2slides

Następnie dodaj swój klucz API 2Slides do zmiennych środowiskowych, aby skrypty skilla mogły się uwierzytelnić:

echo 'export SLIDES_2SLIDES_API_KEY="sk-2s-..."' >> ~/.bashrc source ~/.bashrc

Zrestartuj CLI Hermesa i wpisz

/skills
— powinieneś zobaczyć
slides-2slides
na liście wraz z siedmioma dostępnymi funkcjami (generate, create-pdf-slides, create-like-this, generate-narration, download-slides-pages-voices, search-themes, get-job-status).

Krok 3 — wygeneruj pierwszą prezentację

Najprostsze wywołanie to żądanie w języku naturalnym wewnątrz Hermesa:

> Create a 10-slide presentation about the State of AI Agents in 2026, focusing on autonomous agents vs chatbots, and use a modern dark theme

Hermes wykona:

  1. Wywoła
    search-themes
    z zapytaniem „modern dark”, aby wybrać ID motywu
  2. Wywoła
    generate
    z Twoją treścią i wybranym motywem
  3. Odpytuje
    jobs/:id
    co 5 sekund, aż zadanie się zakończy
  4. Zwraca linkowalny
    slideUrl
    oraz
    pdfUrl

Łączny czas rzeczywisty dla 10-stronicowej prezentacji: 30–60 sekund w trybie sync. Odpowiedź zawiera

slideUrl
, liczbę stron oraz tryb generowania.

Pięć najbardziej przydatnych wzorców wywołań

Nie każde żądanie powinno iść przez

generate
. Skill 2Slides udostępnia odrębne tryby, dzięki czemu Hermes (i Ty) możecie wybrać właściwy. Oto pięć, których będziesz używać najczęściej, wraz z przykładowymi promptami:

IntencjaPrompt dla HermesaBazowy endpoint
Prezentacja od zera„Zrób slajdy o X”
POST /api/v1/slides/generate
Konwersja PDF / white paper„Przerób ten artykuł badawczy na prezentację: /path/to/paper.pdf”
POST /api/v1/slides/create-pdf-slides
Dopasowanie stylu wizualnego„Utwórz slajdy o X w stylu tego zrzutu ekranu: https://…”
POST /api/v1/slides/create-like-this
Dodanie narracji AI„Dodaj profesjonalną narrację głosem Aoede do mojej ostatniej prezentacji”
POST /api/v1/slides/generate-narration
Eksport do ZIP„Pobierz wszystkie slajdy i nagrania głosowe z tego zadania jako ZIP”
POST /api/v1/slides/download-slides-pages-voices

Wszystkie endpointy korzystają z tej samej asynchronicznej koperty — wyślij → otrzymaj

jobId
→ odpytuj
GET /api/v1/jobs/:id
→ odbierz URL-e plików. Ta spójna forma sprawia, że Hermes obsługuje je czysto jako zestaw skilli, a nie siedem niekompatybilnych narzędzi.

Bezpośrednie użycie API (do własnych narzędzi)

Jeśli zamiast paczki skilla chcesz zbudować własne narzędzie Hermesa — na przykład dedykowane „Wygeneruj kwartalny deck OKR z naszym motywem marki” — możesz wywoływać API 2Slides bezpośrednio ze skryptu Pythonowego wykonywanego przez Hermesa.

Minimalny wzorzec „generuj i czekaj”:

import os, time, requests API = "https://2slides.com/api/v1" H = {"Authorization": f"Bearer {os.environ['SLIDES_2SLIDES_API_KEY']}"} resp = requests.post(f"{API}/slides/generate", headers=H, json={ "content": "Q1 2026 board update: ARR, retention, roadmap", "themeId": "theme_modern_dark", "mode": "async", "aspectRatio": "16:9", "resolution": "2K", }).json() job_id = resp["jobId"] while True: job = requests.get(f"{API}/jobs/{job_id}", headers=H).json() if job["status"] in ("completed", "failed"): break time.sleep(5) print(job["slideUrl"], job["pdfUrl"])

Pełna architektura zadań asynchronicznych i wzorce ponawiania prób — zobacz Build an AI Presentation Agent: Developer Guide. Wzorce promptów systemowych, których Hermes używa do wyboru między trybami, znajdziesz w System Prompts for AI Presentation Agents.

Pętla samodoskonalenia w praktyce

Oto wzorzec, który odróżnia Hermesa od innych runtime'ów agentowych. Przy pierwszym żądaniu prezentacji dla klienta Hermes wyprodukuje coś generycznego. Ale Hermes może — i zrobi to — utworzyć skill następczy po zakończeniu zadania:

/skills new customer-update-deck

Automatycznie wygenerowany skill uchwytuje to, co zadziałało: ID zatwierdzonego motywu, proporcje ekranu, nazwę głosu do narracji, konkretne frazy, o które poprosiłeś na slajdzie otwierającym. Następnym razem, gdy powiesz „customer update deck”, Hermes wywoła ten skill zamiast surowej funkcji

slides-2slides.generate
. Po dziesięciu iteracjach skill akumuluje preferencje, których bezstanowe narzędzie nigdy by nie zapamiętało.

Właśnie dlatego sparowanie samouczącego się agenta z wieloendpointowym API — a nie z generatorem jednorazowym — ma znaczenie. Pętla uczenia ma wtedy coś, przy czym może się uczyć.

Harmonogramowanie cyklicznych zadań slajdowych

Hermes zawiera wbudowany scheduler cron. Cykliczne zadanie ustawisz w jednej linijce:

> Every Monday at 9am, generate a weekly status deck from our internal status doc, add narration with the Puck voice, and post the PDF to #exec-updates on Slack

Hermes zapisuje to jako zaplanowane zadanie (

hermes cron list
, aby je sprawdzić) i wykonuje je autonomicznie. Ponieważ bramka wiadomości natywnie obsługuje Slacka, Discorda, Telegrama i WhatsAppa, gotowy deck może wylądować w dowolnym kanale bez dodatkowej pracy integracyjnej — link do prezentacji lub PDF przychodzi jako wiadomość bota na wskazanej platformie.

Typowe problemy i rozwiązania

Skill nie pojawia się w

/skills
. Upewnij się, że klon znajduje się pod
~/.hermes/skills/slides-2slides/
, a plik
SKILL.md
leży bezpośrednio w tym katalogu. Uruchom
hermes tools
, aby odświeżyć.

„401 Unauthorized” z 2Slides. Zmienna środowiskowa

SLIDES_2SLIDES_API_KEY
nie jest widoczna dla podprocesu Pythonowego skilla. Na macOS z launchd dodaj klucz do
~/.config/hermes/env
(który Hermes zawsze wczytuje), a nie do
.bashrc
.

Generowanie zatrzymane w

pending
ponad 120 sekund. Prawdopodobnie wysłałeś żądanie w trybie sync w godzinach szczytu. Wyślij ponownie z
--mode async
i odpytuj
jobs/:id
— żądania asynchroniczne kolejkują się niezależnie i zwykle kończą w mniej niż 90 sekund nawet pod obciążeniem.

Narracja kończy się błędem po udanym generowaniu. Narracja wymaga

jobId
z ukończonego zadania generowania, a nie
slideUrl
. Sprawdź, czy skill Hermesa przekazuje
jobId
(UUID), a nie URL prezentacji.

Hermes wybiera zły motyw. Na początku pętli uczenia to normalne. Po jedno- lub dwukrotnym poprawieniu motywu Hermes zapisuje preferencję w pamięci i robi to dobrze w kolejnych wywołaniach. Możesz ten proces przyspieszyć, mówiąc wprost: „zapamiętaj, że wszystkie moje decki dla klientów mają używać motywu Executive Minimal”.

Najczęściej zadawane pytania

Czy Hermes Agent działa z 2Slides na darmowym planie?

Tak. Nowe konta 2Slides otrzymują 500 darmowych kredytów, co obejmuje około 50 stron standardowego text-to-slide (10 kredytów/stronę) albo około 5 stron Nano Banana 2K (100 kredytów/stronę), albo ~2 strony w pełni znarrowanego wyjścia (210 kredytów/stronę). Sam Hermes jest na licencji MIT i darmowy; płacisz wyłącznie za dostawcę LLM, do którego go podłączasz.

Czy skill 2Slides to serwer MCP, czy skill agentskills.io?

To skill agentskills.io — otwarty standard, który Hermes, OpenClaw i kilka innych agentów wspierają natywnie. 2Slides udostępnia też oddzielny serwer MCP (zobacz How MCP Is Changing Presentation Workflows), ale dla samego Hermesa paczka skilla jest szybszą drogą, bo trafia wprost do

~/.hermes/skills/
i nie wymaga zarządzania oddzielnym procesem MCP.

Czym różni się to od użycia Claude + 2Slides MCP?

Claude przez MCP wywołuje narzędzia bezstanowo — każda rozmowa zaczyna się od zera. Hermes utrzymuje trwałą pamięć i zapisuje nowe skille na podstawie doświadczenia, więc integracja z czasem staje się lepsza, zamiast powtarzać te same ustawienia domyślne przy każdym wywołaniu. Dla jednorazowych generacji oba podejścia są równoważne. Dla cyklicznych workflowów (cotygodniowe raporty, comiesięczne decki zarządu, powtarzalne aktualizacje dla klientów) pętla uczenia Hermesa wyraźnie wygrywa, bo zapamiętuje preferencje, które agentowi bezstanowemu trzeba podawać za każdym razem.

Czy Hermes może przekazać gotową prezentację do Slacka albo Telegrama automatycznie?

Tak. Architektura jednej bramki Hermesa oznacza, że ten sam proces, który wygenerował prezentację, może wysłać ją z powrotem na dowolną podłączoną platformę. Po skonfigurowaniu bramki Telegrama lub Slacka przez

hermes setup
prompt w stylu „wygeneruj tę prezentację i wyślij PDF do #board-updates na Slacku” działa end-to-end bez dodatkowej integracji — Hermes wywoła 2Slides, odczeka na zadanie, pobierze PDF i opublikuje go w kanale.

Jakie języki i rozdzielczości wyjściowe są obsługiwane?

Skill 2Slides obsługuje 19 języków (Auto, angielski, hiszpański, francuski, niemiecki, włoski, portugalski, rosyjski, japoński, koreański, chiński uproszczony/tradycyjny, arabski, hindi, indonezyjski, wietnamski, turecki, polski, tajski, grecki), rozdzielczości 1K / 2K / 4K oraz proporcje od 1:1 do 21:9, w tym pionową (9:16) dla odbiorców mobile-first. Koszt kredytów skaluje się wraz z rozdzielczością: 10 kredytów/stronę dla Fast PPT, 100 dla Nano Banana 2K, 200 dla Nano Banana 4K.

Czy pętla samodoskonalenia Hermesa może się przeuczyć?

W praktyce nie — skille są zasięgiem użytkownika i są przeglądalne przez człowieka. Możesz podejrzeć automatycznie wygenerowane skille komendą

/skills
i edytować je lub usuwać przez
/skills edit <name>
lub
/skills remove <name>
. Jeśli Hermes nadmiernie preferuje motyw lub głos, którego już nie lubisz, popraw go raz w rozmowie, a skill się zaktualizuje. Szersze omówienie, jak agenci tacy jak Hermes wpisują się w krajobraz automatyzacji AI, znajdziesz w The Future of AI Agents in Presentation Creation oraz 2Slides Agent Skills: Automate AI Slide Workflows.

Podsumowanie

Hermes Agent plus 2Slides to nie jest kolejna „integracja AI” — to pierwsze połączenie, w którym samouczący się autonomiczny agent zostaje sparowany z wieloendpointowym API prezentacji o powierzchni wystarczająco bogatej, żeby było przy czym się uczyć. Każde inne połączenie to albo bezstanowe wywołanie narzędzia (Claude MCP, wtyczki ChatGPT), albo generator jednoendpointowy bez wystarczającego zakresu możliwości, aby się go dopracowywać. Pamięć Hermesa plus siedem odrębnych endpointów 2Slides to kształt, który rzeczywiście wynagradza pętlę uczenia.

Praktyczna ścieżka w 2026 wygląda tak: zainstaluj oba w 15 minut, wygeneruj ręcznie trzy lub cztery prezentacje, żeby Hermes zaobserwował Twoje preferencje, a potem pozwól schedulerowi przejąć pracę. W ciągu miesiąca Hermes produkuje cotygodniowy raport, kwartalny deck zarządu i deck z aktualizacjami dla klientów na autopilocie — z Twoim motywem, Twoim głosem, Twoimi proporcjami i Twoim kanałem dostawy — bo sam napisał skill dla każdego z nich.

Gotów przekazać swój workflow prezentacyjny? Zdobądź klucz API 2Slides (500 darmowych kredytów) i zainstaluj Hermes Agent już dziś — pełna konfiguracja w mniej niż 15 minut.

About 2Slides

Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.

Try For Free