2Slides Logo
AI 프레젠테이션 도구 성능 측정 방법: 공개 벤치마크 방법론 (2026)
2Slides Team
6 min read

AI 프레젠테이션 도구 벤치마크 방법: 공개 방법론

요약 (60자 이내): 공정한 AI 프레젠테이션 벤치마크는 생성 속도, 내보내기 충실도, 편집 가능성, 언어 지원, 데크당 비용이라는 5가지 측정 가능한 차원에서 도구를 평가합니다. 모든 도구에 동일한 프롬프트를 사용하고, 반복 실행을 통해 시간을 측정하며, 공개된 루브릭을 적용합니다. 이 글은 전체 방법론과 누구나 재현할 수 있는 오픈 소스 하네스를 제공합니다.

대부분의 "최고의 AI 프레젠테이션 도구" 목록은 주관적입니다. 이 글은 방법론을 제시합니다. AI 프레젠테이션 도구를 측정하는 재현 가능하고 투명한 방식이며, 결과를 감사하고 재실행하며 반박할 수 있습니다. 수치를 공개하기 전에 루브릭과 하네스(harness)를 먼저 게시하여 방법론 자체의 타당성을 확보합니다. (결과는 실제 실행 데이터를 바탕으로 작성되었습니다. 하단의 상태 노트를 참조하세요.)

5가지 측정 차원

측정 항목측정 내용점수 산정 방식
생성 속도10슬라이드 데크 생성에 소요되는 실제 시간(Wall-clock seconds)반복 실행(≥10회, 동일 프롬프트)의 중앙값, 낮을수록 좋음
내보내기 충실도
.pptx
파일이 미리보기와 일치하는가?
0–5점: 글꼴, 레이아웃, 차트, 애니메이션 보존 여부
편집 가능성내보낸 개체가 스크린샷이 아닌 편집 가능한 상태인가?0–5점: 텍스트 편집 가능 여부, 차트의 라이브 데이터 포함 여부
언어 지원비영어권(CJK/RTL) 품질0–5점: 5개 스크립트에 걸친 렌더링, 글꼴, 글꼴 깨짐(tofu)/겹침 현상 없음
데크당 비용10슬라이드 데크 1개당 가격 ($)공개 가격 정책을 기준으로 데크 1개당 비용으로 정규화

테스트 프로토콜 (규칙)

  1. 모든 도구에 동일한 프롬프트 사용: 차트 1개와 비라틴어 헤드라인 1개가 포함된 고정된 10슬라이드 비즈니스 주제를 사용합니다. 하네스에 그대로 공개되어 있습니다.
  2. 반복적인 시간 측정 실행: 속도는 단 한 번의 운 좋은 실행이 아니라, 도구당 50회 실행(요청부터 다운로드 가능한 파일 생성까지의 실제 시간)의 중앙값으로 측정합니다.
  3. 데스크톱 검증: 모든 내보내기 파일은 데스크톱 PowerPoint에서 열어 확인합니다. 충실도와 편집 가능성은 썸네일을 눈으로 확인하는 것이 아니라 실제 개체를 클릭하여 점수를 매깁니다.
  4. 공개 가격만 기준: 비용은 각 벤더가 공개한 10슬라이드 데크 1개당 가격을 사용하며, 정규화(크레딧 → 달러) 과정을 거칩니다.
  5. 결과보다 방법론 우선: 체리피킹(cherry-picking)을 방지하기 위해 점수를 매기기 전에 루브릭과 하네스를 확정합니다.
  6. 공개 도전: 경쟁사들이 하네스를 재실행하고 수정 사항을 제출하는 것을 환영합니다.

채점 루브릭 (예시: 내보내기 충실도)

  • 5점 — 미리보기와 동일: 글꼴 임베딩, 정확한 레이아웃, 편집 가능한 차트, 전환 효과 유지.
  • 4점 — 미세한 차이: 글꼴 하나가 대체되거나 전환 효과 하나가 누락됨.
  • 3점 — 눈에 띄는 차이: 일부 텍스트 흐름/겹침 발생, 차트가 이미지로 병합됨.
  • 2점 — 심각한 차이: 다수의 겹침 현상, 대부분의 개체를 편집할 수 없음.
  • 1점 — 내보내기 결과가 사실상 각 슬라이드의 스크린샷임.
  • 0점 — 작동하는
    .pptx
    내보내기 파일이 없음.

오픈 소스 하네스 (Harness)

공개 저장소에 있는 동반 스크립트

scripts/benchmark/ai-presentation-benchmark.mjs
:

  • 기본 API 도구의 시간을 N회 실행 동안 자동으로 측정하고 중앙값을 계산합니다.
  • API가 없는 도구(수동 채점 도구)를 위해 구조화된
    results.csv
    스캐폴드(도구 × 차원)를 생성합니다.
  • 모든 결과가 입력값으로 추적될 수 있도록 재현성 헤더(날짜, 프롬프트 해시, 실행 횟수)를 출력합니다.

직접 실행해 보세요:

node scripts/benchmark/ai-presentation-benchmark.mjs --runs=50 --out=results.csv

결과

우리는 방법론과 오픈 소스 하네스를 의도적으로 먼저 공개합니다. 수치가 인용되기 전에 수치가 생성된 방식을 감사할 수 있도록 하기 위함입니다. 이것이 정직한 순서입니다. 재현할 수 있는 벤치마크가 신뢰해야만 하는 순위표보다 더 가치 있습니다. 아래는 현재까지 측정된 내용입니다. 속도 및 도구별 충실도 열은 실행별로 채워지고 있으며, 추정치가 아닌 '대기 중(pending)'으로 명확히 표시됩니다.

데크당 비용 (10개 도구 전체 — 공개 가격, 2026-06 확인)

구독형 도구는 월별로 가격이 책정되므로, 엄격한 "데크당" 수치는 사용량에 따라 달라집니다. 여기서는 유료 입문 계층과 도구별 생성당 비용을 기준으로 데크당 수치를 나열합니다.

도구유료 입문 가격 (2026)비고
2Slides데크당 약 $0.63 (Pro $12.50/월) 또는 약 $2.53 PAYG데크당 가격 책정; 이 목록에서 공개 API를 제공하는 유일한 도구
SlidesAI$8.33/월 (연간 결제)가장 저렴한 구독형; Google Slides 애드온
Gamma$12/월 (Plus)400회 일회성 무료 크레딧 제공
Beautiful.ai$12/월 (Pro), $40/사용자/월 (Team)14일 무료 체험
Canva$12.99/월 (Pro)넉넉한 무료 계층 제공
Presentations.ai약 $16.50/월 ($198/년)무료 Starter 계층 제공; REST API 보유
Genspark$19.99–24.99/월 (Plus)데크당 월 10,000 크레딧 중 300–500 크레딧 소모
SlideSpeak50 크레딧당 $29/월크레딧당 비용이 빠르게 상승함
Plus AI약 $10–15/월 (추정)Google Slides 애드온
Presenton자체 호스팅 (인프라 + 모델 토큰)오픈 소스 (Apache-2.0); 데크당 라이선스 비용 없음

출처: 벤더 가격 페이지 및 2Slides 가격 비교, 2026-06.

2Slides — 측정 결과 (2026-06-03 실행 기록)

이 수치는 2Slides API를 대상으로 한 실제 재현 가능한 실행 결과입니다. 고정된 프롬프트로 10슬라이드 데크를 10회 생성하고, 일본어 실행 1회를 추가한 후, 각 출력

.pptx
파일을
python-pptx
로 검사했습니다.

  • 생성 속도: 중앙값 30.4초 (완성된 10슬라이드 데크 기준, n=10; 최소 21.5초, 최대 40.8초; 모든 실행에서 10페이지 전체 생성).
  • 내보내기 충실도 / 편집 가능성: 스크린샷 방식이 아닌 네이티브 OOXML 방식. 각 데크는 10개의 실제
    ppt/slides/*.xml
    파트와 97개의 편집 가능한 텍스트 프레임 개체 및 실제 글꼴 참조를 포함합니다. 텍스트와 도형은 병합된 이미지가 아니라 편집 가능한 PowerPoint의 일급 개체입니다. (참고: 이 프롬프트 실행에서는 텍스트와 이미지 레이아웃이 생성되었습니다. 이 샘플에서는 네이티브 차트 개체가 생성되지 않았으므로 편집 가능한 차트 결과는 주장하지 않습니다.)
  • 언어 (CJK): 통과. 일본어 실행 결과, 편집 가능한 일본어 문자가 포함된 57개의 텍스트 도형이 있는 네이티브 데크가 생성되었습니다 (샘플 헤드라인: 「2026年リモートワーク現状」). (정직한 세부 사항: 글꼴 참조가 "Inter"로 지정되어 있어, CJK 글리프는 임베딩된 CJK 서체가 아닌 PowerPoint의 시스템 글꼴 폴백을 통해 렌더링됩니다. 텍스트는 네이티브이며 편집 가능하지만, 전용 CJK 글꼴이 임베딩되지는 않습니다.)

결과 매트릭스

측정 항목2Slides (2026-06-03 측정)나머지 9개 도구
데크당 비용✅ 약 $0.63–2.53 (위 표 참조)✅ 공개 가격 (위 표 참조)
생성 속도 (중앙값)30.4초 (n=10)— 이번 실행에서 측정되지 않음
내보내기 충실도 / 편집 가능성✅ 네이티브 OOXML, 97개 편집 가능 텍스트 프레임— 이번 실행에서 측정되지 않음
언어 (CJK)✅ 네이티브 편집 가능 일본어 텍스트 (글꼴 폴백 확인)— 이번 실행에서 측정되지 않음

범위 참고 (정직한 고지): 이번 실행은 공개 API를 통해 2Slides를 직접 측정했습니다. 나머지 9개 도구는 여기에서 공개 가격만 비교되었습니다. 대부분 공개 API가 없고, 공정한 충실도 점수를 위해서는 각 도구의 내보내기 파일을 데스크톱 PowerPoint에서 수동으로 열어야 하므로, 속도, 충실도 및 언어 점수는 추정치 대신 의도적으로 측정되지 않음으로 남겨두었습니다. 하네스와 고정 프롬프트는 공개 저장소에 있으며, 누구나 모든 도구에 대해 동일한 측정을 수행하고 결과를 제출할 수 있습니다.

FAQ

Q: AI 프레젠테이션 도구를 어떻게 공정하게 벤치마크하나요? A: 모든 도구에 동일한 프롬프트를 사용하고, 5가지 측정 가능한 차원(속도, 내보내기 충실도, 편집 가능성, 언어 지원, 비용)을 평가합니다. 속도 측정 시 반복 실행의 중앙값을 취하고, 데스크톱 PowerPoint에서 내보내기 파일을 검증하며, 수치를 공개하기 전에 루브릭과 하네스를 먼저 게시합니다.

Q: 속도 측정에 왜 50회 실행의 중앙값을 사용하나요? A: 단일 실행은 서버 부하 및 콜드 스타트(cold start)로 인해 왜곡될 수 있습니다. 50회 실행의 중앙값은 안정적이고 방어 가능한 수치입니다.

Q: 이 결과를 재현하거나 이의를 제기할 수 있나요? A: 네. 하네스는 오픈 소스이며 프롬프트는 그대로 공개되어 있습니다. 직접 재실행하여 수정 사항을 제출해 주세요. 그것이 공개 방법론의 목적입니다.

출처 및 추가 자료


최종 검토: 2026-06-03, 2Slides 팀. 방법론은 이 날짜에 확정되었으며, 결과는 기록된 실행 이후에 추가되었습니다.

About 2Slides

Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.

Try For Free