

AIプレゼンテーションツールのベンチマーク方法:オープンな評価手法
クイック回答(60文字以内): 公平なAIプレゼンテーションのベンチマークでは、生成速度、再現性、編集可能性、言語サポート、コストの5項目を、同一プロンプトと公開基準で測定します。本記事では再現可能なオープンソースの手法を公開します。
ほとんどの「最高のAIプレゼンテーションツール」リストは主観的な意見に過ぎません。これは一つの**手法(メソッド)**です。AIプレゼンテーションツールを測定するための、再現可能で透明性の高い方法であり、結果を監査、再実行、および検証することができます。数値を示す前に、評価基準とハーネスを公開することで、手法自体の妥当性を担保します。(結果は実際の実行データに基づいています。下部のステータスノートを参照してください。)
5つの評価次元
| 評価項目 | 測定内容 | スコアリング方法 |
|---|---|---|
| 生成速度 | 10スライドのデッキ作成にかかる実測時間(秒) | 繰り返し実行(10回以上、同一プロンプト)の中央値。低いほど良い |
| エクスポートの再現性 | .pptx | 0〜5:フォント、レイアウト、チャート、アニメーションが保持されているか |
| 編集可能性 | エクスポートされたオブジェクトは編集可能か(スクリーンショットではないか)? | 0〜5:テキストが編集可能か、チャートにライブデータが含まれているか |
| 言語サポート | 非英語(CJK/右横書き)のネイティブ品質 | 0〜5:5つのスクリプトにわたるレンダリング、フォント、豆腐(文字化け)や重なりの有無 |
| 1デッキあたりのコスト | 10スライドのデッキ1つあたりの価格(ドル) | 公開価格から1デッキ分に換算して正規化 |
テストプロトコル(ルール)
- すべてのツールで同一のプロンプトを使用: 1つのチャートと1つの非ラテン語の見出しを含む、固定された10スライドのビジネス・トピック。ハーネス内に逐語的に公開。
- 繰り返しのタイミング計測: 速度は、1ツールあたり50回の実行(1回限りの幸運な結果ではない)の中央値とし、リクエストからダウンロード可能なファイル作成までの実測時間を測定。
- デスクトップ版での検証: すべてのエクスポートファイルはデスクトップ版PowerPointで開く。再現性と編集可能性は、サムネイルを目視するのではなく、実際のオブジェクトをクリックしてスコアリング。
- 公開価格のみを使用: コストは各ベンダーが公開している10スライドのデッキ1つあたりの価格を使用し、正規化(クレジット → ドル)。
- 結果の前に手法を確定: チェリーピッキング(都合の良いデータの選別)を防ぐため、スコアリングの前に評価基準とハーネスを固定。
- オープンな挑戦: 競合他社には、ハーネスを再実行し、修正案を提出することを推奨。
評価基準(例:エクスポートの再現性)
- 5 — プレビューと同一:フォントが埋め込まれ、レイアウトが正確で、チャートが編集可能、トランジションが保持されている。
- 4 — 軽微なズレ:1つのフォントが置換されている、または1つのトランジションが消失している。
- 3 — 顕著なズレ:テキストの折り返しや重なりがある、チャートが画像にフラット化されている。
- 2 — 重大なズレ:複数の重なりがあり、ほとんどのオブジェクトが編集不可能。
- 1 — エクスポートが実質的に各スライドのスクリーンショットである。
- 0 — 機能するエクスポートが存在しない。
.pptx
オープンソース・ハーネス
公開リポジトリにある付属スクリプト
scripts/benchmark/ai-presentation-benchmark.mjs- ネイティブAPIツールをN回自動的に計測し、中央値を算出。
- APIのないツール(手動スコアリング用)のために、構造化された の雛形(ツール × 次元)を出力。
results.csv - 再現性ヘッダー(日付、プロンプトのハッシュ、実行回数)を表示し、あらゆる結果を入力データまで追跡可能にする。
自身で実行する場合:
node scripts/benchmark/ai-presentation-benchmark.mjs --runs=50 --out=results.csv
結果
あえて手法とオープンソース・ハーネスを先に公開しています。これは、引用される数値の前に、その数値がどのように生成されたかを監査できるようにするためです。これが誠実な順序です。再現可能なベンチマークは、信頼するしかないリーダーボードよりも価値があります。以下はこれまでに測定された内容です。速度とツールごとの再現性カラムは実行ごとに埋められており、推定ではなく「保留(pending)」として明示的にマークされています。
1デッキあたりのコスト(全10ツール — 2026年6月確認の公開価格)
サブスクリプションツールは月額制であるため、厳密な「1デッキあたり」の数値はボリュームに依存します。ここではエントリー有料プランと、生成ごとに課金されるツールの場合は1デッキあたりの数値を記載しています。
| ツール | エントリー有料価格 (2026) | 備考 |
|---|---|---|
| 2Slides | 約$0.63 / 10スライド (Pro $12.50/月) または 約$2.53 PAYG | デッキ単位の価格設定。このリストで唯一公開APIを持つ |
| SlidesAI | $8.33/月 (年払い) | 最安のサブスクリプション。Google Slidesアドオン |
| Gamma | $12/月 (Plus) | 初回限定の400無料クレジット |
| Beautiful.ai | $12/月 (Pro), $40/ユーザー/月 (Team) | 14日間トライアル |
| Canva | $12.99/月 (Pro) | 充実した無料プラン |
| Presentations.ai | 約$16.50/月 ($198/年) | 無料のStarterプランあり。REST APIを保有 |
| Genspark | $19.99–24.99/月 (Plus) | 毎月10,000クレジットのうち、1デッキ300–500クレジット |
| SlideSpeak | $29/月 (50クレジット) | クレジット単位の経済性は急速に高価になる |
| Plus AI | 約$10–15/月 (概算) | Google Slidesアドオン |
| Presenton | セルフホスト (インフラ + モデルトークン) | オープンソース (Apache-2.0)。デッキごとのライセンス料なし |
出典:各ベンダーの価格ページおよび 2Slides価格比較 (2026-06)
2Slides — 測定結果 (2026-06-03 実行記録)
これらの数値は、2Slides APIに対するライブで再現可能な実行結果です。固定プロンプトによる10スライドのデッキ生成10回、および日本語での実行1回を行い、各出力
.pptxpython-pptx- 生成速度:中央値 30.4秒(10スライドのデッキ完成まで。n=10、最小21.5秒、最大40.8秒。すべての実行で全10ページを生成)。
- エクスポートの再現性 / 編集可能性:スクリーンショットではなくネイティブOOXML。 各デッキには10個の本物の パーツと、97個の編集可能なテキストフレームオブジェクト(実際のフォント参照付き)が含まれています。テキストと図形は、フラット化された画像ではなく、編集可能なPowerPointの第一級オブジェクトです。(注:これらのプロンプト実行ではテキストと画像のレイアウトが生成されました。このサンプルではネイティブのチャートオブジェクトは生成されなかったため、ここでは編集可能なチャートの結果については主張しません。)
ppt/slides/*.xml - 言語 (CJK):合格。 日本語の実行では、57個の編集可能な日本語文字を含むテキスト図形(サンプル見出し:「2026年リモートワーク現状」)を持つネイティブデッキが生成されました。(誠実な補足:フォント参照は「Inter」に解決されたため、CJK文字は埋め込みCJK書体ではなくPowerPointのシステムフォントフォールバックを介してレンダリングされます。テキストはネイティブで編集可能ですが、専用のCJKフォントは埋め込まれていません。)
結果マトリックス
| 評価項目 | 2Slides (2026-06-03 測定) | 他の9ツール |
|---|---|---|
| 1デッキあたりのコスト | ✅ 約$0.63–2.53 (上記テーブル参照) | ✅ 公開価格 (上記テーブル参照) |
| 生成速度 (中央値) | ✅ 30.4秒 (n=10) | — 今回の実行では未測定 |
| エクスポートの再現性 / 編集可能性 | ✅ ネイティブOOXML、97個の編集可能テキストフレーム | — 今回の実行では未測定 |
| 言語 (CJK) | ✅ ネイティブで編集可能な日本語テキスト (フォールバックあり) | — 今回の実行では未測定 |
スコープに関する注意(誠実な開示): 今回の実行では、公開APIを通じて2Slidesを直接測定しました。他の9つのツールについては、ここでは公開価格のみを比較しています。それらの速度、再現性、言語スコアは、推定ではなく意図的に未測定としています。なぜなら、それらの多くは公開APIを持たず、公平な再現性スコアを算出するには、各ツールのエクスポートファイルをデスクトップ版PowerPointで手動で開く必要があるためです。ハーネスと固定プロンプトは公開リポジトリにあります。誰でも任意のツールで同じ測定を実行し、結果を提出することができます。
FAQ
Q: AIプレゼンテーションツールを公平にベンチマークするにはどうすればよいですか? A: すべてのツールで同一のプロンプトを使用し、5つの測定可能な次元(速度、再現性、編集可能性、言語サポート、コスト)をスコアリングします。速度については繰り返しの実行の中央値をとり、エクスポートファイルはデスクトップ版PowerPointで検証し、数値の前に評価基準とハーネスを公開します。
Q: なぜ速度の測定に50回の実行の中央値を使うのですか? A: 1回限りの実行は、サーバーの負荷やコールドスタートによって数値が変動しやすいためです。50回の実行の中央値は、安定しており、根拠として信頼できる数値となります。
Q: これらの結果を再現したり、異議を唱えたりすることはできますか? A: はい。ハーネスはオープンソースであり、プロンプトも逐語的に公開されています。再実行して修正案を提出してください。それがオープンな手法の目的です。
出典および参考文献
- Aysenne / Princeton GEO research — 出典や統計を引用することでAIの可視性が30〜40%向上する
- 2Slides: なぜAIスライドツールはPowerPointエクスポートで崩れるのか · AIプレゼンテーション速度ベンチマーク:2Slides vs 競合他社
最終更新:2026-06-03 2Slidesチーム。手法はこの日付で固定。結果は記録された実行後に追加。
About 2Slides
Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.
Try For Free