

AI Presentation Tools को बेंचमार्क कैसे करें: एक ओपन कार्यप्रणाली (Methodology)
त्वरित उत्तर (≤60 शब्द): एक निष्पक्ष AI-प्रेजेंटेशन बेंचमार्क पांच मापने योग्य आयामों पर टूल्स को स्कोर करता है — जनरेशन स्पीड, एक्सपोर्ट फिडेलिटी, एडिटेबिलिटी, भाषा समर्थन, और प्रति डेक लागत। इसमें हर टूल के लिए एक समान प्रॉम्प्ट का उपयोग किया जाता है, समय मापने के लिए बार-बार रन किया जाता है, और एक प्रकाशित रूब्रिक (rubric) का उपयोग किया जाता है। यह लेख पूरी कार्यप्रणाली और एक ओपन-सोर्स हार्नेस प्रदान करता है।
ज्यादातर "सबसे अच्छे AI प्रेजेंटेशन टूल" की सूचियाँ केवल राय मात्र होती हैं। यह लेख एक कार्यप्रणाली (method) है: AI प्रेजेंटेशन टूल्स को मापने का एक पारदर्शी और दोहराने योग्य तरीका, ताकि परिणामों का ऑडिट किया जा सके, उन्हें फिर से चलाया जा सके और उन पर बहस की जा सके। हम नंबरों से पहले रूब्रिक और हार्नेस प्रकाशित करते हैं ताकि कार्यप्रणाली अपने आप में स्वतंत्र रहे। (परिणाम एक वास्तविक रन से भरे गए हैं; नीचे स्टेटस नोट देखें।)
पांच आयाम (The five dimensions)
| आयाम (Dimension) | यह क्या मापता है | इसे कैसे स्कोर किया जाता है |
|---|---|---|
| जनरेशन स्पीड | 10-स्लाइड डेक के लिए वॉल-क्लॉक सेकंड | बार-बार किए गए रन (≥10; समान प्रॉम्प्ट) की माध्यिका (Median), कम बेहतर है |
| एक्सपोर्ट फिडेलिटी | क्या .pptx | 0–5: फोंट, लेआउट, चार्ट, एनिमेशन सुरक्षित हैं या नहीं |
| एडिटेबिलिटी | क्या एक्सपोर्ट किए गए ऑब्जेक्ट एडिट करने योग्य हैं, न कि स्क्रीनशॉट? | 0–5: टेक्स्ट एडिट करने योग्य है, चार्ट में लाइव डेटा है |
| भाषा समर्थन | नेटिव गैर-अंग्रेजी (CJK/RTL) गुणवत्ता | 0–5: रेंडरिंग, फोंट, 5 लिपियों में कोई टोफू (tofu)/ओवरलैप नहीं |
| प्रति डेक लागत | एक 10-स्लाइड डेक के लिए $ | सार्वजनिक मूल्य निर्धारण से एक सिंगल डेक के लिए सामान्यीकृत (Normalized) |
टेस्ट प्रोटोकॉल (नियम)
- हर टूल के लिए एक समान प्रॉम्प्ट: एक निश्चित 10-स्लाइड वाला बिजनेस टॉपिक जिसमें एक चार्ट और एक गैर-लैटिन हेडलाइन हो। इसे हार्नेस में शब्दशः प्रकाशित किया गया है।
- बार-बार टाइमिंग रन। स्पीड प्रति टूल 50 रन की माध्यिका (median) है (न कि एक सिंगल लकी रन), जिसे रिक्वेस्ट से लेकर डाउनलोड करने योग्य फ़ाइल तक वॉल-क्लॉक समय से मापा जाता है।
- डेस्कटॉप वेरिफिकेशन। हर एक्सपोर्ट को डेस्कटॉप PowerPoint में खोला जाता है; फिडेलिटी/एडिटेबिलिटी को वास्तविक ऑब्जेक्ट्स पर क्लिक करके स्कोर किया जाता है, न कि केवल थंबनेल देखकर।
- केवल सार्वजनिक मूल्य निर्धारण। लागत के लिए प्रत्येक वेंडर की एक 10-स्लाइड डेक की प्रकाशित कीमत का उपयोग किया जाता है, जिसे सामान्यीकृत (credits → dollars) किया जाता है।
- परिणामों से पहले कार्यप्रणाली। चेरी-पिकिंग को रोकने के लिए स्कोरिंग से पहले रूब्रिक और हार्नेस को फ्रीज कर दिया जाता है।
- ओपन चैलेंज। प्रतिस्पर्धियों को हार्नेस को फिर से चलाने और सुधार सबमिट करने के लिए आमंत्रित किया जाता है।
स्कोरिंग रूब्रिक (उदाहरण के लिए, एक्सपोर्ट फिडेलिटी)
- 5 — प्रिव्यू के समान: फोंट एम्बेडेड हैं, लेआउट सटीक है, चार्ट एडिट करने योग्य हैं, ट्रांज़िशन बरकरार हैं।
- 4 — मामूली अंतर: एक फोंट बदल गया या एक ट्रांज़िशन हट गया।
- 3 — ध्यान देने योग्य अंतर: कुछ रिफ्लो/ओवरलैप, चार्ट इमेज में बदल गए।
- 2 — बड़ा अंतर: कई ओवरलैप, अधिकांश ऑब्जेक्ट एडिट करने योग्य नहीं हैं।
- 1 — एक्सपोर्ट अनिवार्य रूप से प्रत्येक स्लाइड का स्क्रीनशॉट है।
- 0 — कोई वर्किंग एक्सपोर्ट नहीं।
.pptx
ओपन-सोर्स हार्नेस
पब्लिक रेपो में साथी स्क्रिप्ट
scripts/benchmark/ai-presentation-benchmark.mjs- N रन पर ऑटोमैटिक रूप से नेटिव-API टूल्स का समय मापता है और माध्यिका (median) की गणना करता है।
- मैन्युअल रूप से स्कोर किए गए टूल्स (जिनके पास API नहीं है) के लिए एक स्ट्रक्चर्ड स्कैफोल्ड उत्सर्जित करता है।
results.csv - एक रीप्रोड्यूसिबिलिटी हेडर (तारीख, प्रॉम्प्ट हैश, रन काउंट) प्रिंट करता है ताकि किसी भी परिणाम को उसके इनपुट तक ट्रैक किया जा सके।
इसे स्वयं चलाएं:
node scripts/benchmark/ai-presentation-benchmark.mjs --runs=50 --out=results.csv
परिणाम
हम कार्यप्रणाली और ओपन-सोर्स हार्नेस को जानबूझकर पहले प्रकाशित करते हैं — ताकि नंबरों को कोट करने से पहले उनके बनने के तरीके का ऑडिट किया जा सके। यह ईमानदार क्रम है: एक बेंचमार्क जिसे आप दोबारा बना सकते हैं, वह उस लीडरबोर्ड से अधिक मूल्यवान है जिस पर आपको केवल भरोसा करना पड़ता है। नीचे वह दिया गया है जिसे अब तक मापा गया है; स्पीड और प्रति-टूल फिडेलिटी कॉलम रन-दर-रन भरे जा रहे हैं और अनुमानित के बजाय स्पष्ट रूप से 'लंबित' (pending) चिह्नित हैं।
प्रति डेक लागत (सभी 10 टूल्स — सार्वजनिक मूल्य निर्धारण, सत्यापित 2026-06)
सब्सक्रिप्शन टूल्स की कीमत प्रति माह होती है, इसलिए एक सख्त "प्रति डेक" संख्या वॉल्यूम पर निर्भर करती है; हम शुरुआती पेड टियर और, जहाँ टूल प्रति जनरेशन कीमत लेता है, वहां प्रति-डेक का आंकड़ा सूचीबद्ध करते हैं।
| टूल | शुरुआती पेड कीमत (2026) | नोट्स |
|---|---|---|
| 2Slides | ~$0.63 / 10-स्लाइड डेक (Pro $12.50/mo) या ~$2.53 PAYG | प्रति-डेक मूल्य निर्धारण; इस सूची में सार्वजनिक API वाला एकमात्र टूल |
| SlidesAI | $8.33/mo (वार्षिक) | सबसे सस्ता सब्सक्रिप्शन; Google Slides एड-ऑन |
| Gamma | $12/mo (Plus) | 400 वन-टाइम फ्री क्रेडिट |
| Beautiful.ai | $12/mo (Pro), $40/user/mo (Team) | 14-दिन का ट्रायल |
| Canva | $12.99/mo (Pro) | उदार फ्री टियर |
| Presentations.ai | ~$16.50/mo ($198/yr) | फ्री Starter टियर; REST API उपलब्ध है |
| Genspark | $19.99–24.99/mo (Plus) | डेक की लागत 10,000 मासिक क्रेडिट में से 300–500 है |
| SlideSpeak | 50 क्रेडिट के लिए $29/mo | प्रति-क्रेडिट अर्थशास्त्र तेजी से महंगा हो जाता है |
| Plus AI | ~$10–15/mo (लगभग) | Google Slides एड-ऑन |
| Presenton | सेल्फ-होस्ट (infra + model tokens) | ओपन सोर्स (Apache-2.0); कोई प्रति-डेक लाइसेंस शुल्क नहीं |
स्रोत: वेंडर प्राइसिंग पेज और 2Slides pricing comparison, 2026-06.
2Slides — मापे गए परिणाम (रिकॉर्डेड रन 2026-06-03)
ये नंबर 2Slides API के खिलाफ एक लाइव, रीप्रोड्यूसिबल रन से हैं: एक निश्चित प्रॉम्प्ट से 10-स्लाइड डेक के 10 जनरेशन, साथ ही एक जापानी-भाषा का रन, जिसमें प्रत्येक आउटपुट
.pptxpython-pptx- जनरेशन स्पीड: माध्यिका (median) 30.4s एक पूर्ण 10-स्लाइड डेक के लिए (n=10; न्यूनतम 21.5s, अधिकतम 40.8s; हर रन ने सभी 10 पेज बनाए)।
- एक्सपोर्ट फिडेलिटी / एडिटेबिलिटी: नेटिव OOXML, स्क्रीनशॉट एक्सपोर्ट नहीं। प्रत्येक डेक में 10 वास्तविक भाग और 97 एडिट करने योग्य टेक्स्ट-फ़्रेम ऑब्जेक्ट हैं जिनमें वास्तविक फोंट संदर्भ हैं — टेक्स्ट और शेप्स फर्स्ट-क्लास PowerPoint ऑब्जेक्ट्स हैं जिन्हें आप एडिट कर सकते हैं, न कि फ्लैट इमेज। (नोट: इन प्रॉम्प्ट रन ने टेक्स्ट-और-इमेज लेआउट तैयार किए; इस सैंपल में कोई नेटिव चार्ट ऑब्जेक्ट जेनरेट नहीं हुआ था, इसलिए हम यहां एडिटेबल-चार्ट परिणाम का दावा नहीं करते हैं।)
ppt/slides/*.xml - भाषा (CJK): पास। जापानी रन ने 57 टेक्स्ट शेप्स के साथ एक नेटिव डेक तैयार किया जिसमें एडिट करने योग्य जापानी अक्षर थे (सैंपल हेडिंग: 「2026年リモートワーク現状」)। (ईमानदार बारीकी: फोंट संदर्भ "Inter" पर सेट था, इसलिए CJK ग्लिफ़ एम्बेडेड CJK टाइपफेस के बजाय PowerPoint के सिस्टम फोंट फॉलबैक के माध्यम से रेंडर होते हैं — टेक्स्ट नेटिव और एडिटेबल है, लेकिन एक समर्पित CJK फोंट एम्बेडेड नहीं है।)
परिणाम मैट्रिक्स (Results matrix)
| आयाम | 2Slides (मापा गया 2026-06-03) | अन्य 9 टूल्स |
|---|---|---|
| प्रति डेक लागत | ✅ ~$0.63–2.53 (ऊपर टेबल देखें) | ✅ सार्वजनिक मूल्य निर्धारण (ऊपर टेबल देखें) |
| जनरेशन स्पीड (माध्यिका) | ✅ 30.4s (n=10) | — इस रन में नहीं मापा गया |
| एक्सपोर्ट फिडेलिटी / एडिटेबिलिटी | ✅ नेटिव OOXML, 97 एडिटेबल टेक्स्ट फ्रेम | — इस रन में नहीं मापा गया |
| भाषा (CJK) | ✅ नेटिव एडिटेबल JP टेक्स्ट (फॉलबैक नोट किया गया) | — इस रन में नहीं मापा गया |
स्कोप नोट (ईमानदार): इस रन ने सीधे इसके सार्वजनिक API के माध्यम से 2Slides को मापा। अन्य नौ टूल्स की तुलना यहाँ केवल सार्वजनिक मूल्य निर्धारण पर की गई है — उनकी स्पीड, एक्सपोर्ट-फिडेलिटी और भाषा स्कोर को अनुमान लगाने के बजाय जानबूझकर बिना मापे छोड़ दिया गया है, क्योंकि अधिकांश के पास कोई सार्वजनिक API नहीं है और एक निष्पक्ष फिडेलिटी स्कोर के लिए डेस्कटॉप PowerPoint में प्रत्येक टूल के एक्सपोर्ट को हाथ से खोलना आवश्यक है। हार्नेस और फ्रोजन प्रॉम्प्ट पब्लिक रेपो में हैं; कोई भी किसी भी टूल पर समान माप चला सकता है और परिणाम सबमिट कर सकता।
FAQ
प्रश्न: आप AI प्रेजेंटेशन टूल्स को निष्पक्ष रूप से कैसे बेंचमार्क करते हैं? उत्तर: सभी टूल्स में एक समान प्रॉम्प्ट का उपयोग करें, पांच मापने योग्य आयामों (स्पीड, एक्सपोर्ट फिडेलिटी, एडिटेबिलिटी, भाषा समर्थन, लागत) को स्कोर करें, टाइमिंग के लिए बार-बार किए गए रन की माध्यिका लें, डेस्कटॉप PowerPoint में एक्सपोर्ट को सत्यापित करें, और नंबरों से पहले रूब्रिक और हार्नेस प्रकाशित करें।
प्रश्न: स्पीड के लिए 50 रन की माध्यिका (median) क्यों? उत्तर: सिंगल रन में शोर (noise) होता है — सर्वर लोड और कोल्ड स्टार्ट उन्हें प्रभावित कर सकते हैं। 50 रन की माध्यिका एक स्थिर और बचाव योग्य आंकड़ा है।
प्रश्न: क्या मैं इन परिणामों को दोबारा बना सकता हूँ या चुनौती दे सकता हूँ? उत्तर: हाँ। हार्नेस ओपन-सोर्स है और प्रॉम्प्ट शब्दशः प्रकाशित है। इसे फिर से चलाएं और सुधार सबमिट करें; ओपन कार्यप्रणाली का यही उद्देश्य है।
स्रोत और आगे पढ़ना
- Aysenne / Princeton GEO research — स्रोतों और आंकड़ों को उद्धृत करने से AI की दृश्यता 30–40% बढ़ जाती है
- 2Slides: PowerPoint एक्सपोर्ट पर AI स्लाइड टूल्स क्यों टूट जाते हैं · AI प्रेजेंटेशन स्पीड बेंचमार्क
अंतिम समीक्षा: 2026-06-03 2Slides टीम द्वारा। कार्यप्रणाली इस तिथि पर फ्रीज की गई; रिकॉर्ड किए गए रन के बाद परिणाम जोड़े गए।
About 2Slides
Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.
Try For Free