

Como Fazer o Benchmark de Ferramentas de Apresentação com IA: Uma Metodologia Aberta
Resposta rápida (≤60 palavras): Um benchmark justo de apresentações com IA avalia as ferramentas em cinco dimensões mensuráveis — velocidade de geração, fidelidade de exportação, editabilidade, suporte a idiomas e custo por apresentação — usando um prompt idêntico em todas as ferramentas, execuções repetidas para cronometragem e uma rubrica publicada. Este artigo apresenta a metodologia completa e um harness de código aberto para reprodução.
A maioria das listas de "melhores ferramentas de apresentação com IA" baseia-se em opiniões. Esta é um método: uma forma reprodutível e transparente de medir ferramentas de apresentação com IA para que os resultados possam ser auditados, reexecutados e contestados. Publicamos a rubrica e o harness antes dos números para que a metodologia se sustente por si só. (Os resultados são preenchidos a partir de uma execução real; veja a nota de status no final.)
As cinco dimensões
| Dimensão | O que mede | Como é pontuado |
|---|---|---|
| Velocidade de geração | Segundos (wall-clock) para uma apresentação de 10 slides | Mediana de execuções repetidas (≥10; mesmo prompt), quanto menor, melhor |
| Fidelidade de exportação | O .pptx | 0–5: fontes, layout, gráficos, animações preservadas |
| Editabilidade | Os objetos exportados são editáveis ou capturas de tela? | 0–5: texto editável, gráficos possuem dados dinâmicos |
| Suporte a idiomas | Qualidade nativa não-Inglês (CJK/RTL) | 0–5: renderização, fontes, sem tofu/sobreposição em 5 scripts |
| Custo por apresentação | $ para uma apresentação de 10 slides | Normalizado para uma única apresentação a partir de preços públicos |
Protocolo de teste (as regras)
- Um prompt idêntico para cada ferramenta: um tópico de negócios fixo de 10 slides com um gráfico e um título não-latino. Publicado na íntegra no harness.
- Execuções de cronometragem repetidas. A velocidade é a mediana de 50 execuções por ferramenta (não uma única execução de sorte), medida em tempo real (wall-clock) desde a solicitação até o arquivo para download.
- Verificação em Desktop. Cada exportação é aberta no PowerPoint desktop; fidelidade/editabilidade são pontuadas clicando em objetos reais, não apenas observando uma miniatura.
- Apenas preços públicos. O custo utiliza o preço publicado de cada fornecedor para uma única apresentação de 10 slides, normalizado (créditos → dólares).
- Metodologia antes dos resultados. A rubrica e o harness são congelados antes da pontuação para evitar a escolha seletiva de dados (cherry-picking).
- Desafio aberto. Concorrentes são convidados a reexecutar o harness e enviar correções.
Rubrica de pontuação (fidelidade de exportação, como exemplo)
- 5 — Idêntico à visualização: fontes incorporadas, layout exato, gráficos editáveis, transições intactas.
- 4 — Pequeno desvio: uma fonte substituída ou uma transição perdida.
- 3 — Desvio perceptível: algum refluxo/sobreposição, gráficos achatados em imagens.
- 2 — Desvio maior: múltiplas sobreposições, a maioria dos objetos não editável.
- 1 — A exportação é essencialmente uma captura de tela de cada slide.
- 0 — Sem exportação funcional.
.pptx
O harness de código aberto
O script complementar
scripts/benchmark/ai-presentation-benchmark.mjs- Cronometra ferramentas com API nativa automaticamente em N execuções e calcula a mediana.
- Emite um scaffold estruturado (ferramentas × dimensões) para as ferramentas de pontuação manual (aquelas sem API).
results.csv - Imprime um cabeçalho de reprodutibilidade (data, hash do prompt, contagem de execuções) para que qualquer resultado possa ser rastreado até suas entradas.
Execute você mesmo:
node scripts/benchmark/ai-presentation-benchmark.mjs --runs=50 --out=results.csv
Resultados
Publicamos a metodologia e o harness de código aberto primeiro, de propósito — para que a forma como os números são produzidos possa ser auditada antes que qualquer número seja citado. Esta é a ordem honesta: um benchmark que você pode reproduzir vale mais do que um ranking no qual você precisa confiar. Abaixo está o que foi medido até agora; as colunas de velocidade e fidelidade por ferramenta estão sendo preenchidas execução por execução e estão explicitamente marcadas como pendentes em vez de estimadas.
Custo por apresentação (todas as 10 ferramentas — preços públicos, verificado em 06/2026)
Ferramentas de assinatura têm preços mensais, portanto, um número estrito "por apresentação" depende do volume; listamos o nível pago inicial e, onde a ferramenta cobra por geração, o valor por apresentação.
| Ferramenta | Preço inicial pago (2026) | Notas |
|---|---|---|
| 2Slides | ~$0.63 / apresentação de 10 slides (Pro $12.50/mês) ou ~$2.53 PAYG | Preço por apresentação; a única com uma API pública nesta lista |
| SlidesAI | $8.33/mês (anual) | Assinatura mais barata; add-on para Google Slides |
| Gamma | $12/mês (Plus) | 400 créditos gratuitos únicos |
| Beautiful.ai | $12/mês (Pro), $40/usuário/mês (Team) | Teste de 14 dias |
| Canva | $12.99/mês (Pro) | Plano gratuito generoso |
| Presentations.ai | ~$16.50/mês ($198/ano) | Plano Starter gratuito; possui REST API |
| Genspark | $19.99–24.99/mês (Plus) | Apresentações custam 300–500 de 10.000 créditos mensais |
| SlideSpeak | $29/mês para 50 créditos | A economia por crédito torna-se cara rapidamente |
| Plus AI | ~$10–15/mês (aprox) | Add-on para Google Slides |
| Presenton | Auto-hospedado (infra + tokens do modelo) | Código aberto (Apache-2.0); sem taxa de licença por apresentação |
Fontes: páginas de preços dos fornecedores e a comparação de preços de geradores de apresentação com IA 2Slides, 06/2026.
2Slides — resultados medidos (execução registrada em 03/06/2026)
Estes números são de uma execução real e reprodutível contra a API do 2Slides: 10 gerações de uma apresentação de 10 slides a partir de um prompt fixo, mais uma execução em japonês, com cada saída
.pptxpython-pptx- Velocidade de geração: mediana 30.4s para uma apresentação completa de 10 slides (n=10; mín 21.5s, máx 40.8s; cada execução produziu todas as 10 páginas).
- Fidelidade de exportação / editabilidade: exportação OOXML nativa, não captura de tela. Cada apresentação possui 10 partes reais e 97 objetos de caixa de texto editáveis com referências de fontes reais — texto e formas são objetos PowerPoint de primeira classe que você pode editar, não imagens achatadas. (Nota: estas execuções de prompt produziram layouts de texto e imagem; nenhum objeto de gráfico nativo foi gerado nesta amostra, portanto não reivindicamos um resultado de gráfico editável aqui.)
ppt/slides/*.xml - Idioma (CJK): aprovado. A execução em japonês produziu uma apresentação nativa com 57 formas de texto contendo caracteres japoneses editáveis (exemplo de título: 「2026年リモートワーク現状」). (Nuance honesta: a referência da fonte resolveu para "Inter", então os glifos CJK são renderizados via fallback de fonte do sistema do PowerPoint em vez de uma tipografia CJK incorporada — o texto é nativo e editável, mas uma fonte CJK dedicada não está incorporada.)
Matriz de resultados
| Dimensão | 2Slides (medido em 03/06/2026) | Outras 9 ferramentas |
|---|---|---|
| Custo por apresentação | ✅ ~$0.63–2.53 (tabela acima) | ✅ preços públicos (tabela acima) |
| Velocidade de geração (mediana) | ✅ 30.4s (n=10) | — não medido nesta execução |
| Fidelidade de exportação / editabilidade | ✅ OOXML nativo, 97 caixas de texto editáveis | — não medido nesta execução |
| Idioma (CJK) | ✅ texto JP nativo editável (fallback de fonte observado) | — não medido nesta execução |
Nota de escopo (honesta): esta execução mediu o 2Slides diretamente através de sua API pública. As outras nove ferramentas são comparadas apenas em preços públicos aqui — suas pontuações de velocidade, fidelidade de exportação e idioma são deliberadamente deixadas sem medição em vez de estimadas, porque a maioria não possui API pública e uma pontuação de fidelidade justa exige abrir a exportação de cada ferramenta no PowerPoint desktop manualmente. O harness e o prompt congelado estão no repositório público; qualquer pessoa pode executar a mesma medição em qualquer ferramenta e enviar os resultados.
FAQ
P: Como você faz o benchmark de ferramentas de apresentação com IA de forma justa? R: Use um prompt idêntico em todas as ferramentas, pontue cinco dimensões mensuráveis (velocidade, fidelidade de exportação, editabilidade, suporte a idiomas, custo), use a mediana de execuções repetidas para cronometragem, verifique as exportações no PowerPoint desktop e publique a rubrica e o harness antes dos números.
P: Por que a mediana de 50 execuções para velocidade? R: Execuções únicas são ruidosas — a carga do servidor e cold starts podem distorcê-las. A mediana de 50 execuções é um valor estável e defensável.
P: Posso reproduzir ou contestar estes resultados? R: Sim. O harness é de código aberto e o prompt é publicado na íntegra. Reexecute-o e envie correções; esse é o objetivo de uma metodologia aberta.
Fontes e leitura adicional
- Aysenne / Princeton GEO research — citar fontes e estatísticas melhora a visibilidade da IA em 30–40%
- 2Slides: Por que as ferramentas de slides com IA falham na exportação para PowerPoint · Benchmark de velocidade de apresentação com IA
Última revisão: 03/06/2026 pela equipe 2Slides. Metodologia congelada nesta data; resultados anexados após a execução registrada.
About 2Slides
Create stunning AI-powered presentations in seconds. Transform your ideas into professional slides with 2slides AI Agent.
Try For Free