OpenAI FM: la radio del futuro
openai.fm es una demostración oficial de OpenAI que muestra las capacidades de texto a voz (TTS) de la API de OpenAI. Permite generar voces de IA de alta calidad para videos, podcasts o prototipos. El uso de la demo es gratuito, pero la producción permanente de audio a través de la API es de pago.
Introducción
openai.fm sirve como un sitio web interactivo para demostrar las capacidades de texto a voz de la API de OpenAI. Los usuarios pueden introducir texto, elegir una voz y escuchar inmediatamente el resultado. Esto está pensado como una demo para mostrar la calidad y la facilidad de la integración. El código subyacente está en GitHub verfügbar y muestra cómo los desarrolladores pueden integrar la API de voz en sus propias aplicaciones.
OpenAI ha publicado en 2025 nuevos modelos de audio, entre ellos un reconocimiento de voz mejorado (gpt-4o-transcribe) y un modelo TTS configurable llamado gpt-4o-mini-tts. Los desarrolladores ahora pueden especificar en detalle cómo debe hablar la voz. openai.fm sirve como una vitrina oficial para estas funciones y está vinculado en GitHub como repositorio de OpenAI, que utiliza código Next.js y accede directamente a la API de voz.
Las tarifas actuales son transparentes en la lista de precios enumeradas.
Funcionamiento y modelos
«Text-to-Speech» (TTS) es el proceso por el cual el texto escrito se convierte en habla. OpenAI ofrece para ello varios modelos, entre ellos gpt-4o-mini-tts. . Las voces disponibles llevan nombres como Alloy, Echo, Fable, Onyx, Nova o Shimmer. Estas voces están accesibles a través de la API y pueden integrarse en aplicaciones.
openai.fm es una demostración oficial de OpenAI, lo cual está respaldado por el repositorio de GitHub, Repositorio de GitHub, que pertenece a la organización OpenAI y describe este propósito. Las voces TTS como Alloy, Echo, Fable, Onyx, Nova y Shimmer están listadas y su uso se realiza a través de la API.

Quelle: listoru.hatenablog.com
La interfaz de usuario intuitiva de OpenAI FM facilita la selección de voces y estados de ánimo para la generación de texto a voz.
Costos y uso
La demo en openai.fm es de uso gratuito y sirve para probar las funciones de la API. Para el uso permanente y productivo de las funciones de texto a voz a través de la API, sin embargo, hay costos. El uso de la API es de pago, y los precios están en la lista de precios oficial detallados. La facturación se realiza por token o según el uso en tiempo real/Audio.
Es engañoso suponer que con openai.fm se puede producir audio gratis de forma continua e ilimitada. La demo solo muestra las funciones; para la producción a través de la API se deben pagar tarifas. Los costos por minuto concretos para cada voz TTS varían según el tipo de facturación (Tokens, Audio en tiempo real) y el modelo. Los precios por minuto generales de foros son estimaciones y no normativos.
¿Por qué OpenAI ofrece una demo de uso libre? Las demos reducen la barrera para probar nuevas funciones, para creadores, startups y equipos. OpenAI muestra así cómo suenan las voces y cuán fácil es la integración. Esto genera confianza en la calidad y la latencia, antes de que se asignen presupuestos. Para pruebas rápidas, demos y prototipos, openai.fm es ideal. Para producciones – como voz en off de YouTube, e-learning o apps – deben considerarse los costos de la API.

Quelle: genspark.ai
Uso profesional de OpenAI FM en diferentes ámbitos de aplicación.
Aspectos de seguridad y abuso
En torno a las voces de IA existen preguntas de seguridad importantes. OpenAI ha desarrollado una potente herramienta de clonación de voz llamada 'Voice Engine' por motivos de abuso, como suplantación de identidad, y no se ha implementado públicamente. Las pruebas se llevan a cabo solo con socios bajo condiciones estrictas. Este cuidado también determina qué voces están disponibles en la API: se ofrecen voces predefinidas en lugar de identidades clonables libremente.
Es engañoso afirmar que OpenAI ofrece clonación de voz libre para cada voz. OpenAI no ha autorizado ampliamente la clonación de voz por razones de seguridad. La crítica de los medios hacia las voces de IA a menudo se centra en derechos y similitudes con personas reales. Un caso destacado fue la voz 'Sky', que fue pausada tras la crítica de Scarlett Johansson. OpenAI señaló que la voz proviene de otra actriz.
Paralelamente, sitios web de terceros hacen publicidad de uso de TTS 'gratuito'. Sitios como openai-fm.com o ttsopenai.com son proveedores independientes sin relación con el dominio oficial de OpenAI. Prometen TTS gratuito, pero no forman parte de la plataforma de OpenAI. Para la seriedad, es importante revisar el aviso legal, la privacidad, los límites y el modelo de negocio de dichos proveedores.
Quelle: YouTube
El DevDay Breakout muestra en vivo cómo las API en tiempo real y de audio para agentes de voz trabajan juntas, útil como contexto para la latencia, el control y la arquitectura.
Aplicación práctica
Para pruebas rápidas, demos y prototipos, openai.fm es ideal. Para producciones — como voiceover en YouTube, e-learning o apps — se deben prever costos de la API y considerar derechos, divulgación y protección contra abuso. Consejos prácticos incluyen usar voces predeterminadas y evitar clonar a personas reales. Es recomendable etiquetar el audio IA en los proyectos y consultar documentación oficial y repositorios en lugar de basarse en similitudes de nombres. Puntos de partida son los TTS-Guides y Documentación de modelos.
Las preguntas abiertas se refieren al desarrollo continuo de las voces predefinidas y a la incorporación de nuevos idiomas y acentos.Para ello vale la pena revisar los changlogs y la documentación que se actualizan regularmente. Cuándo y bajo qué condiciones la clonación de voz se permitirá de forma más amplia es también una cuestión abierta. OpenAI señala consideraciones de seguridad en curso y pilotos con socios; no hay una fecha fija públicamente.

Quelle: user-added
Anuncio de un nuevo modelo de texto-a-modelo de OpenAI.fm.
openai.fm muestra de manera impresionante cuán bien suenan las voces actuales de IA, de forma gratuita como demostración, pero no como una plataforma de producción ilimitada. Para proyectos serios, la vía es la API oficial con precios claros, voces predeterminadas y salvaguardas de seguridad. Quien trabaje de forma limpia, enlace fuentes, etiquete el audio IA y base su trabajo en la documentación y repositorios oficiales, puede convertir rápidamente una demo en un flujo de trabajo sólido.
Quelle: YouTube
Un tutorial que explica el manejo de openai.fm y los tropiezos típicos al exportar.