OpenAI lanza GPT-4o Image Generation
La tecnológica desbloqueó la generación de imágenes con un modelo nativamente multimodal capaz de producir resultados precisos, exactos y fotorrealistas.
OpenAI anunció el lanzamiento de GPT-4o, su modelo de inteligencia artificial más avanzado hasta la fecha, que integra capacidades multimodales para generar imágenes realistas y útiles. Este modelo reemplaza a DALL-E 3 como el generador de imágenes predeterminado en ChatGPT, y está disponible para todos los usuarios, incluyendo las suscripciones Free, Plus, Team y Pro.
Las ventajas
GPT-4o destaca por su habilidad para crear imágenes fotorrealistas y coherentes, facilitando la generación de contenido visual para diversos usos, desde presentaciones hasta material promocional. Esta mejora se logró gracias a la colaboración con más de 100 entrenadores humanos que proporcionaron retroalimentación para corregir errores en las imágenes generadas por IA, un proceso conocido como aprendizaje por refuerzo con retroalimentación humana (RLHF).
Imágenes, texto, audio y video
Además de su capacidad para generar imágenes, GPT-4o mantiene su funcionalidad en la comprensión y generación de texto, audio y video, consolidándose como una herramienta integral para diversas aplicaciones. OpenAI asegura que el modelo respeta los derechos de los artistas, evitando imitar directamente obras existentes.
Sencillez
La generación de imágenes de GPT-4o destaca por su capacidad para renderizar texto de manera precisa, seguir instrucciones al pie de la letra y aprovechar la base de conocimientos inherente a 4o, incluyendo el contexto de chat y la capacidad de transformar imágenes subidas o utilizarlas como inspiración visual. Estas capacidades hacen que sea más sencillo crear exactamente la imagen que se tiene en mente, facilitando la comunicación visual de manera más efectiva y avanzando la generación de imágenes hacia una herramienta práctica, precisa y poderosa.
Esta actualización representa un avance significativo en la interacción entre humanos y máquinas, ofreciendo herramientas más potentes y versátiles para la creación de contenido multimedia.



