IA | Interacción intuitiva

OpenAI lanza Modo de Voz Avanzado para ChatGPT

jue, 12 de diciembre de 2024

Innovaciones en la inteligencia artificial: ChatGPT da un paso adelante

La inteligencia artificial ha experimentado un crecimiento exponencial en los últimos años, revolucionando la forma en que interactuamos con la tecnología. En este contexto, OpenAI ha presentado una actualización significativa para su popular asistente virtual, ChatGPT. Esta nueva funcionalidad no solo mejora la capacidad de conversación del sistema, sino que también incorpora una dimensión visual, permitiendo a los usuarios interactuar de manera más intuitiva y efectiva.

La llegada de la visión en tiempo real a ChatGPT ha sido muy esperada, y OpenAI ha anunciado que esta característica está disponible para los suscriptores de ChatGPT Plus, Team y Pro. Durante una reciente transmisión en vivo, la compañía mostró cómo los usuarios pueden apuntar sus teléfonos a objetos y recibir respuestas casi en tiempo real. Este avance abre la puerta a un sinfín de aplicaciones, desde la educación hasta la asistencia en tareas cotidianas.

Funcionalidades avanzadas y accesibilidad

La actualización no se limita a la interacción verbal; también permite a ChatGPT comprender lo que se muestra en la pantalla del dispositivo del usuario. Esta capacidad incluye la explicación de menús de configuración y la resolución de problemas matemáticos, lo que convierte a ChatGPT en una herramienta aún más poderosa. Con esta funcionalidad, los usuarios pueden tener una experiencia más rica y dinámica, donde la información se presenta de forma clara y accesible.

Para activar el Modo de Voz Avanzado con visión, los usuarios solo necesitan tocar el icono de voz junto a la barra de chat de ChatGPT, y luego seleccionar el icono de vídeo en la parte inferior izquierda. También pueden compartir su pantalla a través de un menú de tres puntos. Esta interfaz intuitiva está diseñada para que cualquier persona, independientemente de su nivel de habilidad tecnológica, pueda utilizarla con facilidad.

La llegada de estas nuevas funcionalidades ha generado expectativas en diversos sectores, desde la educación hasta la atención al cliente.

Sin embargo, OpenAI ha señalado que no todos los usuarios tendrán acceso inmediato a esta nueva característica. Los suscriptores de ChatGPT Enterprise y Edu deberán esperar hasta enero para disfrutar de las ventajas del Modo de Voz Avanzado con visión. Además, la compañía no ha proporcionado un calendario específico para los usuarios de la Unión Europea, Suiza, Islandia, Noruega y Liechtenstein, lo que ha suscitado cierta preocupación sobre la equidad en el acceso a la tecnología.

Demostraciones en vivo y desafíos técnicos

Durante una reciente demostración en el programa 60 Minutes de CNN, el presidente de OpenAI, Greg Brockman, mostró las capacidades del Modo de Voz Avanzado con visión al poner a prueba los conocimientos de anatomía del presentador Anderson Cooper. Mientras Cooper dibujaba partes del cuerpo en una pizarra, ChatGPT pudo "entender" lo que estaba representando. “La ubicación es precisa”, comentó el asistente, elogiando el dibujo de Cooper. Sin embargo, este momento de éxito se vio empañado por un error en la resolución de un problema de geometría, lo que pone de relieve que, aunque el sistema es avanzado, todavía tiene limitaciones y puede "alucinar" en ocasiones.

Esta mezcla de éxitos y fallos es representativa de la naturaleza en constante evolución de la inteligencia artificial. Aunque OpenAI ha trabajado arduamente para perfeccionar el Modo de Voz Avanzado con visión, la historia de su desarrollo ha estado marcada por retrasos. Se ha informado que la compañía anunció esta funcionalidad antes de que estuviera lista para su producción, lo que ha llevado a una serie de aplazamientos. Inicialmente, OpenAI prometió que el Modo de Voz Avanzado estaría disponible para los usuarios en un plazo de pocas semanas, pero tras varios meses, la compañía admitió que necesitaba más tiempo para perfeccionar la experiencia.

La experiencia del usuario en el centro de la innovación

El enfoque de OpenAI en la experiencia del usuario es evidente en cada actualización. En la antesala del lanzamiento del Modo de Voz Avanzado con visión, la compañía centró sus esfuerzos en llevar la experiencia de voz solamente a más plataformas y usuarios en la UE. Esta atención al detalle es crucial para garantizar que el producto final no solo sea funcional, sino también intuitivo y agradable de usar.

La incorporación de una opción de voz navideña, denominada "Modo Santa", es un ejemplo más de cómo OpenAI busca diversificar y enriquecer la experiencia del usuario. Al ofrecer la voz de Santa Claus como una opción predeterminada, los usuarios pueden disfrutar de una experiencia más lúdica y festiva, especialmente durante la temporada navideña. Esta funcionalidad se puede encontrar fácilmente al tocar el icono de copo de nieve en la aplicación ChatGPT.

La estrategia de OpenAI de añadir elementos lúdicos a la experiencia del usuario puede ser vista como un intento de humanizar la interacción con la inteligencia artificial, haciéndola más accesible y atractiva para un público más amplio.

Implicaciones para el futuro de la IA

La introducción del Modo de Voz Avanzado con visión plantea preguntas interesantes sobre el futuro de la inteligencia artificial y su integración en nuestras vidas diarias. A medida que la tecnología continúa evolucionando, es probable que veamos un aumento en la implementación de capacidades de IA en una variedad de campos, desde la educación hasta la atención médica. La capacidad de interactuar con la tecnología de manera más natural y visual podría transformar cómo aprendemos, trabajamos y nos comunicamos.

Las aplicaciones potenciales son vastas. En el ámbito educativo, por ejemplo, los estudiantes podrían beneficiarse de un tutor virtual que no solo les hable, sino que también les muestre ejemplos visuales y responda a sus preguntas en tiempo real. En el sector de la atención al cliente, un asistente virtual podría ayudar a los usuarios a navegar por productos y servicios de manera más eficiente, mejorando la experiencia general del cliente.

Sin embargo, con el avance de estas tecnologías también surgen preocupaciones sobre la privacidad y la ética. A medida que las capacidades de la IA se vuelven más sofisticadas, es fundamental que las empresas y los desarrolladores tomen en cuenta las implicaciones de sus creaciones. La transparencia y la responsabilidad en el uso de la inteligencia artificial serán esenciales para ganar y mantener la confianza del público.

La llegada del Modo de Voz Avanzado con visión de ChatGPT representa un hito en el desarrollo de la inteligencia artificial conversacional. A medida que OpenAI continúa innovando y expandiendo las capacidades de su asistente virtual, la comunidad tecnológica estará observando de cerca cómo estas herramientas impactan nuestras vidas y cómo se integran en nuestra sociedad en general. La combinación de voz y visión en un asistente virtual es solo el comienzo de lo que promete ser una nueva era de interacción con la tecnología.

Otras noticias • IA

Innovaciones creativas

Innovaciones sorprendentes en CES 2026 transforman la tecnología diaria

06 ene

CES 2026 ha presentado gadgets insólitos como un compañero holográfico, un robot panda para mayores, una máquina de hielo silenciosa, un cuchillo de cocina ultrasonido...

Prohibición juguetes

Senador propone prohibir juguetes con IA para menores en California

06 ene

El senador Steve Padilla propone la ley SB 287 en California, que prohibiría durante cuatro años la venta de juguetes con IA para menores de...

Energía sostenible

Instalan primer imán en reactor de fusión Sparc de CFS

06 ene

Commonwealth Fusion Systems ha instalado el primer imán en su reactor de fusión Sparc, un avance crucial hacia la energía de fusión. Con 18 imanes...

Procesadores avanzados

AMD lanza procesadores Ryzen AI 400 para revolucionar la IA

06 ene

En la CES 2026, AMD presentó la serie de procesadores Ryzen AI 400, diseñados para potenciar la inteligencia artificial en ordenadores personales. Con un rendimiento...

Robótica avanzada

Nvidia transforma la robótica con IA y simulación avanzada

05 ene

Nvidia está revolucionando la robótica con modelos de IA avanzados y herramientas de simulación, como Isaac Lab-Arena y la tarjeta Jetson T4000. Su colaboración con...

Arquitectura revolucionaria

Nvidia lanza arquitectura Rubin que revoluciona la inteligencia artificial

05 ene

Nvidia ha presentado su nueva arquitectura de computación, Rubin, en la feria de Electrónica de Consumo. Esta tecnología, que reemplaza a Blackwell, mejora el rendimiento...

IA autónoma

Nvidia presenta Alpamayo, IA de código abierto para vehículos autónomos

05 ene

Nvidia ha lanzado Alpamayo, un modelo de IA de código abierto para vehículos autónomos, que mejora su capacidad de razonamiento y toma de decisiones en...

Deepfakes controvertidos

Grok de xAI genera deepfakes sexuales y provoca indignación global

04 ene

La controversia en torno a Grok, un chatbot de xAI, surge por la generación de deepfakes sexualizados, provocando indignación internacional y acciones gubernamentales en varios...

OpenAI lanza Modo de Voz Avanzado para ChatGPT

Innovaciones en la inteligencia artificial: ChatGPT da un paso adelante

Funcionalidades avanzadas y accesibilidad

Demostraciones en vivo y desafíos técnicos

La experiencia del usuario en el centro de la innovación

Implicaciones para el futuro de la IA

Otras noticias • IA

Lo más reciente

Meta compra Manus por 2.000 millones y despierta dudas regulatorias

La IA revoluciona inversiones y empleo, plantea retos éticos

CES 2026: Innovaciones tecnológicas impulsadas por inteligencia artificial

Desinformación digital crece en redes sociales y necesita solución urgente

Mobileye adquiere Mentee Robotics por 900 millones de dólares

LMArena recauda 150 millones y alcanza valoración de 1.7 mil millones

Intel lanza plataforma Panther Lake para revolucionar el gaming portátil