La reconocida compañía que creó Chat GPT dio a conocer un nuevo modelo tecnológico de apoyo que les permitirá a los usuarios interactuar de una forma más fluida con la Inteligencia Artificial.
OpenAI, empresa creadora del Chat GPT, dio a conocer un nuevo modelo tecnológico de apoyo que permite interactuar de forma más fluida con la Inteligencia Artificial.
La reconocida compañía que creó Chat GPT dio a conocer un nuevo modelo tecnológico de apoyo que les permitirá a los usuarios interactuar de una forma más fluida con la Inteligencia Artificial.
OpenAl, creadora de Chat GPT entre otros tantos avances, reveló un nuevo modelo de chatbot para sus usuarios, el cual ahora tendrá la gran particularidad de hablar para responder y estar al servicio de los usuarios, además tendrá la capacidad de comprender el contenido de un video y su texto.
La empresa de Elon Musk mostró a través de su CT llamado Mira Murati el modo en que funcionará este inolvidable lanzamiento, “esta actualización es mucho más rápida y mejora las capacidades en texto, visión y audio”.
Luego, Murati continuó y desarrolló las principales características que tendrá GPT-4o “nativamente multimodal”, lo cual quiere decir que el robot puede comprender comandos de voz, imágenes y texto. Logrando de esta forma un mayor acercamiento entre la IA y el humano.
El anuncio del nuevo producto, fue enfocado principalmente en la experiencia del usuario, debido a que otorgará lo mismo que la versión tradicional con la gran diferencia de comprender los sonidos y las imágenes.
La gran capacidad que tendrá GPT-4o podemos observarla en la capacidad para procesar y generar respuestas en tiempo real indiferentemente si el mensaje es transmitido mediante un audio o un texto. Captando a su vez, la intensidad de la voz reproduciendo dependiendo de esto en diferentes estilos.
A su vez, los desarrolladores también se beneficiarán de la disponibilidad de GPT-4o a través de la API de OpenAI. Dicha API, permitirá un acceso al modelo a mitad de precio y el doble de rapidez que GPT-4 Turbo, también ofrecerá a los desarrolladores integrar la capacidad de voz en sus propias aplicaciones y sistemas, abriendo de esta manera, nuevas posibilidades en el desarrollo de aplicaciones de IA.
La empresa fundada en el año 2015 realizó una serie de recomendaciones que los usuarios podrán adoptar para comprender la forma de comunicarse con la IA mediante la voz.
Traducción. El asistente tomó la voz en cada idioma y la tradujo de inmediato.
Charla casual. ChatGPT ahora puede responder de una forma más fluida, ya que no toma la voz del usuario y la convierte en texto, para luego dar un resultado en audio. Salta ese proceso y de inmediato responde con su voz, con un tono amigable, divertido y cercano. Así que se puede usar para tener una conversación casual, hacerle preguntas, realizar búsquedas y pedirle ayuda.
Análisis de imagen. el chatbot tendrá acceso a la cámara del usuario, por lo cual, será posible mostrarle imágenes para que resuelva un problema matemático, diga qué objeto es.
Análisis de códigos y gráficos. ChatGPT ahora comprenderá códigos de programación dando una respuesta en voz para que todo sea más fluido. Además, podrá recibir imágenes de la computadora para analizarlas y generar contenido.