Tecnología
Google I/O 2024: ¿Qué novedades recibió Gemini y por qué ChatGPT debería estar asustado?
Los usuarios podrán tener conversaciones de voz con Gemini y usar la cámara de su teléfono para conseguir respuestas más precisas
Este 14 de mayo se celebró el Google I/O, la conferencia anual de desarrolladores organizada por Google para presentar las nuevas tecnologías y productos que ofrecerá la compañía y en esta oportunidad la inteligencia artificial (IA) fue la protagonista.
La compañía tecnológica hizo gala de todas las mejoras que ha recibido Gemini, junto a otros servicios con IA que definitivamente llevan a otro nivel la forma en que las personas pueden interactuar con la información y con las cosas que están en su entorno.
¿Qué novedades hubo en el Google I/O 2024?
Gemini, en camino de ser una superinteligencia artificial
Poco después de que OpenAI lanzara GPT-4o, Sundar Pichai, SEO de Google, responde a su competencia con el anuncio de que ha dado inicio ‘la era Gemini’ y por ello esta IA estuvo presente en gran parte de los anuncios realizados.
Tendencias
Durante la conferencia se reveló Gemini tendrá una integración con Google y con ello muy pronto usuarios de Estados Unidos y otros países comenzarán a interactuar con la inteligencia artificial al momento de hacer consultas a través del popular buscador.
De hecho, Gemini también se integrará a Google Photos y con ello la aplicación será dotada de nuevas capacidades de búsqueda mediante la función Ask Photos. Gracias a esta herramienta el usuario puede hacer preguntas usando comandos de voz y la aplicación responderá con las fotografías que más se ajusten a la consulta realizada.
De esta manera, las personas no tendrán que invertir mucho tiempo en revisar las fotos guardadas en su celular, cuando requieren encontrar una imagen en específico.
Gemini también podría convertirse en un aliado para los padres que necesitan tener un mayor control sobre las actividades escolares que tienen los niños, la IA puede hacer un resumen sobre los deberes que tengan con base a la información que esté disponible en el Gmail de los pequeños.
Pero esta inteligencia artificial puede llegar aún más lejos, pues ahora cuenta con la facultad de convertirse en un tutor para los niños. Durante la presentación se expuso como la IA es capaz de explicar conceptos utilizando el baloncesto como recurso para brindar ejemplos didácticos que sean entretenidos para los niños.
De manera que los padres solo necesitan solicitar con su voz la ayuda de la IA y Gemini hará todo el trabajo.
Gemini 1.5 Pro estará disponible para todos los desarrolladores y usuarios avanzados a partir de hoy, en más de 35 idiomas.
Gemini Live
Entre las innovaciones más llamativas se destaca Gemini Live, una función que le permite al usuario sostener una conversación en audio fluida con la IA. Google indicó que su herramienta cuenta con la capacidad de analizar y adaptarse a los patrones de habla de los usuarios, para así ofrecer respuestas usando 10 diferentes opciones de voz para determinar el tono adecuado para que las personas sientan que están teniendo una charla.
Adicionalmente, el usuario podrá utilizar la cámara de su smartphone para que la IA pueda interpretar en tiempo real las escenas que son mostradas a través del dispositivo. De esta manera, Google ofrecerá un servicio capaz de competir con lo mostrado por OpenAI con GPT-4o, (el modelo más avanzado de ChatGPT).
This summer, we’re expanding Gemini’s multimodal capabilities — including the ability to have an in-depth two-way conversation using your voice. This new experience is called Live. #GoogleIO pic.twitter.com/eAZbaO5WKz
— Google (@Google) May 14, 2024
Proyecto Astra
Otra gran iniciativa de Google es Astra, proyecto que vincula a Gemini con la cámara del teléfono para que la IA pueda comprender e interpretar el mundo que rodea al usuario. En una demostración se reveló como Astra expuso su capacidad para identificar objetos como un altavoz, explicando qué zonas del dispositivo generan los sonidos o leer un código de programación y explicarlo.
De hecho, esta tecnología también vincularse a unas gafas inteligentes y con ello se facilita la interacción del usuario y la IA, sin la necesidad de depender del teléfono para poder señalar un objeto o lugar.
IA generativa
Durante la conferencia también se presentaron innovaciones en materia de inteligencia artificial generativa, por ello se reveló Imagine 3, modelo, según Google, es el mejor que existe para generar imágenes a partir de una descripción de texto del usuario.
Today we’re introducing Imagen 3, @GoogleDeepMind’s most capable image generation model yet. It understands prompts the way people write, creates more photorealistic images and is our best model for rendering text. #GoogleIO pic.twitter.com/6bjidsz6pJ
— Google (@Google) May 14, 2024
Pero Google no solo está trabajando en la generación de imágenes, también tiene un potente modelo que es capaz de producir videos y música.
‘Veo’, un modelo de IA que cuenta con la facultad de generar videos HD de gran calidad y a partir de las instrucciones del usuario. Esta tecnología también puede ser usada para editar videos existentes, lo cual elimina la necesidad de volver a crear un video desde cero.
Este sistema aparece como una respuesta para Sora, la IA de OpenAI que promete generar videos altamente realistas de forma sencilla.
🎥Introducing Veo, our new generative video model from @GoogleDeepMind.
— Google (@Google) May 14, 2024
With just a text, image or video prompt, you can create and edit HQ videos over 60 seconds in different visual styles. Join the waitlist in Labs to try it out in our new experimental tool, VideoFX #GoogleIO pic.twitter.com/RnMsWu9s1q
Finalmente está Music AI Sandbox, una IA que posee la facultad de ayudar a producir música a partir de sencillas solicitudes de los usuarios. De hecho, actualmente en YouTube ya hay pistas musicales que fueron creadas con esta plataforma.
Together with @YouTube, we’ve been building Music AI Sandbox, a suite of AI tools to transform how music can be created. 🎵
— Google DeepMind (@GoogleDeepMind) May 14, 2024
To help us design and test them, we’ve been working closely with musicians, songwriters and producers. ↓ #GoogleIO pic.twitter.com/pMLa3aCveu