Tecnología

Google presenta su IA Gemini 1.5: ¿qué la haría más poderosa que ChatGPT?

Esta IA sería la gran apuesta de Google para dominar el campo de la IA.

Redacción Tecnología
15 de febrero de 2024
Gemini 1.5, la nueva versión de la IA generativa de Google
Gemini 1.5, la nueva versión de la IA generativa de Google. | Foto: Google

Google presentó Gemini 1.5, la siguiente generación de su modelo de inteligencia artificial, que introduce una nueva arquitectura con la que puede realizar tareas complejas más rápido, al tiempo que ofrece un rendimiento mejorado y capacidades de comprensión y razonamiento mejorados.

Gemini 1.5 funciona con la arquitectura Mixture-of-Experts (MoE), que divide el modelo en pequeñas redes neuronales que actúan como “expertas” y se activan de manera selectiva dependiendo del tipo de información introducida.

Esto permite que Gemini 1.5 pueda aprender tareas complejas con mayor rapidez manteniendo la calidad, mientras su entrenamiento se vuelve más eficiente, como explica Google en su blog oficial.

Gemini, chatbot de Google que cuenta con una potente IA generativa.
Gemini, chatbot de Google que cuenta con una potente IA generativa. | Foto: Google

La compañía anunció que primero lanzará Gemini 1.5 Pro, la variante de tamaño mediano. Está optimizado para escalar en una amplia gama de tareas y funciona a un nivel similar a Gemini 1.0 Ultra (Gemini Advanced), el más grande de Google hasta la fecha.

Gemini 1.5 Pro introduce como novedad la comprensión de contextos largos. Viene con una ventana de contexto estándar de 128.000 tókenes, si bien un grupo limitado de desarrolladores y clientes empresariales podrán probarlo con una ventana contextual de hasta un millón de tókenes través de AI Studio y Vertex AI, con el objetivo de mejorar la latencia y la experiencia de usuario y reducir los requisitos computaciones antes de generalizarlo.

Con esa ventana de contexto de un millón de tókenes, Gemini 1.5 Pro puede procesar grandes cantidades de información de una sola vez, incluida una hora de video, once horas de audio, bases de código con más de 30.000 líneas de código o más de 700.000 palabras.

Gemini es el chatbot con IA generativa de Google
Gemini es el chatbot con IA generativa de Google. | Foto: Google

Todo esto se traduce en que el modelo tiene capacidades de mejoradas de compresión y razonamiento; analiza, clasifica y resume grandes cantidades de contenido dentro de un mensaje determinado, como apuntan desde Google. Asimismo, puede realizar tareas de resolución de problemas más relevantes en bloques de código más largos.

Gemini guarda automáticamente por unos tres años

Google ha ampliado el acceso a Gemini, el nombre que recibe ahora el ‘chatbot’ Bard, que puede usarse desde la web y también desde una aplicación móvil, y lo ha acompañado de una actualización de sus políticas de privacidad para explicar los datos que recoge y la gestión que puede hacer el usuario de ellos.

Las conversaciones que el usuario mantenga con este asistente quedarán registradas, así como la información del dispositivo, la ubicación y el feedback, independientemente de si se usa en la web o en las apps de Android e iOS.

Google explica en la página dedicada a la Privacidad de Gemini que usa esta información para “ofrecer, mejorar y desarrollar” sus productos y los modelos que impulsan este asistente.

Se trata de una configuración activa por defecto, que guarda los datos en la cuenta de Google por un período de 18 meses, pero que el usuario puede gestionar desde los ajustes, por ejemplo, desactivando el historial de actividad para que las conversaciones futuras no queden guardadas.

En caso de que el usuario decida tener mantener activado el historial de actividad, Google explica que las conversaciones se guardan para mejorar los modelos de aprendizaje automático generativo y que, para ello, son analizadas por revisores humanos entrenados. Por ello, recomienda no compartir con Gemini información sensible.

Google Bard le permite al usuario personalizar las respuestas para que se ajusten a sus necesidades.
Google Bard le permite al usuario personalizar las respuestas para que se ajusten a sus necesidades. | Foto: Oficial de Google / Suministrada a Semana

Asegura que este proceso se realiza manteniendo la privacidad del usuario, para lo que se emplean un subconjunto de conversaciones de los que se elimina la información que pueda ser identificativa. Si los revisores ya han anotado las conversaciones, entonces estas dejan de estar vinculadas con la cuenta de Google y el historial de actividad, y pueden retenerse hasta tres años.

No obstante, la compañía tecnológica matiza que si se ha desactivado el historial de actividad de Gemini, todavía se guardan las conversaciones durante 72 horas. “Esto permite a Google proporcionar el servicio y procesar cualquier comentario”, explica.

También es posible gestionar los datos de ubicación, pero con matices, ya que Google señala que “siempre se recogen” para que la respuesta que ofrezca Gemini sea más precisa y relevante para el usuario, por ejemplo, si pregunta por el tiempo.

Esto se debe a que recoge la locación más general vinculada a la dirección IP de la red a la que esté conectado el dispositivo, que muestra un área de unos 3 kilómetros cuadrados, lo que evita que se identifique con este dato al usuario.

El usuario sí puede decidir si comparte con Gemini una ubicación más precisa desde los ajustes, que en este caso sería la que ofrece el propio dispositivo. Si lo activa, la información quedará almacenada en la historia de actividad de este asistente.

*Con información de Europa Press.