El sistema SynthID de Google ajusta sutilmente las predicciones de los modelos de lenguaje para marcar con agua los textos generados por IA, garantizando que la calidad del contenido no se vea comprometida.
Google y DeepMind han desarrollado una herramienta que integra marcas de agua en textos generados por inteligencia artificial, ofreciendo un método confiable para detectar su origen sin alterar el contenido original. | Foto: Getty Images

Tecnología

Google vs. textos generados con IA: así luce y funciona el nuevo sistema desarrollado de ‘marcas de agua’

Google ha lanzado un nuevo sistema de marcas de agua digitales que permitirá identificar contenido generado por inteligencia artificial, buscando prevenir la desinformación y garantizar la autenticidad en textos, imágenes, audios y videos creados por IA.

Redacción Tecnología
24 de octubre de 2024

En un contexto donde la inteligencia artificial (IA) juega un rol cada vez más significativo en la creación de contenido, la identificación de textos generados por chatbots se ha vuelto un desafío crucial. Google ha desarrollado un sistema de “marcas de agua” para abordar este reto. Este avance busca garantizar la transparencia en la procedencia del contenido y proporcionar una herramienta para detectar textos generados con IA.

Google lanza SynthID: la herramienta para detectar contenido generado por IA

La inteligencia artificial ha transformado la creación de contenido, posibilitando la generación automática de textos, imágenes, audios y videos. No obstante, mientras esta tecnología ofrece nuevas oportunidades creativas y productivas, también ha generado preocupaciones. Algunos textos creados con IA pueden emplearse de manera malintencionada, ya sea para difundir información falsa o para llevar a cabo fraudes y estafas en línea. Ante este panorama, Google ha lanzado SynthID, una herramienta diseñada para identificar y verificar contenido generado por inteligencia artificial, brindando mayor seguridad y transparencia en el entorno digital.

A partir del próximo lunes, Apple dará inicio a una semana de anuncios donde revelará las novedades más esperadas de su línea de productos, sin realizar el clásico evento en vivo que la caracteriza.
En su esfuerzo por combatir la desinformación, Google presenta SynthID, un innovador sistema que emplea marcas de agua invisibles para verificar la procedencia de textos, imágenes y videos creados por inteligencia artificial. | Foto: NurPhoto via Getty Images

SynthID: la nueva solución de Google para la identificación de contenido con IA

Google, junto con DeepMind, ha trabajado durante más de un año en el desarrollo de soluciones para identificar el contenido generado por IA. Como parte de estos esfuerzos, se presentó SynthID, que recientemente se ha lanzado de forma libre para que cualquiera pueda utilizarla. El objetivo principal de esta herramienta es que las plataformas de IA generativa puedan marcar el contenido que generan, lo que facilita su identificación posterior.

SynthID actúa como una especie de “firma digital” para el contenido producido por IA, permitiendo a los usuarios verificar si textos, imágenes, audios o videos fueron generados por inteligencia artificial. Este avance resulta crucial en la lucha contra la desinformación y el uso indebido de la IA, al proporcionar un método eficiente para rastrear la procedencia del contenido.

“Si bien no es una solución milagrosa para abordar problemas como la desinformación o la atribución errónea, SynthID es un conjunto de soluciones técnicas prometedoras para este acuciante problema de seguridad de la IA” Resalta DeepMind en su portal.

Funcionamiento de SynthID

El sistema SynthID funciona mediante la aplicación de modelos y algoritmos avanzados de aprendizaje profundo. Según DeepMind, esta tecnología “utiliza una variedad de modelos para marcar con agua e identificar contenido generado por IA”. La marca de agua digital se incorpora directamente en el contenido generado sin comprometer su calidad original.

En cuanto a la identificación. SynthID escanea el contenido —ya sea texto, imágenes, audio o video— para buscar estas marcas de agua digitales. Este proceso permite determinar si el contenido fue creado por herramientas de IA, lo cual resulta útil para usuarios, empresas o medios de comunicación que deseen verificar la autenticidad de la información que manejan.

Con SynthID, Google ofrece una solución para rastrear el origen del contenido generado por IA mediante marcas de agua digitales, facilitando la transparencia en plataformas creativas y de información.
Google ha desarrollado SynthID, un sistema que integra marcas de agua digitales en contenido generado por inteligencia artificial, permitiendo una identificación precisa sin comprometer la calidad del material original. | Foto: Captura de pantalla tomada de portal DeepMind

Además, el portal de la herramienta señala que la función no interfiere con la precisión o calidad del contenido. En el caso de textos generados por IA, SynthID ajusta los puntajes de probabilidad de los tokens (las unidades mínimas de lenguaje, como palabras o caracteres) que el modelo va eligiendo a medida que genera el texto. Este ajuste crea un patrón único que funciona como una marca de agua, sin alterar la coherencia o creatividad del texto final.

El desafío de marcar el texto generado por IA: un problema resuelto

Uno de los principales retos que enfrentan los investigadores de IA ha sido encontrar una manera de marcar el contenido generado sin comprometer su calidad. La generación de texto por modelos de lenguaje de gran escala (LLM) implica la predicción secuencial de tokens, que representan palabras, frases o caracteres. El modelo predice cuál es el token más probable que aparecerá, según el contexto, pero SynthID ajusta ligeramente estas predicciones para insertar una marca de agua digital sin afectar la fluidez del texto.

Un ejemplo de la función según DeepMind: “Mis frutas tropicales favoritas son __”, el LLM podría comenzar a completar la oración con los tokens “mango”, “lichi”, “papaya” o “durian”, y a cada token se le asigna un puntaje de probabilidad.” SynthID ajusta estos puntajes en aquellos casos donde no se compromete la calidad del contenido, integrando así la marca de agua digital. A medida que el texto se extiende, la marca se vuelve más robusta, aumentando la precisión para detectar si el contenido fue generado por IA.