En un contexto donde la inteligencia artificial (IA) juega un rol cada vez más significativo en la creación de contenido, la identificación de textos generados por chatbots se ha vuelto un desafío crucial. Google ha desarrollado un sistema de “marcas de agua” para abordar este reto. Este avance busca garantizar la transparencia en la procedencia del contenido y proporcionar una herramienta para detectar textos generados con IA.
Google lanza SynthID: la herramienta para detectar contenido generado por IA
La inteligencia artificial ha transformado la creación de contenido, posibilitando la generación automática de textos, imágenes, audios y videos. No obstante, mientras esta tecnología ofrece nuevas oportunidades creativas y productivas, también ha generado preocupaciones. Algunos textos creados con IA pueden emplearse de manera malintencionada, ya sea para difundir información falsa o para llevar a cabo fraudes y estafas en línea. Ante este panorama, Google ha lanzado SynthID, una herramienta diseñada para identificar y verificar contenido generado por inteligencia artificial, brindando mayor seguridad y transparencia en el entorno digital.
SynthID: la nueva solución de Google para la identificación de contenido con IA
Google, junto con DeepMind, ha trabajado durante más de un año en el desarrollo de soluciones para identificar el contenido generado por IA. Como parte de estos esfuerzos, se presentó SynthID, que recientemente se ha lanzado de forma libre para que cualquiera pueda utilizarla. El objetivo principal de esta herramienta es que las plataformas de IA generativa puedan marcar el contenido que generan, lo que facilita su identificación posterior.
SynthID actúa como una especie de “firma digital” para el contenido producido por IA, permitiendo a los usuarios verificar si textos, imágenes, audios o videos fueron generados por inteligencia artificial. Este avance resulta crucial en la lucha contra la desinformación y el uso indebido de la IA, al proporcionar un método eficiente para rastrear la procedencia del contenido.
“Si bien no es una solución milagrosa para abordar problemas como la desinformación o la atribución errónea, SynthID es un conjunto de soluciones técnicas prometedoras para este acuciante problema de seguridad de la IA” Resalta DeepMind en su portal.
Funcionamiento de SynthID
El sistema SynthID funciona mediante la aplicación de modelos y algoritmos avanzados de aprendizaje profundo. Según DeepMind, esta tecnología “utiliza una variedad de modelos para marcar con agua e identificar contenido generado por IA”. La marca de agua digital se incorpora directamente en el contenido generado sin comprometer su calidad original.
En cuanto a la identificación. SynthID escanea el contenido —ya sea texto, imágenes, audio o video— para buscar estas marcas de agua digitales. Este proceso permite determinar si el contenido fue creado por herramientas de IA, lo cual resulta útil para usuarios, empresas o medios de comunicación que deseen verificar la autenticidad de la información que manejan.
Además, el portal de la herramienta señala que la función no interfiere con la precisión o calidad del contenido. En el caso de textos generados por IA, SynthID ajusta los puntajes de probabilidad de los tokens (las unidades mínimas de lenguaje, como palabras o caracteres) que el modelo va eligiendo a medida que genera el texto. Este ajuste crea un patrón único que funciona como una marca de agua, sin alterar la coherencia o creatividad del texto final.
El desafío de marcar el texto generado por IA: un problema resuelto
Uno de los principales retos que enfrentan los investigadores de IA ha sido encontrar una manera de marcar el contenido generado sin comprometer su calidad. La generación de texto por modelos de lenguaje de gran escala (LLM) implica la predicción secuencial de tokens, que representan palabras, frases o caracteres. El modelo predice cuál es el token más probable que aparecerá, según el contexto, pero SynthID ajusta ligeramente estas predicciones para insertar una marca de agua digital sin afectar la fluidez del texto.
Un ejemplo de la función según DeepMind: “Mis frutas tropicales favoritas son __”, el LLM podría comenzar a completar la oración con los tokens “mango”, “lichi”, “papaya” o “durian”, y a cada token se le asigna un puntaje de probabilidad.” SynthID ajusta estos puntajes en aquellos casos donde no se compromete la calidad del contenido, integrando así la marca de agua digital. A medida que el texto se extiende, la marca se vuelve más robusta, aumentando la precisión para detectar si el contenido fue generado por IA.