La Inteligencia Artificial (IA) es una de las herramientas tecnológicas más importantes de las últimas dos décadas, ya que es la responsable de la realidad tal como se puede observar hoy en día. El aprendizaje que las máquinas pueden hacer del mundo que las rodea ha resultado sumamente importante para lograr los avances que se pueden ver hoy en la vida cotidiana de las personas, tales como los asistentes virtuales o incluso los traductores en internet.

Por supuesto, la IA también resulta útil en procesos más exigentes, como la conducción autónoma de un vehículo o la siempre difícil tarea de operar a una persona en un hospital.

Sin embargo, aunque en la mayoría de los casos las tecnologías cuya base es la IA tienen la capacidad de aprender por ellas mismas, aún necesitan de la supervisión humana para asegurarse de que las máquinas realicen el trabajo asignado óptimamente.

Por esto, no es para sorprenderse que Meta, casa matriz de redes sociales como Facebook, WhatsApp e Instagram, muestre con orgullo su nueva creación en el marco de la IA: data2vec.

De acuerdo con un comunicado oficial de la compañía, este nuevo trabajo es “el primer algoritmo autosupervisado de alto rendimiento que aprende de la misma manera para el habla, la visión y el texto”.

Meta explica que para que la mayoría de las máquinas puedan aprender, sus supervisores deben adjuntar datos previamente etiquetados que les permiten, precisamente, realizar un buen trabajo que cumpla con los parámetros programados.

“Sin embargo, a través del aprendizaje autosupervisado, las máquinas pueden aprender sobre el mundo simplemente observándolo y luego descifrando la estructura de las imágenes, el habla o el texto. Este es un enfoque más escalable y eficiente para que las máquinas aborden nuevas tareas complejas, como la comprensión de texto para más idiomas hablados”, explica la compañía liderada por Mark Zuckerberg.

Asimismo, la empresa menciona que en la mayoría de estos algoritmos, el aprendizaje en múltiples modalidades se hace muy complicado, teniendo en cuenta que un algoritmo diseñado para la comprensión de imágenes muy difícilmente servirá también para comprender voz o texto al mismo tiempo. No obstante, con el algoritmo autosupervisado, Meta encontró la forma de que sean las máquinas las que pueden detectar, interpretar y hasta predecir lo que puede decir o se puede leer de una imagen sin necesidad de otra clase de conjuntos matemáticos independientes.

“Con data2vec , hemos desarrollado una forma unificada para que los modelos predigan sus propias representaciones de los datos de entrada, sin importar si se trata de voz, texto o audio. Al centrarse en estas representaciones, un solo algoritmo puede funcionar con tipos de entrada completamente diferentes”, señala el documento.

Igualmente, añade: “con data2vec, estamos más cerca de construir máquinas que aprenden sobre diferentes aspectos del mundo que les rodea sin tener que depender de datos etiquetados. Esto allana el camino para un aprendizaje autosupervisado más general y nos acerca a un mundo en el que la IA podría usar videos, artículos y grabaciones de audio para aprender sobre temas complicados, como el fútbol o diferentes formas de hornear pan”.

Por último, Meta dice confiar tanto en su nuevo producto, que incluso sería la clave para crear una IA mucho más adaptable a cualquier escenario o ambiente, que pueda realizar actividades nunca antes imaginables o posibles de alcanzar.

“Si es un investigador interesado en desarrollar nuestro trabajo, puede acceder al código fuente abierto y publicar modelos preentrenados en GitHub”, finalizó.