OpenAI dijo que planea detener el uso de una de sus voces de ChatGPT que, según la actriz de “Her”, Scarlett Johansson, suena “inquietantemente similar” a la suya.
En una publicación en la plataforma de redes sociales X, OpenAI dijo el lunes que está “trabajando para pausar” Sky, el nombre de una de las cinco voces con las que los usuarios de ChatGPT pueden elegir hablar. La compañía señaló que había “escuchado preguntas” sobre cómo selecciona las opciones de audio realistas disponibles para su chatbot insignia de inteligencia artificial, particularmente Sky, y quería abordarlas.
Entre los que plantearon preguntas estaba Johansson, quien prestó su voz a una asistente de inteligencia artificial (IA) ficticia, y en ese momento futurista, en la película de 2013 “Her”.
Johansson emitió un comunicado diciendo que el CEO de OpenAI, Sam Altman, se había aproximado a ella en septiembre para preguntarle si prestaría su voz al sistema, diciendo que sentía que sería “reconfortante para las personas” que no se sienten cómodas con la tecnología. La actriz dijo que rechazó la oferta.
“Cuando escuché el demo lanzado, me sorprendió, me enojó y no pude creer que el sr. Altman buscara una voz que sonaba tan inquietantemente similar a la mía que mis amigos más cercanos y los medios de comunicación no podían notar la diferencia”, dijo Johansson.
Dijo que OpenAI accedió “a regañadientes” a eliminar la voz de Sky después de que contrató a abogados que escribieron cartas a Altman preguntando sobre el proceso por el cual la compañía creó la voz.
OpenAI había buscado desacreditar las teorías de Internet sobre Johansson en una publicación de blog que acompañaba a su anuncio anterior, la publicación buscaba detallar cómo se eligieron las voces de ChatGPT. La compañía escribió que creía que las voces de IA “no deberían imitar deliberadamente la voz distintiva de una celebridad” y que la voz de Sky pertenece a una “actriz profesional diferente”. Pero agregó que no podía compartir el nombre de esa profesional por razones de privacidad.
En un comunicado enviado a The Associated Press tras la respuesta de Johansson el lunes por la noche, Altman dijo que OpenAI eligió a la actriz de voz detrás de Sky “antes de cualquier contacto” con Johansson.
“La voz de Sky no es la de Scarlett Johansson, y nunca tuvo la intención de parecerse a la suya”, dijo Altman. “Por respeto a la sra. Johansson, hemos hecho una pausa en el uso de la voz de Sky en nuestros productos. Lamentamos con la sra. Johansson que no nos comunicamos mejor”.
OpenAI, con sede en San Francisco, lanzó por primera vez las capacidades de voz para ChatGPT, que incluían las cinco voces diferentes, en septiembre, lo que permitió a los usuarios entablar conversaciones de ida y vuelta con el asistente de IA. Originalmente, el “Modo de voz” solo estaba disponible para suscriptores de paga, pero en noviembre, OpenAI anunció que la función sería gratuita para todos los usuarios con la aplicación móvil.
Y las interacciones de ChatGPT son cada vez más sofisticadas. La semana pasada, OpenAI dijo que la última actualización de su modelo de IA generativa puede imitar las cadencias humanas en sus respuestas verbales e incluso puede tratar de detectar los estados de ánimo de las personas.
OpenAI dice que el modelo más nuevo, denominado GPT-4o, funciona más rápido que las versiones anteriores y puede razonar a través de texto, audio y video en tiempo real. En una demostración durante el anuncio de OpenAI el 13 de mayo, el bot de IA chateó en tiempo real, agregando emoción, específicamente “más drama”, a su voz como se le solicitó. También se intentó extrapolar el estado emocional de una persona mirando un video selfie de su rostro, ayudó en traducciones de idiomas, problemas matemáticos paso a paso y más.
GPT-4o, abreviatura de “omni”, aún no está ampliamente disponible. En las próximas semanas y meses llegará progresivamente a usuarios seleccionados. Las capacidades de texto e imagen del modelo ya han comenzado a implementarse, y está previsto que lleguen incluso a algunos de los que utilizan el nivel gratuito de ChatGPT, pero el nuevo modo de voz sólo estará disponible para los suscriptores de paga de ChatGPT Plus.
Si bien la mayoría aún no ha tenido en sus manos estas características recién anunciadas, las capacidades han evocado aún más comparaciones con el romance distópico de Spike Jonze “Her”, que sigue a un hombre introvertido (Joaquin Phoenix) que se enamora de un sistema operativo de IA (Johansson), lo que lleva a muchas complicaciones.
Altman también pareció aprovechar esto, simplemente publicando la palabra “ella” en la plataforma de redes sociales X el día de la presentación de GPT-4o.
Muchos de los que reaccionaron a las demostraciones del modelo la semana pasada también encontraron que algunas de las interacciones tenían un tono extrañamente coqueto. En un video publicado por OpenAI, un ChatGPT con voz femenina felicita a un empleado de la empresa por “lucir una sudadera con capucha de OpenAI”, por ejemplo, y en otro el chatbot dice “¡oh!, detente, me estás haciendo sonrojar” después de que le digan que es increíble.
Eso ha provocado una conversación de género pues, según los críticos, las empresas de tecnología han utilizado por mucho tiempo esto para desarrollar e involucrar asistentes de voz, que se remontan a mucho antes de que la última ola de IA generativa avanzara las capacidades de los chatbots de IA. En 2019, la UNESCO, organización de cultura y ciencia de las Naciones Unidas, señaló la “sumisión programada” incorporada en los asistentes de voz femenina predeterminados (como Siri de Apple o Alexa de Amazon), incluso cuando se enfrentan a insultos sexistas y acoso.
“Esto está claramente programado para alimentar los egos de los tipos”, dijo la corresponsal The Daily Show, Desi Lydic, sobre GPT-4o en un segmento la semana pasada. “Realmente se puede decir que un hombre construyó esta tecnología”.
*Con información de AP