La semana pasada OpenAI reveló una nueva interfaz conversacional para ChatGPT con un voz expresiva y sintética sorprendentemente similar al del asistente de IA interpretado por Scarlett Johansson en la película de ciencia ficción Su-solo para desactivar repentinamente la nueva voz durante el fin de semana.
El lunes, Johansson emitió un comunicado afirmando haber forzado esa reversión, después de que sus abogados exigieran a OpenAI que aclarara cómo se creó la nueva voz.
johansson declaración, transmitido a WIRED por su publicista, afirma que el director ejecutivo de OpenAI, Sam Altman, le pidió en septiembre pasado que proporcionara la nueva voz de ChatGPT, pero ella se negó. Ella describe su asombro al ver a la compañía hacer una demostración de una nueva voz para ChatGPT la semana pasada que de todos modos sonaba como ella.
“Cuando escuché la demostración del lanzamiento me quedé sorprendido, enojado e incrédulo de que el Sr. Altman persiguiera una voz que sonaba tan inquietantemente similar a la mía que mis amigos más cercanos y los medios de comunicación no podían notar la diferencia”, se lee en el comunicado. Señala que Altman pareció alentar al mundo a conectar la demostración con la actuación de Johansson tuiteando “su”, en referencia a la película, el 13 de mayo.
La declaración de Johansson dice que Altman se puso en contacto con su agente dos días antes de la demostración de la semana pasada y le pidió que reconsiderara su decisión de no trabajar con OpenAI. Después de ver la demostración, dice que contrató a un asesor legal para escribir a OpenAI pidiendo detalles sobre cómo creó la nueva voz.
La declaración afirma que esto llevó al anuncio de OpenAI el domingo en un publicar en X que había decidido “pausar el uso de Sky”, el nombre que da la empresa a la voz sintética.
Sky es una de varias voces sintéticas que OpenAI le dio a ChatGPT en septiembre pasado, pero en el evento de la semana pasada mostró una entonación mucho más realista con señales emocionales. En la demostración, una versión de ChatGPT impulsada por un nuevo modelo de IA llamado GPT-4o parecía coquetear con un ingeniero de OpenAI de una manera que a muchos espectadores les pareció una reminiscencia de la actuación de Johansson en Su.
Cuando se le preguntó por qué OpenAI había decidido desactivar Sky, Niko Felix, un portavoz de OpenAI, se refirió a WIRED una publicación de blog también del domingo describiendo el proceso por el que pasó la empresa para elegir su voz. “La voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a una actriz profesional diferente que usa su propia voz natural”, dice la publicación.
“Por ahora, estamos pausando el uso de la voz de Sky mientras abordamos algunas preguntas, pero esperamos recuperarla pronto”, dijo Félix.
El conflicto con Johansson se suma a las batallas existentes de OpenAI con artistas, escritores y otros creativos. La empresa ya defiende una número de demandas alegando que utilizó de manera inapropiada contenido protegido por derechos de autor para entrenar sus algoritmos, incluidas demandas de The New York Times y autores como George RR Martin.
La IA generativa ha hecho que sea mucho más fácil crear voces sintéticas realistas, creando nuevas oportunidades y amenazas. En enero, los votantes de New Hampshire fueron bombardeados con llamadas automáticas con un mensaje de voz deepfake de Joe Biden. En marzo, OpenAI dijo que había desarrollado una tecnología que podía clonar la voz de alguien a partir de un clip de 15 segundos, pero la compañía dijo que no lanzaría la tecnología por cómo podría ser mal utilizado.