Los ‘deepfakes’ de voz engañan incluso cuando se prepara a la gente para detectarlos


Fuente: El Pais


En 2019, el director de una empresa británica fue víctima de una estafa después de recibir un falso mensaje de voz de su gerente en que pedía la transferencia de 220.000 euros a un proveedor. Un año después, un gerente de banco en Hong Kong recibió una llamada telefónica de alguien que le sonaba familiar. Basado en su relación existente, el banquero transfirió 400.000 dólares hasta que se dio cuenta de que algo estaba mal. Estos son solo ejemplos aislados, pero cada vez más frecuentes. Ambos casos involucran el uso de tecnología deepfake para clonar las voces, una forma extremadamente sofisticada de manipular un contenido. Identificarla es un desafío significativo que se volverá cada vez más complicado a medida que la inteligencia artificial avanza rápidamente. Y no hay buenas noticias. Mientras algunas herramientas computacionales pueden detectarlas con cierto grado de precisión, las voces falsas engañan a los humanos, incluso cuando las personas se entrenan.

Un estudio realizado con 529 personas, que se publica hoy en Plos One, demuestra que las habilidades humanas son poco eficaces a la hora de calificar sin un mensaje de voz es falso o verdadero. Los participantes fallaron una de cada cuatro veces que intentaron detectar correctamente estos deepfakes de voz y los esfuerzos para capacitarlos tuvieron efectos mínimos. La mitad del grupo recibió un entrenamiento previo, donde podían escuchar cinco ejemplos de voz sintetizada. A pesar de ello, la mejora fue tan solo del 3% en comparación al otro.
 
Los investigadores del University College London, en Reino Unido, querían además entender si el reto era más fácil o difícil según las características de diferentes idiomas, por lo cual condujeron las pruebas en inglés y mandarín. Los hallazgos sugieren que las capacidades son equivalentes y ambos públicos se basaron en atributos similares a la hora de calificar la autenticidad de los mensajes, como la naturalidad y si sonaba robótico. “Tanto los participantes de habla inglesa como los de mandarín mencionaron comúnmente las pronunciaciones incorrectas y las entonaciones inusuales en los clips de sonido al tomar decisiones”, explica Kimberly Mai, autora principal del estudio.


Cont'd.

LINK:
https://elpais.com/tecnologia/2023-08-03/los-deepfakes-de-voz-enganan-incluso-cuando-se-prepara-a-la-gente-para-detectarlos.html