Hoy en día las aplicaciones de transcripción nos pueden ayudar a ahorrar tiempo y esfuerzo al convertir rápidamente archivos de audio en texto. Esto resulta demasiado útil, desde el día a día para audios en aplicaciones de mensajería, en el entorno laboral ayudandonos a facilitar la toma de notas durante reuniones y/o entrevístas y como herramienta para personas con discapacidad auditiva.

En Argentina, se popularizó en las últimas semanas un bot para WhatsApp que realiza la tarea de transcribir los audios enviados en cuestión de minutos. Más allá de este bot en particular y el hecho de que sus creadores aseguran que protegue la privacidad de las personas, y que no tienen un registro de la información que contienen esos audios, lo cierto es que el uso de aplicaciones de transcripción de audio a texto en general puede plantear diferentes riesgos para la seguridad y privacidad que deben ser considerados.

Riesgos asociados a aplicaciones para transcripción de audio.

WhatsApp anunció que está trabajando en una funcionalidad para transcribir audio a texto, existen diferentes apps desarrolladas por terceros que utilizan diferentes métodos para transcribir un archivo de audio a texto, tanto manualmente como automáticamente.

En el cado de la transcricpión automatizada, algunas apps utilizan algoritmos de reconocimiento de voz y aprendizaje automático para convertir el audio en texto sin intervencioón humana, estos programas pueden ser desarrollados por la compañía detrás de las apps o ser un servicio tercerizado.

Esta última opción es más rápida y eficiente, pero también plantea algunas interrogantes con respecto a la privacidad, ya que en muchos csaso se desconoce el alcance que podría tener el audio enviado, ¿será utilizado para mejorar el algoritmo? ¿se almacenará en servidores, propios o de terceros durante el análisis del contenido? ¿cómo se asegura el envío de esa información, si es que el procesamiento del audio se terceriza?

Por otro lado, la transcripción manual implica que la misma sea realizada por una persona, lo cual puede plantear riesgos de privacidad si quienes realizan esta transcripción tienen acceso a información confidencial o si se comparte con terceros sin el consentimiento del ususario. De hecho la empresa Meta (en ese entonces, Facebook) se vio envuelta en una polémica por tercerizar la transcripción de audios enviados por sus usuarios para poder mejorar su sistema de reconocimiento de voz.

Almacenamiento de datos.

La mayoría de estas aplicaciones solicitan a los ususarios que concedan permisos para acceder a diferente información del dispositivo, como la ubicación, contactos, chats en aplicaciones de mensajería y hasta el uso del micrófono del dispositivo, todo esto con el fin de cpoder funcionar o también proporcionar una mejor experiencia a sus usuarios.

Sin embargo, la recopilación de esta información puede presantar un riesgo si se utiliza indebidamente o si se comparte con terceros sin el consentimiento del usuario en cuestión, también si no se asegura correctamente en los servidores de la compañía que la almacena. Si bien, este punto no es exclusivo para las apps de transcripción de audio, sí es cierto que este tipo de apps recolectan archivos de audios que usualmente son de la voz del usuario o allegados. Sobre todo en los casos en los cuales la aplicación se presenta como un bot para apps como WhatsApp o Telegram.

La información de audio y texto recopilada por la apps también podría ser utilizada para crear un perfil de la persona, para personalizar anuncios y recomendaciones. Si la app no protege adecuadamente la información personal de los usuarios, podrían ser vulnerables para los ciberdelincuentes.

Apps maliciosas.

Puede exisitir la posibilidad de que existan aplicaciones o chatbots fraudulentos para la transcricpión de audio a texto, ya sea que no cuente con políticas de provacidad sólidas, que no protegan debidamente la información del usuario o que incluso la comercialicen. Tambien suele suceder que con el auge de estas tecnologías los cibercriminales se aprovechan de la situación para lanzar falsas apps que utilizan como pantallas de humo para infectar a las víctimas con algún tipo de malware.

Estas apps fraudulentas pueden ser muy exitosas debido a que los ususarios no siempre verifica quién desarrolló la app ni examina cuidadosamente sus políticas de privacidad. Estas apps maliciosas pueden ser copias de otras legítimas, lo que dificulta aún más que los ususarios las identifiquen como fraudulentas.

Robo de información para realizar ciberataques.

Sea por una aplicación falsa o por una vulneración de una app, los audios y textos robados puede ser utilizadas para generar ciberataques. Un ejemplo de ello podría ser el entrnamiento de un modelo de machine leraning para producir deepfakes en formato de audios, ya sea para noticias falsas o ataques de ingeniería social,

El proceso implica generalmente dos pasos: el entrenamiento del modelo y el uso del modelo en sí. En el primer paso se utilizan los datos robados para entrenar el modelo de aprendizaje automático, el cual utiliza técnicas de procesamiento de señales de audio y lenguaje natural para aprender cómo se pronuncia las palabras y cómo se estructuran las oraciones. Una vez que el modelo se entrena con suficiente cantidad de datos, será capaz de generar texto a partir de un archivo de audio.

Los ciberciminales podrían utilizar el modelo para manipular los audios robados y hacer que las víctimas digan cosas que no hicieron, pueden utilizar la transcripción falsa para chantajear, extorsionar o engalar a las mismas y a sus allegados, o incluso pueden suplantar la identidad de una persona reconocida y generar una noticia falsa.

Recomendaciones.

  • Descargar las apps solo de fuentes confiables y evitar descargar apps de terceros desconocidos o no verificados, en caso de ser chatbot, verificar que el número o ususarios sea el correcto y no una copia maliciosa.
  • Revisar las políticas de privacidad de la app, verificar los apartados acerca de la información almacenada y compartida con terceros.
  • No compartir información confidencial o sensible mediante los audios a cargar en la app, como contraseñas o información financiera.
  • Si se trata de una app descargable, mantenerla actualizada para tener las últimas correciones de seguridad y parches.

Fuente web: https://www.welivesecurity.com/la-es/2023/04/25/riesgos-seguridad-privacidad-apps-transcripcion-audio-texto/