1. Las herramientas de transcripción de IA como Whisper de OpenAI han mejorado significativamente la precisión en la transcripción del habla.
2. Cuando los transcriptores de IA como Whisper cometen errores, a menudo alucinan frases enteras que pueden ser dañinas, incluida la perpetuación de la violencia y la falsa autoridad.
3. Los investigadores recomiendan que OpenAI concientice a los usuarios sobre la tendencia de Whisper a alucinar y mejore la herramienta para adaptarse mejor a las comunidades desatendidas, como las personas con trastornos del habla.
Los transcriptores de voz a texto se han vuelto muy precisos con la ayuda de la tecnología de inteligencia artificial, revolucionando la forma en que se registra y almacena la información. A pesar de su eficacia, se producen errores y algunos modelos de IA producen textos alucinados en lugar de transcripciones precisas. Un estudio reciente centrado en la API Whisper de OpenAI encontró que estas alucinaciones pueden ser angustiosas y a menudo incluyen daños explícitos como violencia, asociaciones inexactas y autoridad falsa.
Investigadores de varias universidades descubrieron que, aunque Whisper era más avanzado que otras herramientas, todavía alucinaba más del 1% de las veces. El estudio también reveló que era más probable que estas alucinaciones ocurrieran durante pausas más largas en el habla, lo que destaca un problema importante al transcribir el habla de personas con afasia.
Las alucinaciones dañinas producidas por Whisper se clasificaron en categorías como perpetuación de la violencia, asociaciones inexactas y autoridad falsa, revelando los riesgos potenciales asociados con la dependencia de transcripciones inexactas. Desde entonces, OpenAI ha mejorado la herramienta para reducir las alucinaciones problemáticas, pero las razones detrás de estos errores aún no están claras.
Las consecuencias de tales errores en las transcripciones podrían ser graves, especialmente en escenarios como entrevistas de trabajo donde las transcripciones desempeñan un papel en la selección de candidatos. Los investigadores enfatizan la importancia de concienciar a las personas sobre las tendencias alucinantes de Whisper y recomiendan diseñar versiones más nuevas para servir mejor a las comunidades desatendidas, como las personas con impedimentos del habla. En última instancia, abordar la cuestión del texto alucinado en las transcripciones de IA es crucial para garantizar la precisión y confiabilidad de la información en diversos contextos.