Los científicos han desarrollado un dispositivo que puede traducir los pensamientos sobre el habla en palabras habladas en tiempo real.
Aunque todavía es experimental, esperan que la interfaz cerebro-computadora algún día pueda ayudar a dar voz a aquellos que no pueden hablar.
Un nuevo estudio describió las pruebas del dispositivo en una mujer de 47 años con cuadriplejia, quien perdió el habla durante 18 años tras un derrame cerebral. Los médicos lo implantaron en su cerebro durante una cirugía como parte de un ensayo clínico.
“Convierte su intención de hablar en oraciones fluidas”, dijo Gopala Anumanchipalli, coautor del estudio publicado el lunes en la revista Nature Neuroscience.
Otras interfaces cerebro-computadora (ICC) para el habla suelen presentar un ligero retraso entre la ideación de frases y la verbalización computarizada. Estos retrasos pueden interrumpir el flujo natural de la conversación, lo que podría provocar problemas de comunicación y frustración, según los investigadores.
Sistema entrenado de transcripción de pensamientos
“Este es un gran avance en nuestro campo”, dijo Jonathan Brumberg, del Laboratorio de Neurociencia Aplicada y del Habla de la Universidad de Kansas, quien no participó en el estudio.
Un equipo en California registró la actividad cerebral de la mujer mediante electrodos mientras pronunciaba frases en silencio. Los científicos utilizaron un sintetizador que construyeron con su voz antes de la lesión para crear el sonido del habla que ella habría pronunciado. Entrenaron un modelo de IA que traduce la actividad neuronal en unidades de sonido.
Funciona de manera similar a los sistemas existentes utilizados para transcribir reuniones o llamadas telefónicas en tiempo real, dijo Anumanchipalli, de la Universidad de California en Berkeley.
El implante se ubica en el centro del habla del cerebro, de modo que escucha, y esas señales se traducen en fragmentos de habla que forman oraciones. Es un «método de transmisión», explicó Anumanchipalli, donde cada fragmento de habla de 80 milisegundos (aproximadamente media sílaba) se envía a una grabadora.
«No se trata de esperar a que termine una frase«, dijo Anumanchipalli. «Se trata de procesarla sobre la marcha».