Durante anos, os cientistas tentaram criar um sistema capaz de gerar fala sintética a partir da atividade mental, e uma equipe de pesquisadores da Universidade da Califórnia, em São Francisco, finalmente conseguiu. Embora a tecnologia ainda precise de alguns ajustes finos, ela poderia um dia ser usada para restaurar artificialmente as vozes de pessoas que perderam a capacidade de falar como resultado de lesões cerebrais, derrames ou doenças neurodegenerativas, como o mal de Parkinson.
Imagem ilustrativa / Shutterstock
Atualmente, as melhores opções disponíveis para as pessoas com deficiência de fala apenas permitem que elas soletram seus pensamentos letra por letra usando pequenos movimentos musculares para controlar uma interface – como a famosa usada por Stephen Hawking. No entanto, os pesquisadores tem estado ocupados desenvolvendo novos dispositivos que podem detectar o conteúdo linguístico dos pensamentos das pessoas e lê-los em voz alta.
Acontece que esses esforços foram em vão, já que a equipe por trás desse incrível avanço tomou a decisão genial de abandonar essa abordagem e se concentrar na decodificação da atividade cerebral que coordena o movimento da boca e da voz durante a fala.
Essa mudança visionária de abordagem foi inspirada em pesquisas anteriores que revelaram como os centros de fala do cérebro não codificam diretamente sons ou palavras, mas sim coreografam o aparato vocal que produz esses sons.
A equipe “usou” cinco pacientes com epilepsia que já tinham eletrodos implantados em seus cérebros para monitorar a atividade neural em torno de suas convulsões, e observou a comunicação em seus centros de fala enquanto liam frases prontas.
Os autores do estudo explicam como eles decodificaram a atividade cerebral que manobra a língua, os lábios, a mandíbula e a caixa vocal durante a fala. Ao correlacionar esses movimentos com os sons reais produzidos durante a fala, os pesquisadores conseguiram criar uma simulação computacional do trato vocal de cada pessoa.
Quando os padrões de atividade cerebral relacionados à fala são introduzidos no simulador, ele sintetiza os mesmos sons que seriam produzidos pela própria anatomia vocal dessa pessoa.
Como o vídeo revela, o sistema é capaz de gerar fala fluida, embora certos sons não sejam claramente audíveis. O autor do estudo, Josh Chartier, disse em um comunicado que “ainda temos maneiras de imitar perfeitamente a linguagem falada … Somos muito bons em sintetizar sons de fala mais lentos como ‘sh’ e ‘z’, bem como manter os ritmos e entonações de fala e gênero e identidade do falante, mas alguns dos sons mais abruptos como o ‘b’ e ‘p’ ficam um pouco confusos.”
O estudo foi publicado na revista Nature.
Editor-chefe do portal Mistérios do Mundo desde 2011. Adoro viajar, curtir uma boa música e leitura. Ganhou o prêmio influenciador digital na categoria curiosidades.