Software realiza leitura labial melhor do que humanos

Software de leitura labial acerta 93,4% das palavras (Imagem de Divulgação)

Software de leitura labial acerta 93,4% das palavras (Imagem de Divulgação)

Pesquisadores do Departamento de Ciência da Computação da Universidade de Oxford, no Reino Unido, desenvolveram um novo software de leitura labial que reconhece as palavras faladas com mais precisão do que os seres humanos, segundo o portal Mashable.

Chamado de LipNet, o software não é o primeiro a tentar compreender movimentos labiais, mas até o momento ele é o dispositivo com maior precisão, com 93,4% de acertos, ante 79,6% de outros softwares. Um ser humano consegue chegar a 52% de acertos. O índice maior se deve mais à técnica utilizada pelos cientistas do que à tecnologia. Ao invés de o computador ser colocado para decifrar as palavras individualmente, ele foi programado para identificar frases inteiras.

O portal The Verge explica que o desenvolvimento desse tipo de software só foi possível com a ajuda das técnicas de deep learning (“aprendizado profundo”, em inglês). Isso significa que ele é capaz de aprender com os dados coletados e melhorar sozinho sua própria compreensão das leituras realizadas.

“Estudos mostraram que o desempenho da leitura labial humana melhora para palavras longas, indicando a importância de recursos de captura de contexto temporal em um canal de comunicação ambígua. Motivados por essa observação, apresentamos o LipNet, um modelo que mapeia uma sequência de comprimento variável de quadros de vídeo em texto, usando circunvoluções espaçotemporais, uma rede recorrente neural LSTM, e treinada inteiramente de ponta a ponta”, afirmaram os cientistas em publicação oficial.


Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *