Robô estuda artigos científicos e propõe inovações tecnológicas

Uma das revistas científicas prestigiosas do mundo, a Nature, acaba de publicar um artigo que retrata a importância da inteligência artificial para os próximos avanços científicos. Pesquisadores do Lawrence Berkeley National Laboratory, na Califórnia, relataram ter desenvolvido um robô chamado Word2Vec, capaz de ler e interpretar conteúdos publicados em revistas especializadas e, a partir deles propor soluções que haviam passado despercebidas.

Um teste bastante desafiador indicou que as previsões do robô são bastante confiáveis e que, quando alimentado com as pesquisas mais recentes, ele pode indicar os caminhos futuros da ciência. Para descobrir se de fato as previsões poderiam ser levadas a sério, os cientistas alimentaram o robô com artigos da área de tecnologia de materiais publicados antes de 2009, como se estivéssemos ainda naquele ano – o objetivo era saber como ele se sairia para prever um futuro que de fato já conhecemos. O resultado foi espetacular: o Word2Vec conseguiu prever, quase que imediatamente, aquilo que os institutos mais renomados do mundo viriam a relatar apenas em 2012, quatro anos depois.

“Nessa correlação entre conteúdos latentes de estudos já publicados estão contidos tesouros que podem moldar as novas tecnologias disruptivas”, diz o especialista em tecnologia Arie Halpern. Ainda segundo Halpern, os potenciais dessa descoberta são imensos e vão ser reconhecidos nos próximos anos: “Quando se desenvolvem sistemas capazes de fazer relações tão complexas, há uma verdadeira explosão nas potencialidades de ligação entre centros de pesquisa em várias partes do mundo, além da reconciliação de dados relevantes de pesquisas feitas no passado recente e que não haviam sido inteiramente exploradas”, completa.

Revistas especializadas e avanço científico          

A publicação de um artigo em revista especializada é o critério universalmente aceito para a validação de uma descoberta. Um experimento só passa a ser tomado como verdadeiro pela comunidade internacional na medida em que é aceito por um grupo de pesquisadores da mesma área, os chamados “pares”, que vão atestar a qualidade daquele resultado. Assim, as revistas científicas revisadas pelos pares em avaliações cegas (sem que se saiba quem é o proponente do artigo e quem são os avaliadores), normalmente editadas por universidades renomadas ou associações de pesquisadores, são o centro de interesse de qualquer área científica. Por isso, há uma verdadeira obsessão para a publicação em revistas reconhecidas e bem qualificadas – e é justamente por conta disso que ocorre uma espécie de efeito colateral indesejável: há muitas publicações e nem tanta gente para lê-las com a devida atenção e tirar delas todas as consequências positivas que se poderia esperar da divulgação de determinada descoberta.

O Word2Vec promete dinamizar a área científica porque consegue identificar e relacionar conhecimentos produzidos por pesquisadores de diferentes instituições – ou mesmo de diferentes lugares do mundo. Em sua primeira missão, o robô foi capacitado para ler e interpretar resumos expandidos de artigos científicos na área de tecnologia de materiais. Para treinar o algoritmo, os pesquisadores avaliaram a linguagem de 3,3 milhões de resumos relacionados à ciência dos materiais, o que resultou num vocabulário de cerca de 500 mil palavras. Eles alimentaram o Word2vec com os resumos, e seu algoritmo então foi capaz de mencionar previsões de possíveis materiais termoelétricos, que convertem calor em energia.

O algoritmo relacionou palavras e criou vetores que ajudaram a identificar as sinergias. Em alguns casos, as palavras estavam ligadas a conceitos termoelétricos, mas os estudos que foram analisados nunca haviam sido descritos e classificados dessa forma, ou seja, haviam sido publicados em áreas correlatas. Portanto, seu potencial no desenvolvimento das tecnologias termoelétricas poderia passar despercebido. Essa lacuna no conhecimento é difícil de identificar pela leitura humana, mas torna-se de fácil detecção para o algoritmo.

Essa nova aplicação de aprendizado de inteligência artificial vai muito além da ciência de materiais, usada como um exemplo de suas potencialidades. O robô poderá facilmente ser alimentado com dados de outras disciplinas que os programadores desejem, aproveitando a massa de conhecimento já disponível e publicada de formas novas e criativas, e dela extraindo resultados inovadores e surpreendentes.