A IA vai revisar a bibliografia por nós?
A nova máquina de síntese e o velho problema do método.
A nova geração de modelos de linguagem (LLMs) promete acelerar as nossas revisões de literatura. Só que velocidade é diferente de rigor.
O computador HAL 9000 (do filme de Stanley Kubrick, ‘2001: A Space Odyssey’, 1968).
Um espectro ronda a vida acadêmica
Nunca se publicou tanto, nunca foi tão fácil localizar textos, baixar PDFs, consultar bases de indexação (Scopus, Web of Science etc.), pedir resumos automáticos para as IAs, e o diabo. E, justamente por isso, nunca foi tão difícil ter um bom conhecimento sobre o próprio campo.
Aprendi a fazer pesquisa fazendo revisão de literatura. Minha iniciação científica (há 40 anos atrás) foi isso: biblioteca “física”, pilhas de fotocópias, fichamentos à mão e a experiência de arriscar encontrar um fio condutor entre textos que falavam (literalmente) línguas diferentes: inglês, francês, espanhol, português e italiano. Como ninguém me ensinou, aprendi por tentativa e erro (muito mais erro, obviamente).
Depois veio a Internet nas universidades (1995) e, pouco a pouco, o problema não era mais encontrar textos, mas sim saber quais eram os importantes a serem lidos. Depois veio o Portal de Periódicos da CAPES (2000) e quem soube usá-lo teve acesso a uma biblioteca que a maioria dos pesquisadores brasileiros jamais poderia ter imaginado. Coisa de ficção científica, à época. E em 2011 Alexandra Elbakyan, pesquisadora do Cazaquistão, fundou o Sci-Hub para contornar barreiras de pagamento (paywalls) dos absurdos valores cobrados por artigos por grandes editoras científicas.
Nos anos 2010 estudei e ensinei a fazer revisão sistemática, integrativa, de escopo, o que exigiu muito autodidatismo para aprender suas regras, critérios de inclusão e exclusão, fluxogramas PRISMA e a lógica própria de construção do corpus bibliográfico de cada uma delas. Orientei quase uma dezena de trabalhos com esses métodos, supliciando os orientados de gaduação, mestrado e doutorado com esses procedimentos altamente “burocráticos”.
Pois bem: e agora, será que nós seremos substituídos por máquinas de fazer revisão bibliográfica? Este texto é um resumo comentado do artigo:
· Wagner, G., Prester, J., Mousavi, R., Lukyanenko, R., & Paré, G. (2026). Generative Artificial Intelligence for Literature Reviews. Journal of Information Technology. https://doi.org/10.1177/02683962261425675
O artigo é um “methodological perspective paper”, ou seja, um artigo conceitual que discute um problema emergente, propondo interpretações e uma nova agenda de pesquisa, mais do que apresentar resultados empíricos originais.
Nunca se publicou tanto, nunca se leu tão pouco
O artigo que eu sintetizo com grande liberdade aqui, de Wagner e colaboradores (um alemão, um australiano, dois americanos e um canadense), começa justamente por esse ponto. A ciência produz hoje um volume de artigos que ultrapassa, em muito, a capacidade humana de leitura, compreensão e síntese. A IA generativa apareceria então, nesse contexto, como complicação e como solução: ela aumenta ainda mais a produção de artigos científicos, mas também poderia ajudar a organizar o excesso que ela mesma contribui para ampliar (numa visão bem otimista).
O interesse então desse artigo (“Inteligência artificial generativa para revisões de literatura”) está menos em perguntar se o uso de IA é bom ou ruim e mais em formular uma questão mais interessante e mais prática: em quais etapas de uma revisão de literatura essas ferramentas ajudam de fato, e em quais ainda são ruins demais para merecer a nossa fé?
O Mobot, criação dos Laboratórios Eletrônicos da Hughes Aircraft, demonstrou suas capacidades ajudando uma modelo em sua rotina de beleza, em 1961. JR Eyerman/Coleção de Imagens LIFE/Shutterstock. Foto colorizada pelo ChatGPT.
IA tradicional e a IA generativa
Os autores fazem uma distinção útil e didática entre a IA tradicional e a IA generativa para leigos.
A IA tradicional olha para os dados e responde a perguntas do tipo “isso é x ou y?”. Um filtro de spam que decide se um e-mail é lixo ou não e um algoritmo que classifica artigos como relevantes ou irrelevantes em uma busca a partir de uma palavra-chave são IA do tipo “tradicional”. Ela reconhece padrões, separa, prevê, mas não produz nada de novo.
A IA “generativa” (esse anglicismo besta) gera texto, código ou imagem a partir do material com que foi treinada.
Para a pesquisa científica, essa diferença é fundamental. A IA tradicional podia ajudar a organizar referências ou identificar duplicatas. Já a IA generativa pode rascunhar uma síntese da literatura sobre um tópico qualquer que você pedir, sugerir hipóteses, comparar argumentos entre autores, propor uma estratégia (string) mais eficiente de busca etc. Ou seja, ela passa a interferir em tarefas que antes eram exclusivamente nossas.
Esse fato é bem importante porque a ferramenta deixa de ser um estafeta meramente classificador e passa a interferir em nosso raciocínio , que envolve formular suposições, propor caminhos para a investigação, resumir os debates na área, comparar argumentos presentes nos textos etc.
Mas mesmo em um ambiente onde esses sistemas são capazes de processar imagem, áudio e vídeo, ocorre que o conhecimento científico está (até agora) codificado em artigos escritos. Por isso, a questão não é se os modelos hoje (em março de 2026) entendem outras linguagens além do texto (Youtube, dancinha no TikTok etc.). A questão fundamental é se essas geringonças conseguem lidar direito com busca, leitura, extração de informação e síntese competente de textos acadêmicos complexos.
A ferramenta não é burra, mas o uso sem método é
Um dos pontos fundamentais para os iniciantes na matéria e que vale a pena sempre repisar é o seguinte: o resultado não depende só de qual ferramenta você usa, mas de como você pede as coisas para ela.
A mesma IA dá respostas muito diferentes dependendo de como a pergunta é formulada. Perguntas vagas geram respostas vagas. Já exemplos concretos ajudam o modelo a entender o que você quer. Instruções por etapas produzem raciocínio mais coerente e consistente e fornecer os textos reduz a chance da IA inventar referências que não existem, o que acontece inclusive com os modelos mais recentes. A virada de fevereiro de 2026 (Google, Anthropic, OpenAI lançaram atualizações importantes) não mudou isso. A IA continua sendo tão boa quanto a pergunta que ela recebe.
Logo, é preciso, urgentemente, deslocar o debate da fantasia de uma máquina autônoma todo-poderosa para o desenho de procedimentos eficazes e bem informados por..., vejam só, humanos. Se me é premitido uma frase epigramática: a IA não substitui o método, ela exige mais método.
Robô “Maria”, autômato criado para imitar a protagonista humana e manipular as massas operárias, em cena de ‘Metropolis’ (Fritz Lang, 1927).
Anote o que a máquina faz bem
Segundo Wagner et al. (2026), a etapa em que a IA generativa parece mais útil é a formulação inicial do problema de pesquisa.
Ela pode ajudar a localizar revisões já existentes sobre um tema, identificar conceitos recorrentes, perceber dispersões terminológicas (fundamental em ciências sociais, onde chamamos a mesma coisa por 15 nomes diferentes) e avaliar se há espaço para uma nova contribuição, isto é, a sua contribuição.
Isso é importante porque o início de uma pesquisa é, em geral, a fase mais desorganizada de todas. Há excesso de informação (dê um Google aí no seu tema), pouca hierarquia entre as ideias (idem) e muita incerteza sobre por onde entrar na imensa literatura publicada. Nessa fase, uma boa ferramenta de síntese pode poupar nosso tempo. Há, entretanto, uma condição: a IA precisa trabalhar com textos completos, não apenas com títulos e resumos. E já sabemos que quanto maior o texto ou mais complexo, mais a IA compreende o começo e menos o final dele.
Na busca da bibliografia, a IA pode ajudar a encontrar sinônimos, variações terminológicas e palavras equivalentes em diferentes idiomas para o seu conceito-chave, o que é fundamental para montar estratégias de busca mais compreensivas em bases com milhões de artigos tipo Scopus.
Imagine uma busca sobre ‘representação política de minorias no parlamento’. Em português, você partiria de termos como “minorias políticas”, “diversidade parlamentar” ou “sub-representação”. Mas a literatura relevante está majoritariamente em inglês, e ali os termos canônicos são descriptive representation, minority representation, legislative diversity e underrepresentation, além de variantes como political inclusion, marginalized groups in parliament ou diversity in legislatures. Uma busca restrita aos termos em português, ou mesmo aos termos em inglês mais óbvios, deixaria de fora boa parte do que foi publicado. A IA consegue mapear esse campo semântico com rapidez, sugerindo equivalentes, variantes e expressões que aparecem em diferentes tradições nacionais de pesquisa, o que antes exigia muito conhecimento acumulado da literatura por você ou consulta ao(à) orientador(a).
Existem ferramentas mais especializadas, como Consensus e Elicit, que combinam IA com bases acadêmicas e reduzem o problema das “alucinações” (inventam menos referências). Mas nenhuma delas substitui uma busca séria no Web of Science. IAs lêem bem o que está disponível de graça na internet, mas o que está atrás de paywall, o que foi publicado há pouco tempo e o que nunca foi publicado (a “literatura cinza”, que inclui relatórios, teses e working papers) ela ainda não alcança. E justamente esse material que some do nosso radar costuma ser decisivo para quem quer fazer uma revisão sistemática ou de escopo de verdade.
Na extração de dados estruturados, que consiste em retirar automaticamente dos artigos informações sobre tamanhos amostrais, métodos utilizados e resultados quantitativos, o desempenho dessas máquinas foi muito bom. Isso significa economia de tempo e esforço quando se precisa extrair de um conjunto de 130 estudos sobre comportamento legislativo o número de deputados analisados, o período coberto pelas análises, as técnicas estatísticas utilizadas e a direção do efeito encontrado.
Em testes relatados no artigo, o GPT-4o e Gemini 1.5 extraíram corretamente os dados de 4 de 5 tabelas e só o Claude acertou 5 de 5. Para meta-análises, que dependem exatamente desse tipo de extração em grande escala, a nova tecnologia portanto oferece um ganho efetivo. A geração de código estatístico também é promissora para aliviar nossa vida: o Claude 3.5 Sonnet produziu um código para uma meta-análise sem erros na primeira tentativa (mas o GPT-4o e Gemini precisaram de correções).
Gort, robô alienígena enviado à Terra em ‘The Day the Earth Stood Still’ (Robert Wise, 1951).
O que a máquina promete e não entrega direito
· Triagem
Depois de encontrar os artigos, é preciso decidir quais ficam e quais saem. É aqui que a IA ainda tropeça. O problema não é a velocidade, rápida ela é, é a confiabilidade. Um artigo excluído por engano pode comprometer toda a revisão da literatura e os modelos testados pelos autores erraram a ponto de deixar preocupados os mais entusiastas de IA. Em termos técnicos: os sistemas testados recuperavam bem alguns conjuntos de textos e mal outros, sem consistência. Para uma tarefa em que errar para menos é pior do que errar para mais, isso é um baita problema.
· Qualidade
O desempenho da IA não segue um padrão claro e uniforme. Ela acerta coisas difíceis e erra coisas simples, às vezes no mesmo artigo. Extrai dados de uma tabela complexa sem erro e não consegue dizer qual é a posição teórica da autora no artigo. Wagner et al. (2026) chamam isso, seguindo um working paper da Harvard Business School de Dell’Acqua et al. (2023), de “fronteira irregular” (jagged frontier). Ou seja, não há um grau de competência previsível e sim avanços por solavancos. Para quem vai usar esse tipo de ferramenta, isso significa uma coisa bem prática: não dá para confiar no novo resultado daquilo que você pediu só porque os anteriores foram bons.
· Interpretação
Quando é para pensar de verdade, isto é, questionar conceitos, confrontar tradições teóricas, identificar o que um campo ainda não conseguiu perguntar direito, a IA não é tudo isso (até aqui pelo menos). Ela pode ajudar a organizar o material, mas a síntese que importa, aquela que produz conhecimento novo, continua sendo dependente de trabalho humano. E isso não por limitação técnica, mas pela própria natureza da tarefa: é preciso interpretar, atribuir valor, sentido, significado aos textos.
Quem ganha mais com a IA? Não é você, gafanhoto
A parte final do artigo de Wagner et al. (2026) é a mais excitante (no limite do emprego deste termo para esse tipo de assunto), porque sai do modo “manual de uso de IA” e entra em uma questão de fundo: quem se beneficia mais da IA quando usada para revisões de literatura?
Provavelmente, os(as) pesquisadores(as) mais experientes.
Quem já conhece bem o campo científico consegue auditar, ajustar e corrigir as “entregas” da máquina, distinguir atalhos que cortam caminho e economizam tempo de respostas enganosas (só porque são coerentes) e pode, assim, usar a IA para se aprofundar nos assuntos.
Já quem ainda está aprendendo corre mais risco de engolir respostas plausíveis por respostas corretas. Os fortes ficam mais fortes, em suma. E os iniciantes na área da pesquisa tornam mais velozes, mas não necessariamente correm para o lugar certo.
A IA lê. Mas que tipo de leitor/escritor nós seremos?
Wagner et al. (2026) não vendem a fantasia de uma literatura revisada automaticamente por máquinas. Tampouco caem no ludismo, tão típico de alguns praticantes das Humanidades. O que eles propõem é que a IA generativa pode funcionar como “copiloto” em certas etapas do processo, desde que o camarada conheça o método de revisão muito bem, controle o corpus da literatura a ser revisada, confira os resultados e declare com transparência o que foi feito com a ajuda dessas ferramentas.
Em suma, o que os modelos atuais (março de 2026) de Inteligência Artificial Generativa conseguem fazer?
· Mapear o terreno inicial: as IAs respondem razoavelmente bem “o que já existe sobre esse tema?” quando você fornece os textos da revisão;
· Montar a estratégia de busca: elas controlam variações lexicais e sugerem sinônimos equivalentes em outros idiomas dos termos-chave da pesquisa. É um trabalho chato, e muito útil, que ela faz bem e rápido;
· Extrair dados de artigos: elas mapeiam o tamanho da amostra, o método usado e os resultados encontrados nos textos a serem revisados, ou seja, elas lêem bem tabelas que dariam muito trabalho se tudo fosse feito à mão;
· Escrever códigos: rodar meta-análises, visualizações de dados, modelos estatísticos etc., tudo isso funciona em geral de primeira.
Em resumo, há cinco conclusões a se tirar:
· A IA ajuda muito em algumas tarefas e quase nada em outras. Não existe (ainda) um botão de “fazer revisão”. A utilidade da IA varia: é alta em extração de dados e código, é ainda muito fraca em sínteses interpretativas.
· Quem não sabe fazer revisão não vai aprender com a IA. Vai apenas errar mais rápido e com mais confiança. A IA não substitui o método, ao contrário, ela exige mais método. Pesquisadores(as) sem domínio metodológico de revisões vão ser tapeados pela ferramenta com mais eficiência, só isso.
· Nossa inteligência continua funcionando. Revisões que exigem interpretação profunda, tais como revisões teóricas, críticas e metanarrativas, ainda dependem de cabeça humana. A máquina não chegou lá.
· A IA beneficia mais quem já sabe mais. Para quem ainda está aprendendo a fazer revisão bibliográfica, a IA pode ser uma armadilha e não um (bom) atalho. As IAs tendem, como ocorre com a maioria das tecnologias, a ampliar as desigualdades: pesquisadores(as) experientes usam essas ferramentas como uma espécie de acelerador do serviço, já os iniciantes tendem a comprar gato por lebre.
Para terminar, traduzi a Tabela 13 do artigo (p. 15). Ela tenta responder à seguinte pergunta: em quais tipos de revisão de literatura a inteligência artificial pode ajudar muito, pouco ou quase nada?
Os autores organizaram a resposta comparando tipos de revisão com quatro cenários possíveis de impacto da IA.
A principal virtude do artigo dos caras é reposicionar a discussão. O nosso foco não deveria ser, acho eu, a “automação da inteligência”. O tema que poderíamos porventura discutir é o da reorganização do trabalho intelectual sob as novas condições técnicas (nós dizíamos antigamente: ‘diante do avanço das forças produtivas’).
A questão, portanto, não é se a IA vai ler os milhares de artigos por nós. Ela já lê, de alguma forma, muita coisa. A questão é que tipo de escritor(a) ela permitirá que continuemos sendo.
If any images used in this publication are subject to copyright restrictions, please contact me immediately and I will remove them promptly.
Caso alguma das imagens utilizadas nesta publicação esteja protegida por direitos autorais, solicito que me contactem imediatamente para que eu proceda à sua remoção.






muito oportuno. grato!
Muito bom. Obrigada.