Análise de correspondência: Emannuel Macron + Paulo Guedes ÷ 2
Por que médias estatísticas criam elites fictícias (2 de 3)
Série metodologia
A Sociologia Política das elites é sem dúvida um dos terrenos mais exigentes e ingratos para a estatística social. Ingrato porque estudamos populações pequenas, altamente heterogêneas e profundamente relacionais (isto é, cujas propriedades só adquirem sentido umas em relação às outras). Exigente porque qualquer abordagem metodológica que ignore essas características corre o risco de produzir resultados formalmente corretos, mas sociologicamente banais.
É precisamente nesse domínio que a oposição entre, de um lado, abordagens que perseguem efeitos causais de variáveis isoladas e, de outro, abordagens que mapeiam espaços sociais, tal como a Análise Geométrica de Dados (AGD), revela sua importância analítica para a compreensão da estrutura do poder.
French President Emmanuel Macron at the Davos forum. Photo: REUTERS/Denis Balibouse
Elites como problema estrutural, não como problema de inferência
Um erro recorrente em estudos quantitativos de elites consiste em tratar o acesso a posições de poder como um “desfecho” individual explicado por um conjunto de covariáveis.
A pergunta típica é: quais fatores aumentam a probabilidade de um indivíduo ocupar uma posição de elite? Variantes delas normalmente incluem: qual o efeito da origem social no acesso a cargos legislativos? Como a formação escolar impacta a progressão na carreira diplomática? Que peso tem o capital político familiar na eleição para o Congresso?
Essas formulações já contêm o problema dessa abordagem, pois elas supõem:
1. que indivíduos sejam unidades intercambiáveis ou, no mínimo, equivalentes depois dos devidos ajustes estatísticos;
2. que atributos relevantes possam ser tratados como variáveis separáveis, que se somam (X₁ + X₂ → Y) ou se multiplicam (X₁ × X₂ → Z (interações)) de forma previsível;
3. que o fenômeno “elite” seja capturável por um desfecho dicotômico (elite/não-elite) ou ordinal, isto é, por níveis hierárquicos de poder (cargos baixos, médios, altos).
Dificilmente essas suposições se sustentam empiricamente quando examinamos trajetórias concretas.
Elites são, por definição, configurações posicionais. Não existem “indivíduos de elite” em abstrato. Existem posições de elite em domínios específicos – por exemplo, no campo político, no campo burocrático, no campo econômico, no campo acadêmico etc. –, ocupadas por agentes cujas propriedades fazem sentido apenas relacionalmente, isto é, em oposição a outras posições e em articulação com outros recursos.
O bacharel em filosofia que se torna ministro da Economia e Indústria aos 36 anos após cursar filosofia em Nanterre, matricular-se na linda Sciences Po em Paris e continuar seus estudos na ENA (École Nationale d’Administration; hoje Institut national du service public), passar pela Inspeção Geral de Finanças, o corpo administrativo mais prestigioso da elite burocrática francesa, e em seguida por um grande banco multinacional de investimentos, não ocupa a mesma posição “estrutural” que o economista-empresário que assume a pasta econômica aos 69 anos após ter-se doutorado na Universidade de Chicago aos 29 anos, ter sido professor de economia na PUC-Rio, estagiado no Chile de Pinochet e feito uma carreira milionária no setor financeiro privado como dono de banco.
Ambos foram ministros da Economia, só que pertencem a “circuitos de poder” estruturalmente distintos, com lógicas próprias de legitimação, redes de relações e perspectivas específicas de conversão dos recursos acumulados ao longo das trajetórias.
Macron representa o circuito tecnocrático-estatal francês (grandes écoles → grands corps → alta burocracia → política), com breve passagem pelo setor privado como ponte improvável entre a elite educacional e o Partido Socialista. Paulo Guedes representa o circuito financista brasileiro (universidade pública conceituada → doutorado em Chicago → mercado financeiro → acumulação econômica → entrada tardia na política como “técnico” fora do mundo político) com capital econômico privado como recurso principal de legitimação.
Tratar essas trajetórias como variações de uma mesma variável dependente (“ser ministro”) controlando por “origem social” e “formação escolar” é desfigurar, você concordaria, completamente o objeto. A regressão pode estimar coeficientes, mas esses coeficientes agregam o que deveria ser diferenciado desde logo.
Prosopografia: da acumulação de atributos à construção dos espaços sociais
A prosopografia (método de análise de biografias coletivas) é o método privilegiado para enfrentar esse problema. A estratégia básica é: a) coletar sistematicamente atributos biográficos de uma população definida (por exemplo, todos os ministros de Estado de um país entre 1985 e 2020); e b) identificar padrões nas trajetórias dos indivíduos.
Mas a eficácia analítica da prosopografia depende do tratamento estatístico dessas trajetórias.
A simples acumulação de atributos biográficos, como origem social, formação escolar, profissão inicial, carreira política, vínculos institucionais e redes de parentesco não produz uma “estrutura”. No máximo, produz listas descritivas ou tabelas de frequência que informam que 85% dos ministros têm diploma universitário, 40% passaram pelo setor público antes da nomeação e apenas 25% têm pais com carreiras políticas, por exemplo.
Essas estatísticas descritivas são úteis, informativas, mas totalmente insuficientes. Elas não revelam como esses atributos se combinam para formar perfis típicos, nem como esses perfis se opõem uns aos outros na estruturação do campo do poder.
O salto analítico ocorre quando essas propriedades são tratadas como elementos de uma configuração relacional, e não como variáveis independentes cujos efeitos se somam ou se multiplicam.
É aqui que entra a Análise Geométrica de Dados que tratamos no post 1 desta série, pois ela foi concebida justamente para esse tipo de problema: reconstruir espaços sociais mostrando como origem, formação, carreira e redes de relações (atributos biográficos) se articulam e se organizam em padrões estruturados.
Ao aplicar Análise de Correspondência Múltipla (ACM) a dados prosopográficos de elite, o objetivo não é estimar efeitos de variável X (independente) sobre a variável Y (dependente), mas reconstruir empiricamente o espaço das posições dominantes.
Cada indivíduo é representado como um ponto em um espaço multidimensional 2D, 3D etc. Cada trajetória é uma combinação específica de modalidades (“Direito + universidade pública + carreira parlamentar + origem regional interiorana” versus “Economia + mestrado no exterior + consultoria privada + origem metropolitana de classe alta”). Cada eixo fatorial que emerge da análise é um princípio de diferenciação estrutural que organiza as oposições fundamentais do campo.
O primeiro eixo pode revelar, por exemplo, uma oposição entre capital herdado (familiar, político, econômico) e capital escolar adquirido (formação de elite, credenciais internacionais, expertise técnica).
O segundo eixo pode opor trajetórias centradas no setor público (burocracia de Estado, carreiras administrativas, vínculos com o aparato estatal) versus trajetórias centradas no setor privado (empresas exportadoras, mercado financeiro, consultorias etc.). Essas oposições não são impostas pelo analista a partir de suas hipóteses prévias, mas emergem da “geometria dos dados”, isto é, da forma como atributos se agrupam ou se distanciam quando representados graficamente.
Sampugnaro, R., & Montemagno, F. (2021). In Search of the Americanization: Candidates and Political Campaigns in European General Election. Journal of Political Marketing, 20(1), 34–49. https://doi.org/10.1080/15377857.2020.1869832
O artigo examina se as campanhas eleitorais europeias em 20 países convergiram para um modelo “americanizado”, marcado por personalização, consultores profissionais e digitalização. A figura agrupa países conforme a semelhança de suas campanhas eleitorais. À esquerda estão campanhas mais fracas e menos profissionalizadas; à direita, campanhas mais intensas, personalizadas e organizadas.
O problema conceitual da regressão em estudos de elites
A regressão, mesmo em suas versões mais sofisticadas (logística multinível, modelos de eventos raros (rare events logit, survival analysis para progressão de carreira, modelos de escolha discreta etc.), enfrenta um problema insolúvel quando aplicada a estudos de elites: ela separa em variáveis independentes objetos que só fazem sentido como conjuntos articulados.
Considere comigo a variável “formação escolar”.
Em um modelo de regressão, ela aparece como um preditor com efeito estimável: β₁ para Direito, β₂ para Economia, β₃ para Engenharia, tomando Ciências Sociais como categoria de referência. O modelo estima quanto cada formação aumenta ou diminui a probabilidade de acesso a cargos de elite, controlando por outras variáveis. Uma hipótese típica seria: “formação em Direito aumenta em x% as chances de acesso a cargos ministeriais de prestígio” ou “doutorado em Economia tem efeito positivo significativo sobre nomeação para o Banco Central” (simplifico para efeito didático).
Mas, no universo das elites, a formação escolar nunca atua isoladamente.
Um diploma em Direito obtido na Faculdade de Direito do Largo São Francisco (USP), por um indivíduo de família tradicional do interior paulista, com passagem pela política estudantil e ingresso precoce em um partido de centro-direita, pertence a um “circuito de reprodução das elites” políticas tradicionais completamente distinto de um doutorado em Economia obtido na University of Chicago, por um indivíduo de família de classe média urbana sem vínculos políticos prévios, com carreira em organismos internacionais (FMI, Banco Mundial) antes do retorno ao Brasil para assumir cargos no Banco Central.
A regressão pode vir a tratar essas formações como variações de uma mesma variável, estimando um coeficiente médio para “Direito” e outro para “Economia”. A Análise Geométrica de Dados mostra que se trata de posições distintas em espaços distintos do campo do poder.
Logo, não faz sentido estatístico agregar essas trajetórias e estimar um “efeito médio” de formação, porque esse efeito varia radicalmente conforme a configuração na qual a formação escolar está inserida.
E pior: o coeficiente médio não apenas empobrece a análise. Ele mistura estruturas heterogêneas, produzindo um artefato estatístico sem correspondência sociológica. É como calcular a “temperatura média” entre um freezer e um forno e concluir que o ambiente está ameno...
Um exemplo formal: o problema da heterogeneidade estrutural
Do ponto de vista estatístico, o problema pode ser descrito tecnicamente como “heterogeneidade estrutural não observável”, isto é, trajetórias de elite que pertencem a subespaços distintos, cada um com lógicas próprias de acumulação e conversão de capitais, não a uma única distribuição populacional.
Em termos econométricos, isso viola o pressuposto de homogeneidade condicional: mesmo controlando por origem social, formação e experiência, os subgrupos permanecem estruturalmente diferentes de forma que modelos de regressão não conseguem representar.
Modelos de regressão tentam lidar com isso de três maneiras:
1. Interações: incluir termos como Direito × Origem_Elite ou Economia × Setor_Público para capturar efeitos condicionais.
O problema conhecido aqui é que o número de interações possíveis cresce exponencialmente e a interpretação torna-se impraticável.
2. Efeitos aleatórios: usar modelos multinível que tratam a heterogeneidade como variação aleatória entre subgrupos.
O problema é que a heterogeneidade relevante não é “erro estatístico” a ser controlado, mas o próprio fenômeno a ser estudado.
3. Estratificação ex post: dividir a amostra em subgrupos (por exemplo, elites políticas versus burocráticas versus empresariais) e rodar modelos separados.
O problema aqui é que a divisão é feita a priori, imposta pelo analista, e não emerge dos dados.
Essas soluções são paliativas porque tratam como “heterogeneidade residual” aquilo que é, na verdade, a estrutura constitutiva do próprio objeto.
A Análise Geométrica de Dados resolve o problema não por modelagem adicional, mas mudando o objetivo da análise. Em vez de controlar estatisticamente diferenças entre grupos, ela as transforma no próprio fenômeno sociológico a ser descrito. O objetivo não é estimar um efeito médio populacional, mas reconstruir a estrutura do espaço no qual diferentes tipos de elites ocupam posições diferenciadas.
Macron + Guedes ÷ 2 = o ministro que não existe
Emmanuel Macron e Paulo Guedes foram ambos “ministros da Economia”. Mas somar essas duas trajetórias e dividi-las por dois produz uma ficção estatística, não um “perfil médio de ministro”.
O circuito tecnocrático-estatal francês e o circuito financeiro-empresarial brasileiro são estruturas distintas de acesso ao poder, com lógicas próprias de legitimação e possibilidades específicas de conversão de recursos. Agregá-los em um efeito médio da formação em Economia é a própria destruição do objeto sociológico que se quer explicar.
A regressão pode estimar que “formação em Economia aumenta em X% as chances de acesso a cargos ministeriais”. Mas esse X% é média aritmética de processos heterogêneos que não corresponde a nenhuma trajetória concreta. É a temperatura média entre o freezer e o forno.
Elites não são médias de atributos identificáveis. São posições relacionais em um espaço social.
(continua...)



Crítica interessante. Teria que pensar mais para saber se concordo ou não. Bem provocativo. Muito bom.
De todo modo, se tudo é tão relacional, parece-me que a técnica adequada é análise de redes, não regressão.
Outra provocação muito interessante.
Entendo que há uma questão distinta sendo tratada aqui e novamente volto para a questão da mensuração: qual seria o objetivo da análise das elites? Identificar o efeito de uma variável específica (estudar em Chicago, ceteris paribus) ou uma variável estrutural (pertencer a elite financista-empresarial)? Perguntas diferentes levam a estratégias metodológicas distintas.
Realmente faz pouco sentindo comparar especificamente o E.Macron com o PG, ainda mais se o objetivo for entender as diferentes trajetórias estruturais das elites contemporâneas. Mas aqui entendo que esta é mais uma questão mal formulada do que um problema de ontologia metodológica.
Pareceu-me que, outra vez, a AGD serve como um instrumento de mensuração mais potente para relações causais complexas. O dilema nos estudos sobre elites é que estes modelos mais estruturais requerem uma quantidade maior de dados para funcionar melhor, o que é justamente o oposto do que ocorre em estudos sobre as elites.