Análise de correspondência: elites, prosopografia e a Análise Geométrica de Dados
Por que elites são configurações posicionais, não probabilidades condicionais (3 de 3)
Série metodologia
Tipologias emergem da geometria, não da teoria
Um dos ganhos centrais da Análise Geométrica de Dados (AGD) nos estudos de elites é a produção de tipologias empíricas indutivas (construídas a partir dos dados, não deduzidas da teoria). Essas tipologias não são construídas a priori com base em critérios teóricos, nem impostas por decisões analíticas arbitrárias. Elas emergem da geometria dos dados, isto é, da forma como propriedades biográficas se organizam espacialmente, revelando proximidades e oposições.
No estudo clássico do patronato francês, conduzido por Pierre Bourdieu e Monique de Saint-Martin e publicado em Actes de la Recherche en Sciences Sociales (1978), os autores coletaram dados prosopográficos sobre 216 presidentes (“PDGs”) das maiores empresas francesas em 1972: origem social familiar, trajetórias escolares (lycées de elite, grandes écoles), carreiras profissionais, participação em conselhos administrativos, condecorações estatais (Légion d’Honneur), clubes sociais.
Bernard Arnault, dirigente do maior grupo de luxo do mundo, a LVMH. Fonte: lunion.fr
A ACM revelou uma estrutura relacional bidimensional do campo do poder econômico francês.
O primeiro eixo opõe dois modos de acumulação e reprodução do capital dominante: de um lado, o capital econômico-patrimonial, associado a herdeiros de famílias proprietárias, à sucessão em empresas familiares e a trajetórias de escolarização curta ou juridicamente tradicional; de outro, o capital escolar-institucional, característico de agentes oriundos sobretudo das classes médias e das frações dominadas da classe dominante, cuja ascensão se apoia na posse de títulos escolares consagrados (grandes écoles) e na conversão meritocrática do capital escolar em posições de direção.
O segundo eixo distingue as modalidades de inserção no campo do poder, opondo trajetórias marcadas pela proximidade estrutural com o Estado (formação em instituições como ENA ou Polytechnique e passagem pelos grands corps de l’État (Inspeção de Finanças, Corps des Mines e demais carreiras administrativas altamente seletivas donas de forte poder institucional) às trajetórias estritamente privadas, construídas inteiramente no interior do mundo empresarial, sem trânsito significativo pelo setor público.
Essas oposições não eram hipóteses no sentido inferencial a serem testadas, mas estruturas objetivas a serem reconstruídas e interpretadas. Elas não resultavam de escolhas do pesquisador sobre “quais variáveis incluir no modelo”, mas da análise sistemática de como propriedades biográficas efetivamente se combinam no espaço empírico do patronato francês.
Esse ponto é crucial: a AGD produz o objeto empírico. Ela o torna visível, mapeável, interpretável. A regressão apenas o assume como dado, sem jamais demonstrar que a estrutura pressuposta pelo modelo corresponde à estrutura efetiva dos dados.
Elites políticas e circuitos de recrutamento
No estudo de elites políticas, a diferença entre as duas abordagens estatísticas se torna mais evidente.
Estudos convencionais aplicam modelos logísticos para identificar “determinantes do sucesso político”: experiência em cargos eletivos prévios, recursos econômicos de campanha, filiação a partidos competitivos, visibilidade midiática, vínculos com grupos organizados da sociedade (sindicatos, associações patronais etc.).
O modelo estima coeficientes: experiência política prévia aumenta as chances em X%, cada milhão em gastos de campanha aumenta em Y%, filiação ao partido majoritário aumenta em Z%. Esses resultados podem ser estatisticamente significativos e úteis em termos preditivos. Mas não revelam como o campo político está estruturado.
A AGD revela algo mais fundamental: “circuitos” estruturados de recrutamento político.
Aplicando Análise de Correspondência Múltipla a dados prosopográficos de parlamentares, ministros ou prefeitos de capitais, emergem configurações bem diferentes que correspondem a “circuitos” específicos:
a) aristocrático-partidário: sobrenome político tradicional, origem regional em redutos eleitorais históricos, formação em Direito em universidades públicas, carreira inteiramente parlamentar desde a vereança, vínculos com partidos de centro (PSDB, MDB), capital político herdado;
b) tecnocrático-estatal: origem em classes médias urbanas, formação em Economia ou Administração Pública, pós-graduação no exterior (mestrado/doutorado em universidades americanas), carreira inicial em burocracia federal (Banco Central, Ministério da Fazenda, BNDES), entrada tardia na política por nomeação técnica (secretário de Estado), vínculos fracos com partidos;
c) empresarial-convertido: origem em famílias proprietárias, formação em Engenharia ou Administração de Empresas, carreira em firmas familiares ou grandes corporações multinacionais, entrada na política após consolidação da posição econômica, uso de capital econômico como recurso eleitoral, vínculos com partidos de direita liberal; e
d) midiático-populista: origem nas classes médias baixas, formação escolar não superior ou em áreas de comunicação em universidades privadas de pouco prestígio, carreira em mídia (rádio, TV, internet) ou entretenimento, entrada na política via notoriedade midiática, vínculos ideológicos difusos (“nem de esquerda, nem de direita”) ou anti-establishment.
Esses circuitos não são categorias analíticas arbitrárias impostas pelo pesquisador. Eles emergem da combinação sistemática de propriedades biográficas e institucionais revelada pela ACM.
Aqui, cada circuito representa um modo estruturalmente distinto de acesso ao poder, com suas próprias lógicas de legitimação, bases sociais de sustentação e possibilidades de conversão futura dos recursos políticos acumulados.
Uma regressão pode estimar o efeito da experiência política dentro de um circuito (por exemplo, entre políticos do circuito aristocrático-partidário, cada mandato adicional aumenta as chances de chegar ao Senado). Mas ela é incapaz de mostrar que os circuitos existem como estruturas objetivas do campo político, e que o “efeito” da experiência, dos cargos acumulados ou do prestígio institucional varia radicalmente de um circuito a outro.
Elites burocráticas e o mito do “efeito da educação”
O mesmo problema aparece, só que de forma mais aguda, nos estudos sobre elites burocráticas.
A análise de regressão insiste em estimar o impacto da escolaridade sobre a progressão funcional ou a probabilidade de ocupação de cargos de direção (DAS 5 e 6 no caso brasileiro, Senior Executive Service (SES) nos EUA, diretores-gerais na União Europeia etc.).
Os modelos mais típicos aqui incluem escolaridade (graduação/mestrado/doutorado), área de formação, prestígio da instituição de ensino, experiência no serviço público, e estimam seus efeitos sobre a probabilidade de ascensão. A pergunta é sempre a mesma: ‘quanto cada ano adicional de educação, ou cada grau acadêmico superior, aumenta as chances de chegar ao topo da hierarquia burocrática?’
A Análise Geométrica de Dados mostra que essa pergunta está mal colocada. O que importa não é o nível educacional abstrato, mas o circuito institucional de formação e legitimação burocrática. No caso brasileiro, há três “circuitos”:
a) jurídico-administrativo nacional: formação em Direito em universidades públicas (USP, UERJ, UnB), concursos de carreiras jurídicas de Estado (Advocacia-Geral da União, Procuradorias), progressão em Ministérios de perfil regulatório (Justiça, CGU), legitimação baseada em conhecimento jurídico-normativo e vínculos corporativos;
b) técnico-econômico internacionalizado: formação em Economia ou Engenharia, pós-graduação em universidades estrangeiras de elite (Caltech, Harvard, Chicago), carreiras em áreas econômicas (Banco Central, Tesouro, BNDES, IPEA), legitimação baseada em expertise técnica e redes internacionais (FMI, Banco Mundial, OCDE); e
c) híbrido acadêmico-estatal: formação em Ciências Sociais, Políticas Públicas, Relações Internacionais, doutorado acadêmico (muitas vezes em universidades públicas brasileiras), carreira dupla (universidade + consultoria para órgãos públicos), entrada em cargos de assessoria ou planejamento, legitimação baseada em capital simbólico acadêmico.
Cada circuito define um espaço próprio de possibilidades de ascensão burocrática, com critérios diferenciados de excelência, formas específicas de acumulação de prestígio e tipos distintos de conversão de recursos (um doutorado em Chicago vale muito no Banco Central, pouco na AGU, um diploma da Faculdade de Direito da UERJ vale muito em Procuradorias, mas muito menos em áreas econômicas).
Falar em “efeito médio da educação” é estatisticamente possível, mas sociologicamente equivocado. O coeficiente agregado é uma média aritmética de processos heterogêneos, sem correspondência com nenhuma trajetória concreta. Novamente: não se trata de imprecisão técnica. O problema é que regressões pressupõem um objeto que não existe (efeitos educacionais isoláveis e aditivos), ignorando o objeto que efetivamente existe (circuitos estruturados de formação escolar).
Análise Geométrica de Dados versus Rubin Causal Model em estudos de elites: o problema do contrafactual implausível
A inadequação do Rubin Causal Model (RCM) aos estudos de elites (vimos isso no post 1 desta série) é particularmente explícita quando examinamos seus pressupostos.
O RCM pressupõe:
1. Tratamentos discretos e bem definidos: existe um momento identificável em que a unidade recebe (ou não) a intervenção.
2. Unidades comparáveis: existem unidades “tratadas” e de “controle” que, após ajuste por covariáveis, são intercambiáveis.
3. Contrafactuais plausíveis: faz sentido perguntar “o que teria acontecido se a unidade não tivesse recebido o tratamento”.
Nenhuma dessas condições se sustenta quando o “tratamento” é origem social elevada, herança do capital político familiar, socialização em instituições de elite e inserção precoce em redes de poder econômico.
Não existe contrafactual plausível para “não ter nascido em uma família politicamente influente”, mantendo constantes escolarização, disposições políticas, redes de contato, oportunidades de carreira. Essas dimensões não são independentes, elas constituem conjuntamente a trajetória.
O filho de ministro que frequenta o Colégio Santo Inácio no Rio, faz Direito na PUC-Rio, entra para o partido aos 24 anos, estagia no gabinete do pai, elege-se vereador aos 25, deputado estadual aos 29, e deputado federal aos 34, não pode ser comparado, mesmo “controlando por escolaridade e experiência prévia”, com o filho de operário metalúrgico que frequenta escola pública periférica, trabalha desde os 14, faz Direito noturno em faculdade privada de baixo prestígio, milita em movimento social de moradia, candidata-se pela primeira vez aos 40 anos e perde a eleição.
O que a inferência causal chama de “viés de seleção” ou “confounding” é, nesse caso, a famosa e inelutável estrutura social. Não é um problema técnico de identificação a ser resolvido por estratégias mais sofisticadas (matching, instrumental variables, regression discontinuity). É a própria natureza relacional do objeto.
A AGD não tenta resolver esse problema com técnicas estatísticas mais sofisticadas. Ela o dissolve ao deslocar o foco da análise mudando a pergunta de pesquisa: de efeitos causais isolados para configurações estruturais de poder. A pergunta não é “qual o efeito causal de X sobre Y”, mas “como propriedades X, Y, Z se combinam para formar tipos sociais distintos de acesso ao poder”.
Antes de perguntar quem chega ao poder (e por quê), é preciso responder a uma questão mais fundamental: que tipos de poder existem, como eles se estruturam empiricamente, e quais princípios de diferenciação organizam o espaço das posições dominantes.
Prosopografia como estatística, não como descrição ilustrativa
A contribuição decisiva da Análise Geométrica de Dados é elevar a prosopografia de descrição biográfica a método estatístico rigoroso, e não em um apêndice descritivo ou em material preliminar para “análises mais sofisticadas”.
Na tradição clássica da prosopografia histórica, trajetórias biográficas coletadas sistematicamente serviam para ilustrar padrões, identificar casos típicos, ou fornecer “contexto” para interpretações narrativas. A estatística, quando presente, limitava-se a distribuições de frequência, médias e, no máximo, correlações bivariadas.
A AGD eleva a prosopografia ao estatuto de construção rigorosa de objetos empíricos. Trajetórias deixam de ser histórias individuais agregadas e passam a ser pontos em um espaço estruturado cuja geometria revela princípios de diferenciação, hierarquias de capitais e lógicas de dominação.
Isso não elimina a interpretação histórica ou sociológica. Ao contrário, torna-a mais exigente. Interpretar eixos fatoriais requer uma teoria substantiva sobre os campos estudados, conhecimento histórico-institucional sobre processos de formação de elites e sensibilidade sociológica para identificar homologias estruturais entre diferentes espaços sociais.
Os limites “estruturais” da Análise Geométrica de Dados
A Análise Geométrica de Dados não substitui a regressão em todos os contextos. Para problemas de previsão, avaliação de impacto de políticas específicas ou teste de hipóteses causais bem delimitadas, modelos de regressão sempre são os mais apropriados.
Três pontos merecem atenção.
Primeiro: a AGD não produz inferência causal no sentido estrito.
Isso não é defeito acidental, mas consequência de seu design. Ao recusar a decomposição do fenômeno em variáveis dependentes e independentes, a AGD renuncia à possibilidade de estimar efeitos causais identificados. Ela pode revelar que economistas ortodoxos com PhD em Chicago ocupam posições específicas no campo do poder econômico, mas não pode afirmar que ter PhD em Chicago causa essa posição, controlando por origem social e redes familiares.
Para certos problemas, essa limitação não é aceitável. Avaliação de políticas públicas, análise de impacto de reformas institucionais, ou teste de teorias sobre mecanismos causais específicos exigem estimação de efeitos, não mapeamento de estruturas. Nesses contextos, a AGD é uma técnica de análise apenas preliminar quando muito.
Segundo: a interpretação de eixos fatoriais permanece subjetiva.
Embora a AGD alegue que as estruturas “emergem dos dados”, a nomeação e interpretação dos eixos que formam o espaço de relações dependem fundamentalmente das preferências do analista.
O que o primeiro eixo “significa” (capital herdado versus mérito? setor público versus privado? nacional versus internacional?) não está inscrito nos dados, mas resulta de preferências teóricas.
Dois pesquisadores, diante dos mesmos eixos fatoriais, podem produzir interpretações radicalmente distintas. Um pode ver “oposição entre capital econômico e capital cultural”; outro, “oposição entre elites tradicionais e elites modernizantes”. Não há critério estatístico interno à ACM para arbitrar entre essas leituras. Os números revelam que existe uma oposição estrutural, mas não dizem qual é seu significado sociológico. A geometria é objetiva; a interpretação, não.
Terceiro: a AGD exige amostras relativamente grandes e dados ricos.
Para que a estrutura geométrica seja interpretável, é necessário número suficiente de indivíduos (tipicamente N > 100) e número suficiente de variáveis ativas bem escolhidas (tipicamente 8-15 variáveis categóricas com múltiplas modalidades). Estudos de elites políticas nacionais ou elites burocráticas de alto escalão frequentemente enfrentam N pequenos (todos os ministros de um país em 20 anos podem ser apenas 80-120 indivíduos, exceto o Brasil...).
Com N pequeno:
· Os eixos fatoriais ficam instáveis (sensíveis a observações individuais)
· As nuvens de pontos ficam muito espaçadas (difícil ver padrões)
· A inércia (variância explicada) pode ser artificialmente alta
· Interpretação fica frágil (adicionar/remover poucos casos muda tudo)
Essas limitações não invalidam a AGD. Mas exigem o bom e velho pluralismo metodológico e zelo científico: nem tudo é estrutura, nem tudo é efeito.
A escolha entre AGD e regressão não é ideológica, mas depende do problema substantivo, da natureza dos dados e do tipo de conhecimento que se busca produzir.


Texto ótimo! Publiquei um texto sobre o amor nas redes sociais e o conceito de performance, seria um prazer se vocês lesse.
https://gabrielmartinsarantes.substack.com/p/o-apetite-do-algoritmo-uma-cronica?utm_source=share&utm_medium=android&r=7auaqc