O CepespData é uma plataforma de acesso a dados eleitorais brasileiros desenvolvida pelo Centro de Política e Economia do Setor Público (CEPESP) da Fundação Getulio Vargas (FGV), com coordenação do professor Dr. George Avelino Filho.
Caso faça uso das informações, o banco de dados do CepespData deve ser citado utilizando o seguinte modelo:
FGV CEPESP (2024). CepespData - Banco de Dados Políticos. Visitado em XX/XX/XXX. Disponível em https://cepesp.fgv.br/data
Conheça nossos princípios:
Transparência
-
Fonte bruta do TSE: O CepespData é elaborado a partir dos dados disponibilizados pelo Tribunal Superior Eleitoral (TSE) no Repositório de Dados Eleitorais. O CepespData provê um repositório da atividade eleitoral no Brasil, a partir dos dados coletados, registrados e armazenados pelo TSE.
-
Um retrato do dia da eleição: Os dados do CepespData se referem especificamente ao dia da votação, por seção eleitoral, privilegiando na informação a vontade do eleitor. Esse é o único arquivo cujo resultado não é atualizado pelo TSE conforme decisões judiciais posteriores ao dia da eleição.
Rigor
-
Alto grau de consistência: O trabalho para reforçar a consistência nos dados garante que as diferenças de votos reportadas pelas bases do CepespData nunca sejam superiores a 1% em relação aos resultados reportados pelo TSE.
-
Integridade de dados originais: Não mexemos em nenhum dado do TSE, tendo em vista a preocupação em manter a consistência com os dados originais e os de outras pesquisas. Falhas identificadas nos dados brutos são comunicadas ao TSE para que seja feita a correção na origem.
Inclusão
-
Múltiplas formas de acesso: Os dados são acessíveis por meio de um website interativo. Variáveis, como, por exemplo, os códigos de município do IBGE, foram incluídas para facilitar a junção com outros bancos de dados. Em breve, será divulgada a nova versão da API, com suporte para pacote R e Python.
-
Simplificando a vida do pesquisador: O CepespData padroniza, simplifica, e complementa os dados do TSE para facilitar as análises de usuários. Os dados são nomeados e categorizados de forma compreensível, padronizando formatos e tipos de variáveis. Seguindo os princípios do tidy data, cada linha é uma observação; cada variável é uma coluna e cada tipo de observação uma tabela (exceto a da base de dados consolidada).
Escopo e construção do Banco de Dados:
Como é feito o CepespData?
Notas sobre os dados brutos
- Para conhecimento das colunas originais do TSE, o LEIA-ME disponibilizado pelo tribunal aqui. Também disponibilizamos um resumo deste documento aqui.
-
Como forma de facilitar a análise dos dados eleitorais, padronizou-se a nomenclatura de colunas e campos utilizadas pelo TSE, permitindo a integração entre as diferentes bases de dados disponibilizadas pela Justiça Eleitoral para uma mesma eleição, mas também entre diferentes pleitos.
-
Uma breve descrição de cada coluna pode ser encontrada em “ADICIONAR COLUNAS” em todas as consultas.
-
Todas as informações referentes a candidaturas têm origem nos dados reportados pelos próprios candidatos ao TSE.
-
Problemas em relação aos dados extraídos do TSE e, que foram diagnosticados pela equipe do Cepesp, podem ser encontrados na seção de Testes de Consistências.
Testes de Consistência
A equipe do CepespData realiza testes de consistência periodicamente para garantir o alto grau de consistência dos dados disponibilizados. As manipulações das bases originais buscam ser transparentes e replicáveis de ponta a ponta. Dessa forma, qualquer pessoa, tendo em mãos os dados do TSE e nossos códigos, poderá replicar a limpeza e a manipulação dos dados realizada pela equipe do CepespData.
Disponibilizamos via Github os códigos de extração e manipulação dos dados provenientes do TSE. A cada atualização da base de dados do CepespData, realizamos os seguintes testes:
Falhas detectadas
-
Foram identificadas falhas de consistência nos dados originais do TSE para o Estado do Rio de Janeiro, ano 1998. Isso porque o número de eleitores (definido nos testes como a quantidade de comparecimento) e votos reportados foram menores do que o real.
-
Os testes de consistência apontaram problemas no ano de 2000, quando observações estão duplicadas nos dados originais do TSE.
-
Verificou-se a ausência de municípios em algumas bases do TSE, nos anos de 2000 e 2004.
-
Outras pequenas inconsistências foram encontradas nos dados originais do TSE, mas são inferiores a 1% dos resultados.
-
O relatório e a rotina de testes desenvolvidos pela equipe do CepespData está disponível no nosso Github
Locais de Votação
O CepespData adicionou em suas ferramentas de consulta a agregação dos dados eleitorais por local de votação. Para isso, foi necessário um cuidadoso processo de georreferenciamento dos locais de votação.
O código utilizado e a documentação de cada etapa do georreferenciamento estão disponíveis no Github do CepespData. Também estão documentados os resultados dos testes de consistências realizados no georreferenciamento.
Codebook do CepespData
Abaixo, é possível conferir quais são as variáveis disponíveis nas nossas bases de dados.
VariávelNome da variávelTipoValoresDescriçãoFonte
ANO_ELEICAOAno EleiçãoInteiro1998, 2000, 2002, 2004, 2006, 2008, 2010, 2012, 2014, 2016, 2018Indica o ano em que ocorreu o pleito. Eleições municipais iniciam em 2000 e têm recorrência cada 4 anos. Eleições gerais iniciam em 1998 e têm recorrência cada 4 anos.Repositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
SIGLA_UESigla da Unidade EstadualCarácter / InteiroCódigo do município do TSE Sigla da UF BR VT ZZSigla da Unidade Eleitoral (Em caso de eleição majoritária é a sigla da UF que o candidato concorre (texto) e em caso de eleição municipal é o código TSE do município (número). Para eleições nacionais, também se aplicam: BR - Quando se trata de informação a nível nacional; VT - Quando se trata de voto em trânsito; ZZ - Quando se trata de voto no exteriorRepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
NUM_TURNONúmero do turnoInteiro1 e 2Indica o turno eleitoral. Eleições majoritárias podem ter até 2 turnos 1 - primeiro turno; 2 - segundo turnoRepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
DESCRICAO_ELEICAODescrição da eleiçãoCarácterTexto exemplo “ELEIÇÃO GERAL FEDERAL 2018”Descreve tipo, nível e ano da eleiçãoRepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
CODIGO_CARGOCódigo do cargoInteiro1, 3, 5, 6, 7, 11 e 13Código do cargo disputado utilizado pelo TSE 1 - Presidente; 3 - Governador 5 - Senador; 6 - Deputado Federal; 7 - Deputado Estadual; 11 - Prefeito 13 - VereadorRepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
DESCRICAO_CARGODescrição do cargoCarácter“PRESIDENTE” “GOVERNADOR” “SENADOR” “DEPUTADO FEDERAL” “DEPUTADO ESTADUAL” “PREFEITO” “VEREADOR”Descrição do cargo disputado utilizada pelo TSERepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
NUMERO_CANDIDATONúmero do candidatoInteiroNúmero de urna do candidatoNúmero de urna do candidato cadastrado no TSERepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
CODIGO_MACROCódigo macroInteiro1, 2, 3, 4, 5, 99Macrorregiões confor me classificação IBGE 1 - Norte, 2 - Nordeste, 3 - Sudeste, 4 - Sul 5 - Centro-Oeste e 99 - ExteriorInstituto Brasileiro de Geografia e Estatística (IBGE)
NOME_MACRONome macroCarácter“Norte”, “Nordeste”, “Centro-Oeste”, “Sudeste”, “Sul” e “Exterior”Nome da macrorregião conforme classificação do IBGEInstituto Brasileiro de Geografia e Estatística (IBGE)
UFUnidade FederativaCarácter“AC”, “AL”, “AM”, “AP”, “BA”, “CE”, “DF”, “ES”, “GO”, “MA”, “MG”, “MS”, “MT”, “PA”, “PB”, “PE”, “PI”, “PR”, “RJ”, “RN”, “RO”, “RR”, “RS”, “SC”, “SE”, “SP”, “TO”, “ZZ”Sigla da Unidade da Federação ZZ - Votação no ExteriorInstituto Brasileiro de Geografia e Estatística (IBGE)
NOME_UFNome da Unidade FederativaCarácter“Acre”, “Alagoas”, “Amazonas”, “Bahia”, “Ceará”, “Destrito Federal”, “Espírito Santo”, “Goiás”, “Maranhão”, Minas Gerais, “Mato Grosso”, “Mato Grosso do Sul”, “Pará”, “Paraíba”, “Pernambuco”, “Piauí”, “Paraná”, “Rio de Janeiro”, “Rio Grande do Norte”, “Rondônia”, “Roraima”, “Rio Grande do Sul”, “Santa Catarina”, “Sergipe”, “São Paulo”, “Tocantins”, “Exterior”Nome da Unidade FederativaInstituto Brasileiro de Geografia e Estatística (IBGE)
CODIGO_MESOCódigo mesoInteiroSequência numéricaCódigo da mesorregião utilizada pelo IBGEInstituto Brasileiro de Geografia e Estatística (IBGE)
NOME_MESONome mesoCarácterTexto exemplo “Vale do Acre”Nome da mesorregião utilizado pelo IBGEInstituto Brasileiro de Geografia e Estatística (IBGE)
CODIGO_MICROCódigo microInteiroSequência numéricaCódigo da microrregião utilizado pelo IBGEInstituto Brasileiro de Geografia e Estatística (IBGE)
NOME_MICRONome microCarácterTexto exemplo “Rio Branco”Nome da microrregião utilizado pelo IBGEInstituto Brasileiro de Geografia e Estatística (IBGE)
COD_MUN_TSECódigo município TSEInteiroSequência numéricaCódigo do município utilizado pelo TSERepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
COD_MUN_IBGECódigo município IBGEInteiroSequência numéricaCódigo do município utilizado pelo IBGEInstituto Brasileiro de Geografia e Estatística (IBGE)
NOME_MUNICIPIONome do municípioCarácterTexto exemplo “Acrelândia”Nome do município onde ocorreu a eleiçãoRepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
NUM_ZONANúmero da zonaInteiroSequência numéricaNúmero da zona na qual ocorreu a votaçãoRepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
NUM_SECAONúmero da seçãoInteiroSequência numéricaNúmero da seção na qual ocorreu a votaçãoRepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
QTDE_VOTOSQuantidade de votosInteiroNúmeros > 0Total de votos obtidos pelo candidatoRepositório de dados eleitorais do Tribunal Superior Eleitoral (TSE)
Nossas APIs - Tutoriais
O cepespR, assim como as versões Python e REST, são pacotes criados para auxiliar o acesso dos usuários via API ao CepespData. Por meio dessa ferramenta, é possível realizar requisições de maneira mais rápida e estruturada aos dados eleitorais presentes no nosso repositório.
Abaixo, é possível consultar nossos tutoriais que auxiliam no uso dessas ferramentas.
API R
API Python
Tabelas Auxiliares - Downloads
Abaixo é possível conferir os documentos auxiliares à consulta e à replicação dos testes de consistência e de montagem dos bancos de dados do CepespData.
Vagas por cargo
Outras tabelas
Agradecimentos e Citações
Desenvolvido com apoio da Rede de Pesquisa e Conhecimento Aplicado da FGV, da FAPESP ao projeto “As Instituições Políticas Subnacionais: Um Estudo Comparativo dos Estados Brasileiros” (processo: 2013/15658-1) e do Tribunal Superior Eleitoral - TSE.
O projeto do CepespData é coordenado pelo professor Dr. George Avelino Filho. O CepespData é um projeto do Centro de Política e Economia do Setor Público (CEPESP), um centro de pesquisa da Fundação Getulio Vargas (FGV) liderado pelos professores Dr. George Avelino Filho e Dr. Ciro Biderman. O projeto contou com a contribuição de:
Abraão Lacerda, Arthur Fisch, Ciro Biderman, Eliana Lins Morandi, Frederico Ramos, Gabriela Campos, Gabriel Caseiro, Gabriel Goldfajn, Guilherme Russo, Henrique Hott, Jairo Pimentel, Jonathan Phillips, Lara Mesquita, Lucas Gelape, Luiz Gabriel, Maria Letícia Claro, Marina Merlo, Mauricio Izumi, Natália Salgado Bueno, Rafael Coelho, Rebeca Carvalho, Wesley Seidel, William Colen.