Posted By

torresbernardo on 11/17/14


Tagged

data analysis e-gov


Versions (?)

Analisar dados dos servidores do Governo Federal


 / Published in: Python
 

URL: http://www.portaltransparencia.gov.br/downloads/servidores.asp

Utiliza os dados do site: http://www.portaltransparencia.gov.br/downloads/servidores.asp

Escolha um mês e ano, baixe o .zip, descompacte e na pasta descompactada, execute.

  1. $ python
  2. Python 2.7.6 (default, Sep 9 2014, 15:04:36)
  3. [GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.39)] on darwin
  4. Type "help", "copyright", "credits" or "license" for more information.
  5. >>> import numpy
  6. # names: nome das colunas - id_servidor, renda depois dos descontos, nome
  7. # formats: formatos - integer tamanho 12, float tamanho 10, string tamanho até 50
  8. # converters: converte vírgula pra ponto pra transformar em float
  9. >>> dtype = {'names''income', 'id_servidor', 'name'], 'formats''f10', 'i12', 'S50'), 'converters':{27:lambda x: x.replace(',', '.')}}
  10. # carrega os dados do arquivo CSV
  11. >>> data = numpy.genfromtxt('20140930_Remuneracao.csv', delimiter='\t', skip_header=1, invalid_raise=False, usecols=(27, 2, 4), dtype=dtype, converters=dtype['converters'])
  12. # ordena pelo salário
  13. >>> winning = sorted(data, key=lambda x: x[0], reverse=True)
  14. # lista os 50 funças mais felizardos da nação Huelândia
  15. >>> winning[:50]

Report this snippet  

You need to login to post a comment.