Tag Archives: dados

Livro “Scraping for Journalists”: como recolher e analisar dados

Se me tivessem dito há uns anos atrás que para ser um jornalista moderno teria que saber trabalhar com o Excel e bases de dados provavelmente teria escolhido outra área.

Saber trabalhar com dados é uma das características mais importantes dos jornalistas digitais, pensem só na quantidade de informação estatística que está aí ao nosso dispor, em quantidades tão avassaladoras que é difícil perceber onde está a história e que outras histórias se podem encontrar.

Para nos ajudar a encontrar estas agulhas no palheiro da informação digital Paul Bradshaw escreveu um livro muito prático sobre como inquirir fontes (normalmente, bases de dados) e analisar os resultados de forma eficaz.Apesar de estar orientado para uma realidade anglo-saxónica, onde a disponibilização e organização de dados estar muito à frente da portuguesa, é uma excelente forma de entrar nesta área.

Tem alguma componente de programação, por isso não será para todos, é preciso saber mais do que escrever e editar no mundo digital onde vivemos.Podem ver aqui um excerto em PDF.

“Scraping for Journalists introduces you to a range of scraping techniques – from very simple scraping techniques which are no more complicated than a spreadsheet formula, to more complex challenges such as scraping databases or hundreds of documents. At every stage you’ll see results – but you’ll also be building towards more ambitious and powerful tools.

You’ll be scraping within 5 minutes of reading the first chapter – but more importantly you’ll be learning key principles and techniques for dealing with scraping problems.”

Scraping for Journalists

Paul Bradshaw foi o meu professor no Mestrado de Jornalismo Online em Birmingham.

 

 

PorData: Portugal’s Database | A Base de dados de Portugal

Have Data Will Mashup

Pordata.pt is a new website supported by the Francisco Manuel dos Santos Foundation and “aims to make statistical data available in three main phases: for Portugal (1st phase), for Portugal and the countries of the EU 27 (2nd phase) and the Portuguese regions and municipalities (3rd phase). The vector common to all the information presented is time. Published in chronological series, the information is related to a long period, which begins, wherever possible, in 1960 and continues to the present day.”

All these statistics available gave me the mashup frenzy. My questions is: now that they’re available, will someone do anything good with them?

Pordata é o novo site apoiado pela Fundação Francisco Manuel dos Santos e “prevê disponibilizar os dados estatísticos em três fases principais: para Portugal (1.ª fase), para Portugal e países da UE 27 (2.ª fase) e para as regiões e municípios portugueses (3.ª fase). O vector comum a toda a informação apresentada é o tempo. Publicada sob a forma de séries cronológicas, a informação incide sobre um longo período, que se inicia, sempre que possível, em 1960 e se prolonga até à actualidade.”

Todas estas estatísticas deram-me desejos de fazer coisas com elas. A minha pergunta é: agora que estão disponíveis, irá alguém fazer alguma coisa de jeito?