måndag 10 april 2017

Guider i pandas, robottexter i finska valet och Facebook-scraping



10 april 2017

Varannan måndag skriver vi om inspiration, verktyg, utbildningar, event och trender kring datadriven journalistik.

Kommunalval i Finland: Alla gör autogenererat

Robotskrivna texter som sammanfattar valresultaten i kommunerna var branschstandard i söndagens kommunalval i Finland. Här är tre exempel på hur en artikel om resultatet i Vasa kan se ut:

...det sista exemplet är en del av ett forskningsprojekt för att hitta generiska lösningar för journalistiskt textgenerering: https://www.helsinki.fi/sv/aktuellt/valtteri-skriver-sjalvstandigt-nyheter-pa-flera-sprak

För kartomanen rekommenderar vi också https://svenska.yle.fi/artikel/2017/04/10/se-kommunalvalets-viktigaste-kartor-har-har-makten-skiftat-har-ar-medelaldern som innehåller en samling av svenska Yles bästa kartvisualiseringar från valnatten.

Facebook-scraping för vanliga döda

Under helgens gräv visade vi hur man kan scrapa Facebook med enkla medel. Se slidsen här.

Pandas överallt!

Varje vecka producerar vi uppslaget Trend i Dagens Samhälle. Transparens är superviktigt i datajournalstik. I mån av möjlighet publicerar vi alltid våra egna analyser som så kallade notebooks. Genom att göra analysen i kod blir all metodik transparent.

Här är det Jens Finnäs som tittat på sambandet mellan flyktingmottagande och brottslighet. Statistiken för 2016 visar att de kommuner som tog emot många flyktingar INTE upplevde någon nämnvärd brottsvåg: http://bit.ly/ds-flyktingar


1. Guider och tips

Lär dig pandas
https://bitbucket.org/hrojas/learn-pandas

Lär dig Jupyter Notebook 
https://nbviewer.jupyter.org/github/jupyter/notebook/blob/master/docs/source/examples/Notebook/Running%20Code.ipynb

Manipulera data
https://hackernoon.com/reshaping-data-in-python-fa27dda2ff77

Städa data
http://www.jeannicholashould.com/tidy-data-in-python.html

Utforska data
http://blog.districtdatalabs.com/data-exploration-with-python-1

Grunderna från vår dragning på Noda
http://bit.ly/noda-pandas

Användbara snippets
https://gist.github.com/bsweger/e5817488d161f37dcbd2


2. Notebooks och analyser

Hitta vapen i sociala medier-bilder 
http://www.automatingosint.com/blog/2016/01/osint-automatically-finding-weapons-in-social-media-images-part-1/

Analysera fixade matcher i tennis
https://github.com/BuzzFeedNews/2016-01-tennis-betting-analysis/blob/master/notebooks/tennis-analysis.ipynb

Hur segregerat är St Louis?
https://github.com/BuzzFeedNews/2014-08-st-louis-county-segregation/blob/master/notebooks/segregation-analysis.ipynb

Drar filmer som klarar bechdel-testet in mer pengar?
http://nbviewer.jupyter.org/github/brianckeegan/Bechdel/blob/master/Bechdel_test.ipynb

Demografiska mönster i svenska val
http://maxberggren.se/2016/08/15/SD/

Hämta, manipulera, analysera och visualisera NBA-data 
http://blog.yhat.com/posts/visualize-nba-pipelines.html


XKCD-plottar i pandas
http://nbviewer.jupyter.org/url/jakevdp.github.com/downloads/notebooks/XKCD_plots.ipynb

Data och notebooks från FiveThirtyEight
https://github.com/fivethirtyeight/data

3. Agate - ett alternativ

Om du trots alla länkar inte är övertygad om att pandas är vägen att gå för dig, så rekommenderar vi - återigen - biblioteket agate som är designat specifikt för journalister.

https://source.opennews.org/articles/introducing-agate/

Övrigt

I dag är sista dagen för att nominera knäck till Data Journalism Awards 2017.
Copyright © 2017 Journalism++ Stockholm, All rights reserved.
Det här är ett nyhetsbrev som går ut till e-postadresser som registrerats på http://jplusplus.se/nyhetsbrevet.

Our mailing address is:
Journalism++ Stockholm
℅ Zoo People, Grindsgatan 33
Stockholm 11857
Sweden