Bokmässan och öppna(de) data

Bokmässan inträffar ju varje höst i Göteborg. Jag har blandade känslor som vanligt.

Men jag tänker att det finns en dataperspektiv på det mesta. Vilka arrangerar saker på bokmässan? Vad handlar de om? Vilka organisationer använder detta vinmingel till att påverka politiken? Vilka personer är mest eftertraktade?

Tyvärr verkar arrangörer (till exempel Almedalsveckan) vara allergiska mot öppna data och ogillar att dela. Bok och Biblioteksmässan är dock ett privat företag, så jag bekymrade mig inte ens om att mejla och fråga. Det kan ju vara lite tröttsamt med rättshaverism.

Något som är mycket roligare än offentlighetsprinciper är datamaskiners principer. Bokmässans program ligger inbäddad i en ”skrollande” sida, en för varje dag som mässan är öppen. Inte så vänligt om man skulle vilja göra lite statistik. Men desto roligare utmaning att skrapa.

Med hjälp av selenium och ett litet pythonskript lyckades jag emulera en febrilt skrollande webläsare som hämtade all data och förpackade 1631 programpunkter (jag tror att detta är alla) i en lite trevligare csv-fil (som man kan öppna med LibreOffice eller Excel). Enkelt fixat.

Med denna data kan vi sedan skapa lite basal statistik (med hjälp av ytterligare ett litet skript) som besvarar de inledande frågeställningarna.

  1. Vilka är de största arrangörerna? Svar (uppdaterad tabell, se kommentarerna):
Författarcentrum och Sveriges Författarförbund	73
Albert Bonniers Förlag 70
Norstedts	65
Natur & Kultur	63
Bonnier Carlsen	61
Rabén & Sjögren	35
Studieförbundet Vuxenskolan	35
Wahlström & Widstrand	32
Storytel	29
Kartago	26
Göteborgs universitet	24
Linköpings universitet	23
Eksjö Bokhandel	22
Forum	22
Institutionen för svenska språket	20
Bonnier Fakta	18
Lunds universitet	17

Storytel är på uppgång och vad gör egentligen ”Eksjö bokhandel” med 22 arrangerade programpunkter, nästan lika mycket som Göteborgs universitet! (troligtvis har de lagt in alla 20 annonserade författarsigneringar som egna programpunkter).

2. Vilka är de mest bokade personerna? (vem har mest kulturellt bokmässekapital). Svar:

Anna Öqvist Ragnar	28
Jenny Jägerfeld	13
Janina Orlov	12
Ebba Witt-Brattström	12
Katarina Gäddnäs	12
Stina Wirsén	11
Cecilia Uddén	10
Mats Strandberg	10
Lotta Olsson	10
Wivan Nygård-Fagerudd	9
Irena Bre?ná	9
Anna Bennich Karlstedt	9
Johan Unenge	9
Jonas Mattsson	8
Ola Larsmo	8
Lena Andersson	8
Erik Titusson	8
Niklas Gårdfeldt Leavy	7
Björn Ranelid	7
Anne-Marie Körling	7
Yukiko Duke	7
Ingrid Elam	7
Daniel Sandström	7
Lars H Gustafsson	7
Katarina Wennstam	7
Sara Lövestam	7
Christina Wahldén	6
Sara Nyström	6
Pija Lindenbaum	6
Gunilla Bergström	6
Benita Funke	6
Sandra Beijer	6
Ulrika Knutson	6
Karolina Ramqvist	6
Henrik Meinander	6
Ylva Lagercrantz	6
Niklas Rådström	6
Siri Pettersen	6
Anna Jansson	6
Jan Guillou	6
Meg Rosoff	6
Antje Jackelén	6
Marianne Rundström	6
Elsie Johansson	6
KG Hammar	6
Farzad Farzaneh	6
Anders Hansen	6
Helena von Zweigbergk	6
Theodor Kallifatides	6

Återigen en topplacering för Storytel. Kulturmännen verkar inte kunna nå den absoluta toppen.

3. Vilka teman dominerar? Svar:

Samhälle och debatt	429
Barn och ungdom	406
Skola	237
Hälsa och livsstil	154
Bibliotek	152
Historia	133
Yttrandefrihet	128
Memoarer och biografier	100
Livsåskådning	90
Deckare	75
Serier	44
Fantasy och science fiction	41
Populärvetenskap	17
Mat och dryck	2

 

2 reaktioner till “Bokmässan och öppna(de) data”

  1. Kul statistik men Albert Bonniers Förlag kommer två gånger på din lista. Om du slår ihop båda gångerna hamnar förlaget på en stark 2:a-plats.

  2. Pia Lerigon: Precis! Jag uppdaterar listan. Datorn gör ingen skillnad på ”förlag” och ”Förlag”. Det är jag som inte använt funktionerna för att göra korrekta strängmatchningar (först lower() och sedan title() hade förhindrat detta missöde).

    Tack för kommentaren!

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Time limit is exhausted. Please reload CAPTCHA.