Att öppna data – Almedalen och den slutna offentligheten

Häromveckan rapporterade SVT att svenska lärosäten lägger ”miljontals kronor” på Almedalsveckan. Det kan man ha blandade känslor inför. För att råda bot på min ambivalens tänkte jag att det måste gå att se vilken valuta för pengarna som universiteten egentligen får. Även om summorna kanske inte är enorma, så är det ju en demokratisk fråga huruvida man överhuvudtaget ska vara närvarande på en ö så långt borta från medborgarna man bara kan komma när man sysslar med vetenskap och utbildning.

Jag surfade till Almedalsveckans hemsida och försökte ladda ned programmet i någon form av rådata, så att jag skulle kunna ordna fram lite statistik och se vad som egentligen universiteten pratade om. Den vecka då politiker möter lobbyister måste väl ändå vara så transparent att luften vi andas känns grumlig i jämförelse! Men, jag möttes av besvikelse. Man var tvungen att ”köpa” CSV-filen som innehöll programmet som rådata.

Detta handlar inte om kostnaden. Detta handlar om att man sätter en tröskel mellan medborgare och data. Ett av mina specialintressen är datamedborgarskap, så jag känner att det är min plikt att haverera lite kring detta.

”Ursäkta om jag stör konsensusmyset i roséminglet.”

Två vägar framåt kan identifieras: Den ”juridiska strategin” (korsningen mellan juridik (LAW) och teknik (TEC) som man kan säga med filosofisk terminologi), samt den ”teknologiska strategin” (korsningen teknik (TEC) och referens (REF)). Jag testade båda parallellt.

Del 1: Den juridiska strategin

Först mailade jag Almedalsveckan och begärde CSV-filen som man kunde köpa. Min motivation var att det rörde sig om en allmän handling. Jag fick nej första gången, och andra gången hänvisades jag till ett tidigare domslut. Min fråga var:

Hej,

tack för det snabba svaret!

För att jag ska kunna gå vidare med ärendet skulle jag behöva någon form av  myndighetsbeslut att hänvisa till i min överklagan. Gärna något som är diariefört.

Sedan har jag en fråga som bara är för förtydligande. Visst är det så att jag har att göra med Gotlands kommun som myndighet i sista instans?

Tack på förhand

Mvh

Christopher Kullenberg

Svaret jag fick:

Hej Christopher,

Myndigheten som förvarar handlingen är Regionstyrelsen i Region Gotland. Någon rätt till utlämnande i elektroniskt format finns inte, se t ex http://www.allmanhandling.se/wp-content/uploads/2012/10/KR_Sthlm_4666_12.pdf. Där framgår också att beslut kring det inte är ett överklagningsbart beslut att inte lämna ut i ett visst elektroniskt format.

Jag bifogar det beslut vi arbetar efter.

Jag tar med mig dina synpunkter i vår årliga utvärdering av Almedalsveckan.

Hälsningar, [Anonymiserat]

…………………………………………..
Almedalsveckan
Telefon: 0498-26 93 10
E-post: almedalsveckan@gotland.se

Region Gotland
Visborgsallén 19, 621 81 Visby
www.gotland.se

Jag är inte så bra på den juridiska biten. Men jag tror att man kan gå vidare här. Men, jag tänker även att ja kanske inte ska plåga någon tjänsteman med detta över semestern, så ärendet kan ”vila” lite.

Men ändå: Region Gotland har resurser att leta upp prejudicerande domar som argument för att låsa in data från medborgarna. Är detta ett öppet samhälle eller en byråkratisk järnbur?

Del 2: Den teknologiska strategin

Parallellt med denna lilla juridiska ordväxling (to be continued) så testade jag även att se vad man kunde få ut av den existerande sökmotorn som är ”fri” för medborgarna att använda.

Om inte myndigheter kan ge medborgardata så kan man använda sig av medborgarprogrammering för att öppna data. I Spinozistisk mening behöver ibland Staten en intervention, en slags ”uppgradering”.

Nu blir det lite tekniskt (men egentligen är detta bara en form av applicerad sociologi som arbetar utmed linjen offentligt/icke-offentligt)

För att få maximalt antal träffar i sökmotorn sökte jag på %s%almedalsveckan.info. Denna sträng genererar 3823 träffar, vilket bör vara det ungefärliga totalurvalet.

Screenshot from 2016-07-04 17-58-20

När sökningen är klar kan man ladda ned resultaten som en pdf. Denna pdf-fil kan man enkelt konvertera till html med det anspråkslösa programmet pdftohtml.

$ pdftohtml almedalen_2016.pdf

För att sedan extrahera länkarna till varje programpunkt, är det inte svårare än att man komponerar ett reguljärt uttryck medelst egrep och skriver länkarna till en ny fil:

$ egrep -io 'http://www.almedalsveckan.info/event/user-view/[^\"]*' almedalen_2016s.html > almeurl.txt

För att sedan hämta alla länkar och därefter extrahera den data man vill ha i varje programpunkt har jag skrivit ett litet Pythonskript som man kan läsa och ladda ned här. Hela filarkivet finns på Github under det kryptiska namnet AlmeScraper.

Resultatet: En CSV-fil med några centrala data (Arrangör, Kontaktperson1, Kontaktperson2, Sökord, Ämnesområde).

Det hela kan göras mycket snyggare beroende på vilken data man vill åt. Se det mer som ett proof of concept än en exakt reproduktion av det slutna programmet.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Time limit is exhausted. Please reload CAPTCHA.