Att öppna data – Almedalen och den slutna offentligheten

Häromveckan rapporterade SVT att svenska lärosäten lägger ”miljontals kronor” på Almedalsveckan. Det kan man ha blandade känslor inför. För att råda bot på min ambivalens tänkte jag att det måste gå att se vilken valuta för pengarna som universiteten egentligen får. Även om summorna kanske inte är enorma, så är det ju en demokratisk fråga huruvida man överhuvudtaget ska vara närvarande på en ö så långt borta från medborgarna man bara kan komma när man sysslar med vetenskap och utbildning.

Jag surfade till Almedalsveckans hemsida och försökte ladda ned programmet i någon form av rådata, så att jag skulle kunna ordna fram lite statistik och se vad som egentligen universiteten pratade om. Den vecka då politiker möter lobbyister måste väl ändå vara så transparent att luften vi andas känns grumlig i jämförelse! Men, jag möttes av besvikelse. Man var tvungen att ”köpa” CSV-filen som innehöll programmet som rådata.

Detta handlar inte om kostnaden. Detta handlar om att man sätter en tröskel mellan medborgare och data. Ett av mina specialintressen är datamedborgarskap, så jag känner att det är min plikt att haverera lite kring detta.

”Ursäkta om jag stör konsensusmyset i roséminglet.”

Två vägar framåt kan identifieras: Den ”juridiska strategin” (korsningen mellan juridik (LAW) och teknik (TEC) som man kan säga med filosofisk terminologi), samt den ”teknologiska strategin” (korsningen teknik (TEC) och referens (REF)). Jag testade båda parallellt.

Del 1: Den juridiska strategin

Först mailade jag Almedalsveckan och begärde CSV-filen som man kunde köpa. Min motivation var att det rörde sig om en allmän handling. Jag fick nej första gången, och andra gången hänvisades jag till ett tidigare domslut. Min fråga var:

Hej,

tack för det snabba svaret!

För att jag ska kunna gå vidare med ärendet skulle jag behöva någon form av  myndighetsbeslut att hänvisa till i min överklagan. Gärna något som är diariefört.

Sedan har jag en fråga som bara är för förtydligande. Visst är det så att jag har att göra med Gotlands kommun som myndighet i sista instans?

Tack på förhand

Mvh

Christopher Kullenberg

Svaret jag fick:

Hej Christopher,

Myndigheten som förvarar handlingen är Regionstyrelsen i Region Gotland. Någon rätt till utlämnande i elektroniskt format finns inte, se t ex http://www.allmanhandling.se/wp-content/uploads/2012/10/KR_Sthlm_4666_12.pdf. Där framgår också att beslut kring det inte är ett överklagningsbart beslut att inte lämna ut i ett visst elektroniskt format.

Jag bifogar det beslut vi arbetar efter.

Jag tar med mig dina synpunkter i vår årliga utvärdering av Almedalsveckan.

Hälsningar, [Anonymiserat]

…………………………………………..
Almedalsveckan
Telefon: 0498-26 93 10
E-post: almedalsveckan@gotland.se

Region Gotland
Visborgsallén 19, 621 81 Visby
www.gotland.se

Jag är inte så bra på den juridiska biten. Men jag tror att man kan gå vidare här. Men, jag tänker även att ja kanske inte ska plåga någon tjänsteman med detta över semestern, så ärendet kan ”vila” lite.

Men ändå: Region Gotland har resurser att leta upp prejudicerande domar som argument för att låsa in data från medborgarna. Är detta ett öppet samhälle eller en byråkratisk järnbur?

Del 2: Den teknologiska strategin

Parallellt med denna lilla juridiska ordväxling (to be continued) så testade jag även att se vad man kunde få ut av den existerande sökmotorn som är ”fri” för medborgarna att använda.

Om inte myndigheter kan ge medborgardata så kan man använda sig av medborgarprogrammering för att öppna data. I Spinozistisk mening behöver ibland Staten en intervention, en slags ”uppgradering”.

Nu blir det lite tekniskt (men egentligen är detta bara en form av applicerad sociologi som arbetar utmed linjen offentligt/icke-offentligt)

För att få maximalt antal träffar i sökmotorn sökte jag på %s%almedalsveckan.info. Denna sträng genererar 3823 träffar, vilket bör vara det ungefärliga totalurvalet.

Screenshot from 2016-07-04 17-58-20

När sökningen är klar kan man ladda ned resultaten som en pdf. Denna pdf-fil kan man enkelt konvertera till html med det anspråkslösa programmet pdftohtml.

$ pdftohtml almedalen_2016.pdf

För att sedan extrahera länkarna till varje programpunkt, är det inte svårare än att man komponerar ett reguljärt uttryck medelst egrep och skriver länkarna till en ny fil:

$ egrep -io 'http://www.almedalsveckan.info/event/user-view/[^\"]*' almedalen_2016s.html > almeurl.txt

För att sedan hämta alla länkar och därefter extrahera den data man vill ha i varje programpunkt har jag skrivit ett litet Pythonskript som man kan läsa och ladda ned här. Hela filarkivet finns på Github under det kryptiska namnet AlmeScraper.

Resultatet: En CSV-fil med några centrala data (Arrangör, Kontaktperson1, Kontaktperson2, Sökord, Ämnesområde).

Det hela kan göras mycket snyggare beroende på vilken data man vill åt. Se det mer som ett proof of concept än en exakt reproduktion av det slutna programmet.

Om övervakning

Jag skriver inte så ofta om övervakning längre, men i kölvattnet av den senaste tidens terrordåd skrev jag ändå en debattartikel i Expressen. Egentligen manar jag mest till eftertanke snarare än handlingskraft. Det är inte så genomtänkt att stifta övervakningslagar direkt efter ett dåd, något som historien visar.

När det kommer till diskussionen kring huruvida polisen ska få hacka sig in i folks datorer, vad man på tyska så vackert kallar för Staatstrojaner, så har jag blandade känslor. När denna typ av övervakning används av president Mubarak framkallas genast bilden av en mycket totalitär form av övervakning. Samtidigt utgör detta tillvägagångssätt en mycket riktad form av övervakning, alltså, motsatsen till ”massövervakning”. Vad säger ni?

SOUminarium på Kungliga Biblioteket

Den 20e oktober anordnar Kungliga Biblioteket ett seminarium med titeln #SOUhack.

Under 2015 har Kungl. biblioteket digitaliserat och tillgängliggjort Statens offentliga utredningar, SOU:er, från 1922 till 1999, totalt ca 5600 dokument. Flera forskare har analyserat materialet och denna workshop syftar till att dela erfarenheter mellan forskare från olika discipliner och andra som är intresserad av textanalys.

Jag kommer att prata kort under titeln ”Statens röst digitaliserad?”. Exakt vad som menas med ”stat”, ”röst” och ”digitaliserad” är en öppen fråga. Något jag inte borde missa?

Det mest intressanta med seminariet tänker jag är det ”open space/hack” som anordnas efter lunch. Ser fram emot att diskutera idéer kring vad som kan göras med materialet framöver.

Vilka universitet nämns i Statens offentliga utredningar?

Jag funderar på ytterligare en dimension i SOUerna som ”kunskapsform”. Vilka universitet och högskolor nämns i utredningarna? Man kan anta att ett sådant omnämnande har två huvudsakliga orsaker. Antingen äger det rum när expertis från universiteten inkorporeras i utredningarna (professor X från Lunds Universitet, forskning vid Malmö högskola), eller när högskoleväsendet som sådant utreds.

Eventuellt skulle detta kunna vara ett alternativt sätt att mäta det som så populärt (och problematiskt) kallas för ”impact” eller ”samverkan”, givet att man kan antingen separera eller vikta de två olika ovan nämnda orsakerna till omnämning

Ambitionen är inte här att skapa ett sådant mått, utan att bara att visa hur mått kan skapas på väg mot en mätkritik av måtten. Måttkonstruktivism helt enkelt, i sin mest bokstavliga betydelse.

\\

Jag tänker att det borde vara ganska enkelt att med grova verktyg kunna göra en första insamling.

Följande lilla uttryck:


\s[A-Z]([^\s]*)\s(universitet|högskola)

Ger sökträffar i stil med:


381:samma universitet C O . Häggquist, dåvarande docenten vid Göteborgs högskola, professorn vid Stockholms högskola S. I. Karling, överbibliotekarien
390:förslag i tre promemorior, betecknade »P. M. angående Uppsala universitets drätselverk», P. M. angående Uppsala universitets kansli» och »P. M.
391:angående organisationen m. m. vid Lunds universitets kansli och räntekammare». Promemoriorna, som äro dagtecknade den 30 juni, den 3 september
398:15 januari 1947 till departementschefen avgivit en promemoria rörande Göteborgs högskolas ekonomiska ställning. Vid handläggningen av denna fråga
399:har beredningen biträtts av sekreteraren vid Göteborgs högskola, filosofie

Uttrycket säger ungefär: ”hitta allt som börjar med ett mellanslag, därefter en stor bokstav, därefter vad som helst förutom ett blanksteg, därefter ett mellanslag och sist antingen ordet ”universitet” eller ”högskola””. Uttrycket är väldigt snällt för att det går enkelt att hämta stadens namn i första parentesen och universitet/högskola i andra parentesen (ex. som $1, $2, Tyvärr ger denna sträng även några anomalier, exempelvis:


För högskolans
I universitetsstaden
En universitetslärare

Dessa går dock att sortera ut med en liten stoppordslista i ett senare skede. Vad man dessutom missar är nya uttryck såsom ”Mittuniversitetet”, ”Högskolan Väst” osv. Funderar vidare på hur dessa kan matchas.

Jag tänkte sedan stoppa in dessa uttryck i några små program. Men först kastar jag bara ut denna lilla anteckning och ni som vill kommentera är mer än välkomna att göra så.

SOUernas geografi

Var är Sverige utrett? Oftast frågar man efter hur och så tänker man sig att svaret skulle vara av kvalitativ art. Men det finns en annan väg, givet att man vet exakt vilka platser som har skrivits ned i alla statliga offentliga utredningar. Rad för rad. I denna bloggpost och instruktion hade jag tänkt att försöka mig på att ta ett steg närmare en sådan empirisk datamängd.

En spännande teoretisk fråga man då kan ställa sig handlar om hur staten ”blir till” (performativt) genom att utreda ort för ort. På samma sätt som ett nätverk av ryska gasledningar kan göra anspråk på ett territorium, kan ett nätverk av utredningar sakta men säkert släppa på och av flöden av ”statsgas” som letar sig ända ut i skogarna och värmer (eller kyler) stugorna med en känsla av att tillhöra ”staten Sverige”.

Nationens gränser finns inte, de måste hela tiden (om)skapas.

Jag tänkte med denna bloggpost lägga ut steg för steg hur jag har lyckats extrahera alla ortnamn ur SOUer 1922–1996. Jag lägger ut all rådata och alla steg i bearbetningen. Det blir kanske inte så läsvänligt, men å andra sidan kan alla mina steg replikeras och kritiseras så att datan blir fullt användbar för vem som helst att använda eller publicera. Dessutom krävde det hela mycket datorkraft, så det är en miljöinsats att använda mina filer.

Med andra ord, det är alltså fritt fram att göra vad ni vill!

\\
Steg 1 – Extrahera ortsnamn
Detta tog en vecka. I skripten som Peter Krantz publicerade finns lista på ortsnamn som man kan matcha mot alla SOUer med hjälp av:


grep -owf features.txt data/30tal/*.txt > trettiotal.txt

Jag körde detta för varje katalog i åtta screens på en riktigt snabb server. I detta läge använder sig grep av Aho Corasick strängmatchning. Den letar alltså efter träffar från en (jättelång) lista av ord och så printar den ut dessa till en fil. Kanske hade jag kunnat distribuera processorlasten över alla 32 processorer i mitt system, men jag ville heller inte krascha maskinen som delas med andra. Den råa datamängden från detta kan laddas ned som:

Men dessa filer innehåller massvis av skräpdata och är bökiga att arbeta med statistiskt. Således måste de bearbetas.

\\

Formatera data

För att göra datamängden statistiskt läsbar började jag karva fram variablerna Årtal, SOU-Nummer och Ortnamn enligt följande trixande med reguljära uttryck (kommentera gärna om ni har smidigare lösningar).

Först gjorde jag en första grov extrahering av Årtal (\d{4}), Nummer (:\d{2}) och sedan Ortsnamen som kommer sist på varje rad (.*):


ag -o '\d{4}:\d{2}.*(?<=:\d{2}.txt:).*' SOU1922-1996.txt > 1.txt

Sedan gjorde jag två olika versioner. Den första filen (2.6Mb)inneåller År, Nummer, Ort och gjordes om till en kommaseparerad fil med ett enkelt perl-handgrepp:


perl -p -i -e 's/.txt:/, /g' 1.txt

Men, för enkelhets skull gjorde jag även (2.4Mb) en version med bara År och Ort ur ovanstående fil:


perl -p -i -e 's/:\d{2}//g' 1.txt

\\

Stoppord

Men nu framträder ytterligare ett problem. Ortnamn, speciellt svenska ortnamn, har ju ibland betydelser även i vardagsspråket. Staden Kista och en sådan där trälåda man läggs i när man dör, stavas likadant. Ännu värre blir det med orten ”Vi” eller ”Gran”. Jag började först med att bläddra igenom filerna induktivt och hittade själv följande lista:

Vi|Bet|När|Bön|Håll|Mark|Böj|Vad|Färjan|Kap|Så|Alla|Verksamheten|Vecka|Källa|Varmvattnet|Hallen|Bo|Gran|Björk|Viken

Men detta var väldigt tidsödande, så jag frågade runt i sociala medier och fick massvis av svar. Här är de jag samlade in i går kväll:

Lyckan|Önska|By|Ön|Holmen|Strand|Vara|Mannaminne|Ensamheten|Bor|Kärleken|Skara|Bro|Viken|Skruv|Tving|Råda|Torp|Näs|Berg|Lugnet|Torp|By|Sand|Slut

För att sortera ut dessa falska positiver använde jag mig av lite perl.


perl -p -i -e 's/^.*\b(Vi|Bet|När|Bön|Håll|Mark|Böj|Vad|Färjan|Kap|Så|Alla|Verksamheten|Vecka|Källa|Varmvattnet|Hallen|Bo|Gran|Björk|VikenLyckan|Önska|By|Ön|Holmen|Strand|Vara|Mannaminne|Ensamheten|Bor|Kärleken|Skara|Bro|Viken|Skruv|Tving|Råda|Torp|Näs|Berg|Lugnet|Torp|By|Sand|Slut|Mom)\b//g' test.txt

Detta tar bort alla rader som innehåller något av ovanstående ord. Däremot lämnar det kvar blanka rader som jag tar bort med:


perl -p -i -e 's/^(\s*|\r|\n)$//mg' test.txt

Av någon anledning fanns fortfarande orten ”Så” med, så jag fick köra en ny vända med:


perl -p -i -e 's/.*Så//g' test.txt

Och sedan ta bort blanka rader igen.

\\
Datamängden

Sedan är det bara att döpa om txt-filen till .csv. Och så har vi datamängden SOU1922-1996artal-ort-filtered.csv.zip (1.5Mb).

Denna kommaseparerade fil borde man kunna läsa in rakt i Excel om man vill. För att göra allt replikerbart har jag dock bara gjort lite enkel statistik i R. För att skapa en enkel lista över orter i SOUer (i fallande ordning), kör jag bara (byt ut sökväg):


mydata <- read.csv("/home/anon/Desktop/SOU1922-1996artal-ort-filtered.csv") sink("Platserfrekvens.txt") df <- as.data.frame(table(mydata$Place)) ; df[order(df$Freq, decreasing=T), ]

Här instruerar jag R att skriva ut hela resultatet till filen Platserfrekvens.txt vars topplista ser ut så här:

Stockholm 73039
Göteborg 28937
Uppsala 26130
Malmö 20032
Danmark 17324
Norrland 15245
Örebro 14191
Lund 14143
Kalmar 10821
Bohus 8124
Frankrike 7372
Umeå 6948
Gävle 6569
Norrköping 6013
Västerås 5777
Luleå 5389
Skåne 5249
Linköping 5125
Karlskrona 5015
Hälsingborg 4695
Växjö 4190
Os 4069

Jag antar att "Os" är ytterligare en sökanomali. Stoppordslistan måsta alltså uppdateras.

Men detta vara bara ett test och ett sätt att få ut datamängden så att ni andra kan börja tinka med den. Det borde vara enkelt att skapa fina grafer över tid, kanske ned till varje enskild rapport. Det skulle även vara helt magnifikt med en sverigekarta som över tid uppdaterades dynamiskt med en "prick" på kartan varje gång en SOU nämnde en ort. Då skulle man, precis som med tekniska nätverk, se precis var någonstans det finns "täckning" och var någonstans det finns "vita fläckar". Tänk en täckningskarta för mobiltelefoner.

Kommentera mer än gärna. Vad finns det mer för idéer?

Statens bruk av termerna ”lappar” och ”samer” – en arkivsökning i SOUer och ett metodförslag

På DN-debatt skriver ett antal forskare om Rasbiologiskt språkbruk i statens rättsprocess mot sameby. En central kritik består av att staten lutar sig mot ett rasbiologiskt och förlegat språkbruk:

Staten tar sig även rätten att omdefiniera samisk etnicitet och återinför dessutom den förlegade och nedvärderande benämningen ”lapp”.

”[D]et har ju talats om lappar förr i tiden och nu talas det om samer, men det där är inte riktigt samma sak, eftersom lappar det var nomaderna utan avseende på etnisk tillhörighet, medan samer är en etnisk grupp. […] vi tycker att det är viktigt att hålla isär dom här begreppen och kommer därför att försöka tala om lappar när det handlar om nomader och människor som levde av lappmannanäringar som var jakt, fiske och renskötsel.” (Gällivare Tingsrätt 2/6 2015)

Detta språkbruk skulle kunna vara hämtat från rasbiologins tid och vittnar om en förvånande okunskap om historiska förhållanden.

Den äldsta referensen hos författarna till artikeln är från 1976. Det är givetvis så att det är svårt att få plats med mera stoff i en debattartikel. Men eftersom vi numera har statens röst digitaliserad och sökbar är det enkelt att verifiera (eller falsifiera) författarnas påståenden (instruktion nedan).

Genom att söka på begreppen ‘lappar’ och ‘samer’ i alla Statens offentliga utredningar mellan 1922 och 1996 får vi två (massiva) sökresultat:

Givetvis får man manuellt sortera bort sökanomalier för ‘lappar’ när det betyder ”papperslappar”. Men redan här får man intressanta ledtrådar till ett historiskt ”språkbruk”.

Några exempel:

SOU 1928:17

(karies) påträffats hos eskimåer till en utbredning av ungefär 2 %\ hos australier 20.4 %; hos negrer 26..”) %; hos lappar 4.5 %.

SOU 1936:23

Med fullt duglig renvaktare förstås lapp, som besitter fullständig arbetsförmåga och har fyllt 18 år.

SOU 1950:22

vara avsedda för den nomadiserande lappbefolkningen men i mån av utrymmen även stå öppna för andra lappar som i levnadssätt och vanor kunde jämställas med de nomadiserande.

Ser man istället till användningen av ‘samer’ så förekommer detta uttryck först 1950.

Detta var bara ett exempel. Nedan följer några ingångar till den som vill söka vidare.

\\
Metod

För er som har laddat ned alls SOUer är det bara att ställa sig i katalogen och köra någon av följande alternativ (de gör ungefär samma sak men ag är snabbast):


ag ' lappar '

grep -Ei -r ' lappar ' .*

find . -exec cat {} + | perl -ne "print if / lappar /"

Byt ut ‘ lappar ‘ mot ‘ samer ‘. Lek sedan lite med reguljära uttryck för att precisera. När ni har en bra söksträng är det bara att lägga till > fil.txt så får man en behändig lista.

Relationer i SOUniversum

Att lägga ut sorlet från SOUer visade sig leda till intressanta uppslag. Bland annat har idé- och vetenskapshistorikern Gustav Holmberg gjort en inventering av amatörbegreppet genom hela SOU-korpuset, Copyriot har skrivit, och Peter Krantz på KB har gjort en graf av datamängden.

Väldigt roligt! Nu kommer en uppföljning som bitvis är teknisk, men som bör läsas mera som en humanvetenskaplig ingång som har råkat ta hjälp av några digitala verktyg.


Work in progress alltså! Det är inte vackert, men det kommer en bild på slutet!

Jag tänker att det finns två approacher till materialet; data och metadata. Att söka i innehållet (data) visar sig vara mycket kraftfullt, speciellt om man tillämpar sökverktyg som är snabbare än grep. Men här tänkte jag ge ett litet uppslag till hur man kan extrahera/skapa metadata ur SOUerna. Exakt vad det skulle vara användbart till vet jag inte riktigt ännu, men ibland måste data komma före frågorna för att man ska veta vad man ska fråga.

Inspirerad av Peter Krantz graf, började jag harva runt i SOUerna för att hitta regelbundenheter som går att ta som utgångspunkt för relationer mellan texterna. En sådan regelmässig konvention tycks vara hur man anger SOU som en källa: årtal kolon nummer, exempelvis 1945:68, eller 19\d{2}:\d{2} med reguljära uttryck.

Om jag nu ställer mig i katalogen för varje SOU som enskild fil (en sådan katalog skapas om man laddar ned och packar upp denna datamängd) så kan jag köra grep -r -Eo '19\d{2}:\d{2}' * för att söka efter detta mönster, som vi känner igen som en referens. Detta gör att datorn spottar ur sig ungefär:


20tal/Betänkande och förslag i fråga om kvinnors tillträde till statstjänster. - SOU 1923:22.txt:1923:11
20tal/Betänkande och förslag rörande understöd åt den civila luftfarten - SOU 1929:21.txt:1929:21
20tal/Betänkande om inkomst- och förmögenhetsskatt. - SOU 1923:70.txt:1923:41

Det fetade mönstret identifierar filnamnet för den SOU som vi läser ur och det kursiverade numret visar att datorn har hittat en referens till en SOU (inuti en SOU). Det är inte mera konstigt än att det finns referenser längst bak i en bok eller i en artikel. SOUer hänvisar till andra SOUer. Detta bildar ett litet SOUniversum som vi kan visualisera. Men vägen dit kräver att man processar detta brutala output till något som kan läsas av exempelvis Gephi. För att man ska få fina sociologiska monader måste man definiera vad som är noder och vad som är relationer i ett nätverk.

Det mest gångbara formatet för sociala nätverksdata är nog .gexf. Det är öppet, enkelt och läses av Gephi och Sigma.js.

Varje enskild SOU är en nod, och varje gång en SOU citerar en annan SOU har vi att göra med en ”relation”. Relationen som enskild händelse (haecceitet) kan vi inte veta så mycket om – någon eller några författare har skrivit en SOU och ”laddat ned” andra SOUer till sitt tänkande. Det enda spåret vi har bland de 166 miljoner rader (!) text som alla SOUer utgör är en ”referens”.

För att bygga om det output som vi fick ovan till .gexf-formatet så körde jag några ”hemmasnickrade” regex-sökningar. Jag tar inte alla detaljer utan skissar mest några exempel. På denna sträng:

20tal/Betänkande och förslag rörande understöd åt den civila luftfarten – SOU 1929:21.txt:1929:21

Kan vi ta allt före den första noden – 1929:21 – söka upp med ^(.*?)SOU som vi ersätter med source=". Sedan kan vi söka efter \.txt: och ersätta med " target=". Några vändor fram och tillbaka börjar vi närma oss relationer, som bör se ut ungefär så här:


source="1951:13" target="1948:42"
source="1951:13" target="1948:42"
source="1951:13" target="1948:42"
source="1951:13" target="1945:51"
source="1951:13" target="1945:51"
source="1950:21" target="1926:18"

Men, för att de ska begripas måste de numreras. Det går att lösa med ett enkelt pythonskript som ungefär lyder:


#!/usr/bin/python

items = [‘source=”1951:13″ target=”1948:42″‘, ‘source=”1950:21″ target=”1926:18″‘, ‘source=”1950:21″ target=”1926:18″‘, osv. alla edges efter varandra.]
number = 0
for item in items:
print(number, item)
number = number + 1

Skriptets output kör man sedan > fil.gexf, så har man en numrerad lista på alla relationer. Med detta gjort är det bara att fortsätta att sök-ersätta med reguljära uttryck tills man börjar få något i stil med:


edge id="0" source="1951:13" target="1948:42" /
edge id="1" source="1951:13" target="1948:42" /
edge id="2" source="1951:13" target="1948:42" /

Därefter tar man alla unika SOU-nummer och skapar en lista. Enklast är att ta filen man sparat med ovanstående information och bara suga ut varje enskild SOU med grep -Eo '19\d{2}:\d{2}' fil.gex > baranoderna.gexf. För att sedan spara lite plats kan man ta och radera duplikata nummer. Sedan kan man bygga noder som ser ut så här:

node id="1951:13"

Men för att det ska bli komplett ska varje nod ha en ”label”. För att göra labels till noderna kan man göra ungefär så här i en avancerad texteditor så som Textwrangler eller Notepad++ (glöm inte att slå på Grep).

Find

node id="(19\d{2}:\d{2})" /

Replace

node id="\1" label="\1" /

Så får man snyggt:


node id="1951:13" label="1951:13" /
node id="1948:42" label="1948:42" /
node id="1945:51" label="1945:51" /

(allt detta ska sedan vara inom < > i .gexf-filen)

Fint. Resten är bara en fråga om lite meta-uppmärkning och vi har oss en .gexf-fil som går att öppna i Gephi.

Pust. Det är nu jag tänker att någon som kan programmera kan göra allt detta så mycket fortare/smidigare. Men, skam den som ger sig!

Med lite modularitetsfilter för att lägga färger och ”degree” för att göra noderna större ju oftare de är citerade får vi en sån är liten bild:

50talet

SOU 1956:39 heter Offentliga byggnader och verkar vara den mest omtalade och citerade ”nätverkade” SOUn under 50-talet (Degree, dvs. både inkommande och utgående länkar) (jag begränsade min datamängd till 50-talet för detta test). Om vi visualiserar med raka relationslinjer ser vi tydligare riktningarna på citeringarna.

Detta var bara ett test och proof of concept. Kanske finns det något i detta som ger uppslag till tankar och funderingar på hur man kan forska vidare.

Monadologiska försök att kartlägga nätverk där [POL] korsar [REF] i fallet medborgarvetenskap

Under hösten har jag dykt ned i forskning om medborgarvetenskap i projektet Taking Science To the Crowd. Eftersom projektet är internationellt har jag inte skrivit så mycket om det här, utan istället bloggat på engelska eller lagt tentativa analyser i projektets wiki.

Men ibland kan det vara bra att skriva ut tankarna även på denna blogg. Ofta funderar jag nämligen på hur man skulle kunna navigera sig fram i det mångtydiga fältet Citizen Science med hjälp av nätverksanalyser i det ”datascape”datalandskapet – som uppstår när en börjar följa olika aktörer.

Några utgångspunkter: Medborgarvetenskap skapar vad Latour kallar för referens [REF]. Samtidigt bedrivs medborgarvetenskap ibland av aktivister som söker bilda opinion kring olika sakfrågor. De arbetar alltså med att frambringa politiska cirklar i syfte att skapa politisk representation.

Referens [REF] och representation [POL] är två helt skilda existensmodi. Det förra skapar referenskedjor med hjälp av inskriptioner som mobiliserar världen, vilket leder fram till vetenskapliga publikationer. Det senare skapar tillfälliga autonoma punkter av representation som mobiliserar massorna(s fantomer). Det förra är relativt beständigt, det senare är flyktigt och försvinner så fort det inte mobiliseras.

Det intressanta tycker jag är när dessa två existensformer korsar varandra. Alltså, när politik och aktivism bedrivs med vetenskap och vice versa. Då får vi exempelvis medborgarvetenskap som räddar fisk i Mekongfloden, gör motstånd mot oljebolagen i Louisiana eller tillverkar instrument för att mäta oljespill. Vissa talar till och med om Extreme Citizen Science som en helt ny form av aktivism, utrustad med vetenskapliga metoder snarare än plakat och banderoller.

Men, vad är det som händer egentligen när en bedriver politik med vetenskap och vetenskap med politiska forskningsfrågor? En modernist skulle genast få kalla fötter. En kan ju inte blanda samman vetenskap och politik! Då rasar den objektivitet som präglar riktig forskning. Men även politiken kollapsar; om vi tar ”genvägen” via vetenskapliga fakta får vi en ytterst odemokratisk politik, en teknokrati!

Latour är dock inte speciellt orolig. Det är precis i dessa korsningar, i dessa mellanrum, som det sker intressanta saker.

Korsningarna, tänker jag, borde gå att studera genom analyser av de nätverk som utgör infrastrukturen. Här kommer några ytterst tentativa analyser.

\\

När en följer nätverk finns det ingen given mittpunkt att börja i. För ett tag sedan tog jag utgångspunkt i den publicerade vetenskapliga litteraturen. Då får man en bild av de citeringsnätverk som präglar medborgarforskningen.

Men vetenskapliga publikationer är givetvis bara en sida av de ytterst heterogena nätverk som skapar medborgarforskning. Visualiseringen ovan är en inzoomning på det fält av miljövetenskap/ekologi som dominerar medborgarforskningen. Men en sådan bild döljer alla de projekt som inte publicerar sig i kollegiegranskade tidskrifter.

Så, en kan likaväl börja i en annan ände: ”blogosfären”. Med hjälp av Issuecrawler skrapade jag länkar från 12 meborgarvetenskapsbloggar.

Här ser vi hur samma ekologi/miljövetenskapliga kluster finns representerat i nedre vänstra hörnet. Men vi ser även hur olika medborgarforskningsprojekt hakar in i sociala mediers plattformar (inzoomning nedan) och i viss mån till mera traditionella medier (Guardian, Scientific American, Nature osv.). Men, vi ser även hur det finns starka länkar till olika statliga (amerikanska) institutioner (.gov).

Länken till amerikanska myndigheter och forskningsfinansiärer blir ännu tydligare in en mycket större analys jag gjorde på 522 forskningsprojekts hemsidor. Här ser vi en oerhörd dominans av amerikansk forskningspolitik (pdf för större bild):

Medborgarforskning kostar pengar, även om tusentals människor arbetar gratis med att genomföra observationer och klassifikationer av data. Men det är inte så enkelt att vi kan dra likhetstecken mellan de gröna noderna i nätverken (.gov) och ”kapitalflöden”. Så enkla är aldrig nätverken. Medborgarforskningen befinner sig i korsningen mellan [POL] och [REF]. En länk kan alltså även betyda att forskningsprojekten vänder sig emot en myndighet i syfte att påverka exempelvis ett visst beslut eller myndighetsutövande.

Se även pdf.

Analyserna ovan är bara preliminära och översiktliga. Helheten är alltid mindre än delarna. Nyckeln till att hitta kvalitéer i datalandskapet är att zooma in, länk efter länk. Det är först då som tröskeln blir uppenbar och visar sig empiriskt.

Ibn Khaldun och gruppsolidariteten

Warning: preg_replace(): Unknown modifier 'd' in /storage/content/52/153752/christopherkullenberg.se/public_html/wp-content/plugins/jetpack/class.photon.php on line 331 Warning: preg_replace(): Unknown modifier 'd' in /storage/content/52/153752/christopherkullenberg.se/public_html/wp-content/plugins/jetpack/class.photon.php on line 331 Warning: preg_replace(): Unknown modifier 'd' in /storage/content/52/153752/christopherkullenberg.se/public_html/wp-content/plugins/jetpack/class.photon.php on line 331


Sehname-i Selim Han 68a” by Nakkas OsmanBilkent University. Licensed under Public domain via Wikimedia Commons.

Första gången jag snubblade över Ibn Khaldūn var när jag läste kapitlet Nomadologin i Tusen platåer för många år sedan. Men på den tiden var jag fortfarande itutad den västerländska myten om Moderniteten, så jag avfärdade snabbt tanken på att läsa ett ”sociologiskt verk” publicerat före typ 1830. Något senare började jag tvivla på min ”postmodernistiska dogmatism” (tanken om de uppstyckade epokernas totala inkommensurabilitet) och skrev bland annat i förordet till ”Tre klassiker” att sociologins kanon borde flytta sina gränser bakåt i i historien. Kanske till och med utanför Europa. Men, det är ju lätt att metakommentera kanonkonturernas former, istället för att ta tag i innehållet.

Men under sommaren skärpte jag mig och började läsa Muqaddimah, eller Prolegomena : en introduktion till världshistorien som den heter i svensk översättning av Ingvar Rydberg. Här kommer således några anteckningar från min läsning. Men först åter till Tusen platåer och citatet som fångade min uppmärksamhet från första början:

Ibn Khaldūn defines the nomad war machine by: families or lineages PLUS esprit de corps. The war machine entertains a relation to families that is very different from its relation to the State. In the war machine, the familiy is a band vector instead of a fundamental cell; a genealogy is transferred from one family to another according to the aptitude of a given family at a given time to realize the maximum of ”agnatic solidarity”. Here it is not the public eminence of a family that determines its place in a State organism but the reverse: it is the secret power (puissance), or strength of solidarity, and the corresponding genealogical mobility that determine its eminence in a war body. 1

Deleuze och Guattari använder Ibn Khaldūn på ett ganska avancerat sätt. Genom att stoppa in (eller kanske ”dra ut”) sitt eget krigsmaskinbegrepp ur hans Muqaddimah har de så att säga fått syn på en ”krigsmaskin” i Ibn Khaldūns arbete; om man kombinerar ”släktlinjer” med ”esprit de corps”, som syftar till begreppet asabiyyah, som i sin tur kan översättas med ”gruppsolidaritet”, får man en öknens krigsmaskin. Men Deleuze och Guattari ser även en social organisering som skiljer ut sig från Statsapparatens fundamentala celler. Gruppsolidariteten föregår de traditionella moderna organisationsformerna, där social status uppnås genom att man intar ”offentliga” positioner i en på förhand given samhällshierarki (det som den europeiska sociologin var så förtjust i). Istället är gruppsolidariteten en primär och ”hemlig” kraft, en virvelvind i öknen, en slags konspiration mot allt offentligt, ett heligt och obrytbart band.

Deleuze och Guattari är givetvis inte ahistoriska i sin läsning, utan ger istället följande kryptiska uppslag till hur man kan använda sig av Ibn Khaldūns begrepp idag:

Of course, the great bodies of a modern State can hardly be thought of as Arab tribes. What we wish to say, rather, is that collective bodies always have fringes or minorities that reconstitute equivalents of the war machine – in sometimes quite unforeseen forms – in specific assemblages such as building bridges or cathedrals or rendering judgements or making music or instituting a science, a technology … (p. 404)

Den väg som stakas ut i Tusen platåer är dock djupare influerad av Ibn Khaldūn än vad som medges i Nomadologi-kapitlet. Deleuze och Guattari är besatta av ”minoriteter” i alla dess former (inte bara mänskliga); vad det innebär att verka från en utsida, en periferi eller från underjorden. Detta hänger samman med betoningen på tillblivelser (becomings), eller vad Tarde kallade ”innovationer”. Alltså, Deleuze och Guattari är intresserade av de kreativa och destruktiva utkanterna av alla aktiviteter, de händelser (events) som innebär ett kvalitativt genombrott eller förändring, snarare än den stora massans numeriska produktion av ”sammahet”. Det är här som Ibn Khaldūn blir en mycket intressantare sociolog än Durkheim.

Vad det är som föregår den ordning som sedan kommer att nedtecknas, göras officiell, bli ”symbolisk”? Vad konstituerar ”barbariet” som föregår all ”civilisation”, och hur kan detta tänkas som processer snarare än som exteroriteter? För att svara på den frågan måste man gå till Muqaddimah och begreppet gruppsolidaritet (asabiyyah).


Mosaic Tribes” by Ori229Own work. Licensed under Public domain via Wikimedia Commons.

Gruppsolidariteten

Det första man måste ha i åtanke när man läser Muqaddimah är att den är skriven i en tid av kris och förfall. I slutet av trettonhundratalet, från Andalusien till Nordafrika – Ibn Khaldūns primära verksamhetsområde – föll kungadömena isär. De ”civilisationer” som hade förvaltat och utvecklat vetenskaperna, filosofin och medicinen ”gick förlorade” (tolkningsflexibilitet råder beroende på vilken sida om Gibraltar sund man står på kring 1492). Ibn Khaldūn såg sig primärt som en historiker och en av hans ambitioner var att hitta en förklaring till varför civilisationer uppstår och försvinner. För att förstå denna process kontrasteras först och främst öknen mot staden – ingen sociologi utan ett territorium 2 – och sedan (åter)uppfinner han begreppet asabiyyah 3, gruppsolidariteten, för att beskriva den sammanhållande kraften i en grupp.

Ibn Khaldūns gruppsolidaritet ser till en början ut som ett Aristotelisk-teleologiskt begrepp. Det ursprungliga läget är beduinstammens (bland kallar Ibn Khaldūn dem för ”araberna”, vilket naturligtvis inte är i närheten av den moderna betydelsen) känsla av ”rasmässig 4 överlägsenhet” (s. 134) i öknen. Denna laglösa 5 men strukturerade sammanhållning har härdats genom det enkla och karga livet i öknen och är en nödvändighet för överlevnad. För att livnära sig under de svåraste omständigheterna krävs en blind tillit och en direkt och kompromisslös solidaritet mellan stammens medlemmar. Beduinerna är i sitt ursprungsläge ”goda” och ”modiga”, men de är även krigiska och strävar efter att erövra och härska 6.

Alla arabernas [beduinernas] aktiviteter leder till förflyttningar och rörelse. Det är motsatsen till bofasthet som frambringar civilisation” /…/ ”Deras [beduinernas] själva existens är motsatsen till byggande som är civilisationens grundval (150).

Men förr eller senare kommer beduinerna att anfalla städerna. För på samma sätt som det finns en slags ”ren” gruppsolidaritet, innehåller den samtidigt ett frö till civilisation 7. Och civilisation, enligt Ibn Khaldūn, innebär monarki som erövras genom strid; ”det är således uppenbart att kunglig myndighet är gruppsolidaritetens mål” (142). Beduinismen, detta primära stadium av nomadism i öknen, innehåller ett telos – ”den kungliga myndigheten” – som den strävar efter tills den kollapsar. Deleuze och Guattaris begreppspar krigsmaskin/Statsapparat ekar dovt i ökensanden.

När beduinerna har intagit staden och etablerat sin kungamakt inleds en civilisationsprocess. Livet i staden är specialiserat och bekvämt. Här uppstår arbetsdelning till flera olika yrken och administrationen får det allt bättre. Genom beskattning kan härskarna leva ett liv i lyx eftersom ”att vanor bestämmer den mänskliga naturen och karaktären” (140). ”De [beduinerna] antar kungliga vanor i fråga om bostad och klädsel, något som de betonar och blir alltmer stolta över ju mer lyx och myckenhet de skaffar sig” (142). Men, i staden avtar samtidigt gruppsolidariteten. Lyxlivet och arbetsdelningen, den självgående civilisationen, gör den absoluta tilliten och solidariteten överflödig. I stadens lyx kan man vara självisk och vända sig bort från andra. Men när gruppsolidariteten urvattnas påbörjas samtidigt sammanbrottet: ”Lyx förverkligar monarkin och eliminerar den” (148). Istället för Aristotelisk teleologi (som säkert influerade Ibn Khaldūn, han citerar Filosofen redan in introduktionen) är gruppsolidariteten i det närmsta ett cykliskt begrepp, även om det är oklart huruvida det automatiskt påbörjas en ny cykel efter sammanbrottet.

Ibn Khaldūn ger en rad historiska exempel på hur denna process mellan beduinism och bofast civilisation har sett ut.

Särskilt invånarna i Spanien har glömt bort blodsbanden och deras betydelse, därför att så lång tid har gått och därför att de som regel inte behöver gruppsolidariten då deras land har förintats och tömts på sina stamgrupper. (155)


Camel Rider 1413 Mecia Viladestes map” by Mecia de ViladestesMecia_de_Viladestes._Carte_marine_de_l’océan_Atlantique_Nord-Est,_de_la_mer_Méditerranée,_de_la_mer_Noire,_de_la_mer_Rouge._1413.jpg. Derivative work: Walrasiad (talk). Licensed under Public domain via Wikimedia Commons.

Ett annat exempel är israeliternas uttåg ur Egypten. När de kom till öknen i Sinai saknade de gruppsolidaritet eftersom de hade varit slavar; ”Undergivenhet och foglighet bryter upp gruppsolidaritetens kraft och styrka” (143). Men när de under ledning av Moses hade tillbringat 40 år i öknen hade gruppsolidariteten väckts till liv inom dem. Den steniga och karga öknen hade fogat israeliterna samman, och gruppsolidariteten ”frambringa[de] förmågan att försvara sig, erbjuda motstånd, skydda sig och hävda sina rättigheter”. Först efter de 40 åren kunde de dra vidare och vinna det Heliga Landet. Men när de slog sig ned och formade en civilisationsprocess såddes samtidigt fröet till den egna undergången.

Beduinernas gruppsolidaritet är alltså det primära stadiet, medan bofastheten och civilisationen är sekundära. Man kan tänka ”beduinism” eller ”nomadism som processer. Ibn Khaldūns begrepp är inte kategorier, inte heller är de egentligen teleologier, utan istället riktningar. Kvalitativa förändringar mot ett mål (civilisation/kungamakt) som samtidigt innehåller sin egen upplösning.

Jag inser att detta nu blev lite långt. Jag får eventuellt fortsätta i nya inlägg. Om någon vågar sig utanför twitter och facebook, går det bra att kommentera.

Notes:

  1. /…/ This has to do neither with the monopoly of an organic power (pouvoir) nor with local representation, but is related to the potential (puissance) of a vortical body in a nomad space.
  2. ”Varje dynasti har ett bestämt territorium” (161)
  3. Ordet ”asabiya” användes enligt Rydbergs förord (s. 13) på ett annat sätt i tidigare litteratur och språkbruk. Då betydde det snarare ”klanmentalitet” i negativ mening, en hednisk och blind tro på den egna gruppens överlägsenhet. Ibn Khaldūn vänder asabiya till något positivt i Muqaddimah.
  4. Även här en har vi en historisk förvirring. Givetvis menas med ”ras” inte den moderna biologins eller den europeiska rasismens innebörder. Snarare skulle man kunna säga ”klanism” eller ”tribalism” här.
  5. ”Under arabernas herravälde lever människor utan lagar, i ett tillstånd av anarki” (151)
  6. ”När en given gruppsolidaritet har omfattats av ett visst folk kommer detta av naturen att söka dominans över folk med andra gruppkänslor än den egna” (141)
  7. ”Det är således uppenbart att kunglig myndighet är gruppsolidaritetens mål” (142)

Anonymous, Ask och samhället som helhet

Jag vaknar varje morgon till Sveriges Radios Ekot via min klockradio. Just idag möttes jag av nyheten att Beatrice Ask vill skärpa straffen för dataintrång.

Mot bakgrund av de DDOS-attacker utförda av högstadieungdomar i fawkeismens namn under förra veckan anser Ask att:

Vi måste på olika sätt mobilisera resurser för att se till att vi dels skyddar oss bättre, dels att vi markerar hur allvarligt samhället ser på den typen av attacker som ju undergräver det moderna samhällets funktion.

Undergräva det moderna samhällets funktion? Det är svindlande att man med sin dator på en håltimma med cirka tio minuters förberedelse kan delta i något som är så pass subversivt. Om vi jämför med Greenpeace-aktivisterna som i dagarna har brutit sig in på Ringhals och Forsmark ser deras aktion ganska futtig ut i jämförelse:

Men miljöminister Lena Ek ser det som hände som mycket allvarligare än så. Och hon kräver nu alltså en förklaring från Vattenfall och Eon, som driver de båda kärnkraftverken.

När det kommer till dataintrång är det en attack på samhällets funktion, men när det kommer till kärnkraftsverksintrång räcker det med en ”förklaring” från Vattenfall och Eon. Vad är det som gör att barnen på internet får hela ”samhället” att gunga genom att de gör några hemsidor otillgängliga i nån halvtimma?

När jag i förra veckan pratade om ”Anonymous” attacker i Studio Ett medverkade även Anders Ahlkvist på Rikspolisstyrelsen. Ahlkvist är väl medveten om att attackerna utfördes av femtonåringar och att det inte rör sig om något hot mot samhället. Det är dock helt logiskt att han tar chansen att sikta in sig mot en del av kakan när vi nu har en så lättlurad justitieminister som Beatrice Ask:

En straffskärpning skulle därför kunna fälla fler, tror Anders Ahlkvist.

– Det ena är att vi skulle kunna använda hemliga tvångsmedel, alltså hemlig övervakning av elektronisk kommunikation.

Jag, Marcin och Martin gjorde i förra veckan vårt bästa för att stävja denna hets om ”cyberkrig” och ”cyberterror”. Förhoppningsvis gick vårt folkbildande budskap fram till tänkande politiker. Däremot nådde de nog aldrig till justitiedepartementet.

Anonymous och Ask sitter i samma båt och bordet är nu dukat för att skärpa straff och öka övervakningen på internet. Förhoppningsvis får någon stopp på Ask. Den sakfråga som gjorde barnen på internet arga från första början har helt fallit i glömska. Var det tillslaget mot PRQ? Pirate bay? Julian Assange? Det spelar mindre roll nu när attackerna nu definieras som ett hot mot samhället som helhet…