Relationer i SOUniversum 2 : SOUlab

skriptet

I förra blogginlägget gick jag den långa omvägen till att bygga upp en nätverksfil som man kan visualisera med program som Gephi. Det var aningen krångligt, men ganska roligt.

Peter Krantz har skrivit en knippe pythonskript som gör allt mycket enklare. Bilden ovan (klicka för förstoring) är genererad på alla SOUer från 1922–1993, storleken justerad efter ”indegree”, dvs. ju fler citeringar en SOU får, desto större ”boll”. Exakt hur detta ska analyseras är något jag får återkomma till, så kommentera gärna!

Krantz skript är väldigt användbart men för att det ska gå att metodredovisa i detalj (ex. om man funderar på att publicera artiklar på materialet) måste man analysera enventuella felkällor.

SÅ jag tänkte att jag skriver ut en liten instruktion om hur man får igång skripten, dels för mitt eget minne, dels för om någon vill pröva själv. All kod är släppt under MIT licens av Krantz.

\\

Nu, över till terminalen.

1. Först och främst måste du ha Python installerat på din dator. Kör du Linux är det troligtvis redan installerat, annars är det lätt att hämta via distributionens pakethanterare. På MacOS går det att hämta här.

2. Python behöver några extra moduler. Dessa installeras med kommandot pip install peewee==2.6.1 lxml pygexf (lägg till sudo före pip i Linux).

3. Om du inte redan har gjort det, ladda hem alla SOUer som individuella textfiler och packa upp.

4. Om du har Git installerat kör du sedan bara:

git clone https://github.com/peterk/SOUlab.git

Annars kan du ladda ned och packa upp manuellt från Github-sidan.

5. Nu kan skripten börja köras. Det är tre stycken som körs efter varandra. Tänk på att hela tiden ange rätt sökväg, alltså till den katalog som blev till när du packade upp alla SOU-textfilerna:

python build_db.py /katalog/till/SOUfilerna
python parsesou.py /katalog/till/SOUfilerna
python gen_graph.py filnamn.gexf

Programmet bör då ge följande lilla meddelande om allt funkar


Writing to filnamn.gexf
SOU-grafen directed static
number of nodes : 4894
number of edges : 20943

.gexf-filen går sedan att öppna med Gephi.

Tack Peter Krantz för detta verktyg. Det sparar oändligt med arbete och eftersom det är öppet kan det användas för riktig forskning framöver!

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Time limit is exhausted. Please reload CAPTCHA.