Genuskontroll av Högskoleläckan

Ibland skrivs det i tidningen om att det är dålig stämning i en Facebookgrupp som heter Högskoleläckan. Gruppen startades av Ulf Dalnäs i december 2010 och har omkring tiotusen medlemmar. Dess primära inriktning är ”skvaller” från högskolevärlden, men för det mesta är inläggen som postas väldigt seriösa.

Jag blev lite nyfiken på vilka som kommenterade på Högskoleläckan, fast bara i sociologisk mening, givetvis.

Jag skrapade ned de cirka 5200 trådarna på Högskoleläckan innehållandes sammanlagt ungefär 24000 kommentarer. Jag anonymiserade datamängden. Sedan plockade jag fram algoritmen gendercounter som jag har skrivit primärt för Genuskollen, men som funkar utmärkt att importera som en modul för att analysera stora mängder namn genom att köra dem mot SCBs statistik över namn/kön från folkbokföringen.

Jag hittade 24210 namn i kommentarstrådarna. Dessa fördelade sig så här:

Kvinnor: 5837

Män: 15810

Obestämda: 2563

Vilket ger avrundar till procentfördelningen:

Kvinnor: 24%

Män: 65%

Obestämda: 11%

Kategorin ”obestämda” har flera förklaringar. För det första är det vanligt med utländska namn på en sida som har en förhållandevis internationell användarbas. För det andra så är det vanligt att Facebook-användarnamnen är smeknamn, exempelvis ”Peo” istället för ”Per-Olof” och att vissa anger efternamnet som förnamn, typ ”Svensson Sven”. På Facebook anger man förvisso kön i sin användarprofil, men jag ville inte riktigt anropa individer som sådana i denna lilla undersökning. Det är bra ändå med ett elvaprocentigt brus, eftersom det ger mycket bra data att mata tillbaka till gendercounter-algoritmen för att förfina den.

Högskoleläckan är så pass stor att den även uppvisar korrelationer med saker som händer i omvärlden. Till exempel Macchiarini-skandalen får ett bra kronologiskt avtryck, alltså, gruppens interaktioner går att relatera till händelser i ”omvärlden” (klicka för att förstora).

Screen Shot 2016-05-05 at 16.18.41

Resultaten ska tolkas med en nypa salt. De är framtagna med lite eftermiddagsprogrammering. Även om de är replikerbara är en elvaprocentig ”felmarginal” ändå inte helt obetydlig i sammanhanget.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Time limit is exhausted. Please reload CAPTCHA.