Offentligheten och imitativ strålning – konspirationsteoretiker och tangentbordskrigare

I förra inlägget skrev jag hur man tentativt skulle kunna studera imitativa strålar i digitalt material som man skrapade från Facebook. Här kommer ytterligare en trevande idé om hur man kan vaska fram vissa typer av beteenden som kan vara intressanta för att förstå det offentliga samtalets struktur.

När jag samlar data från Facebook har jag även sparat hashsummor av användarnas femtonsiffriga ID-nummer. Detta gör att jag kan följa individer genom hela materialet, fast utan att veta vem de är eftersom hashsumman inte är reversibel. Sociologi intresserar sig ändå inte för individer, och forskning handlar ju inte om att hänga ut någon (det lämnar åt journalistiken).

Men vad som är intressant tänker jag är att se vilka ”idealtypiska” nätbeteenden som man kan vaska fram. Ofta talas det ju om ”troll” och ”tangentbordskrigare”, fast sällan hänvisar man till empiri. Kanske finns det möjlighet att ändra på det, om vi experimenterar med samhällsvetenskapliga metoder litegrann.

Observera att det jag nu skriver om är enskilda kvalitativa exempel baserade på användarmönster, och inte något uttalande om fenomenens utsträckning (kvantitet, strålningsgrad).

\\

Först tänkte jag ge ett exempel på vad man kan kalla för en ”konspirationsteoretiker”. När jag söker jag på ”Bilderberg” i min datamängd kan man se att vissa individer ger ett speciellt avtryck om man visualiserar beteendet som ett nätverk (av imitativa strålar).

bilderberg1

Individen d3eb1 har kommenterat på Moderaterna, Centerpartiet och Socialdemokraternas Facebooksidor om Bilderberggruppen. Det här är vad hen säger (klicka för att förstora):

bilder4bilder3bilder2

En övertygad konspirationsteoretiker är dels missionerande och vill berätta för så många som möjligt. Men samtidigt känner hen sig begränsad av censur och inskränkningar i yttrandefriheten. Budskapet ska fram till varje pris, men priset en får betala är att bli tystad.

Den här typen av utläggningar är typiska:

/…/ de censurerar obekväma användare genom att radera deras inlägg samt tar bort deras möjlighet att kunna kommentera! De är under ALL kritik. För istället för att SVARA på sakliga frågor som folk ställer om socialdemokratiska partimedlemmar som springer på hemliga kontroversiella Bilderbergmöten och om den snedvinklade rapporteringen från Syrien, så RADERAR de inlägg,som de sedan förnekar att de har tagit bort och som jag nämnde tidigare, tar bort funktionen att kunna KOMMENTERA!! Är det DEMOKRATI DET? Jag kommer ALDRIG mer rösta på Socialdemokraterna. Ett gäng hycklare är vad ni är som kränker människors mest fundamentala rätt att få yttra sig utan att bli censurerad!!
Nu skall jag gå ut och skriva om det här på min blogg!!

En annan typ som vi ofta möter är ”tangentbordskrigaren”. I likhet med konspirationsteoretikern finns en missionerande ambition som vänder sig utåt och vill berätta överallt om ”sin sanning”. Tangentbordskrigaren detekteras ofta genom att man söker på något ”kritiskt” begrepp (ex. ”massinvandring”, ”flyktingpolitik”) och sedan zoomar in på en användare som rör sig över flera grupper; alltså, någon som har ett nomadiskt förhållningssätt till territorier (krigsmaskin, den ”lantliga fascismen”).

tangent

Användaren 2c2b9 rör sig över flera grupper när man söker på termen ”massinvandring”. Misstanken om att vi har att göra med en tangentbordskrigare stärks. Tar man fram vad hen säger genom hela datamängden ser man att hen täcker in ett stort territorium:

Centerpartiet|Är inte regeringens politik skäl nog för att misstroendeförklaras, vad är i såfall skäligt?
Centerpartiet|Framgår inte ett smack vad graferna står för mätdata. 😒
Liberalerna|Lägg ner tankar på att gå med i nato.
Fundera på vilka som låg bakom Palme-mordet…
http://www.friatider.se/oliver-stone-cia-bakom-statskuppen-i-ukraina
Nyheter Idag|Dom där snorungarna skulle kunna  vara barn till dom där ”ensamkommande barnen”.
I takt med att invandrare förgriper sig på svenskar så får SD ökat stöd, men visst är det MYCKET SYND att det i Sverige länge inte funnits någon större nationalistisk solidaritet i annat än sportsammanhang.
Expressen|Kom mördaren till landet genom från ett arabland genom ”fri invandring” eller var han en urinvåndare som blev förtryckt av arbetslinjen?!?
Sverigedemokratisk ungdom|Läckert kaxig reklam. Politik ska alltid vara aktuellt och det visar SD exemplariskt. Dock så tror jag inte Sverige blir bra direkt vid regeringsskifte 2018, utan då har sveriges ekonomi och demografi skadats något offantligt mycket om inte moderaterna öppnar både sina hjärtan och hjärnor och utlyser nyval tillsammans med SD och övriga allianspartier. Det måste bli slut med den vänsterextrema migrationspolitiken!!
SR P1|Meningen. Må bra å ha kul! 😀🙌👍
SR P1|Räcker det inte att man luktar skit på sin fritid? På arbetstid kan man väl försöka hålla en god stil?
Stoppa maktmissbruket|I trafiken finns nolltollerans. Men den allmänna moralen och brottsstävjandet?!? KATASTROF!! Moderater och Sossar bör packa och icke göra sig besvär i riksdag och regering framöver….
Stoppa maktmissbruket|Ska vi ta in Saudi-Arabien, Irak, Egypten, Somalia och Eritrea med i EU också? När vi ändå håller på?!? :-p
Friatider.se|I Sverige är det rasism, vi är blandade och mångkulturella…
Friatider.se|Syriska och Marokanska Europer.
Bra att vi har massinvandring till sverige av sådana va?
Snart i en Svensk Stad nära dig. Säpo kanske ska höja terrorhotnivån en grad från och med idag?
Friatider.se|Igen och igen…

Tangentbordskrigaren rör sig alltså mellan högerextrema partier och grupperingar, via ”alternativmedierna” och in och ut genom de etablerade partierna. Både tantentbordskrigarna och konspirationsteoretikerna tycks dela denna mikrotaktik; breda ut sig, ockupera ett kommentarsfält, gå vidare.

\\

Nu funderar jag på om jag ska skriva en liten algoritm för att detektera beteenden som delar samma abstrakta maskin som tangentbordskrigaren och konstpirationsteoretikern. Jag tänker att följande egenskaper kan vara intressanta att kalibrera algoritmen efter:

  • Gradvis repetetiva ord och fraser (ofta upprepar sig).
  • Stor spridning över olika facebookgrupper.
  • Frekvent användning av CAPSLOCK.

Vad tror ni? Med en sådan algoritm skulle man sedan kunna kvantifiera mina icke-systematiska observationer och kanske få en bild av olika nätbeteenden.

Imitativ strålning i en halv miljon facebookkommentarer

Jag har länge funderat på olika metoder för att studera fenomenet imitativ strålning, det vill säga de repetioner/imiationer som utgör det sociala livets väv, som genomkorsar oss, och som vi använder oss av för att gå vidare i världen.

I Social Laws (1879) definierade Gabriel de Tarde ”imitativ strålning” som:

This, let me say again, is what I mean by a ray of imitation, or imitative ray ; and the sum total of rays of this kind derived from any single inventor, originator, or innovator, whose pattern is reproduced, is what I call an imitative radiation. Our social life includes a thick network of radiations of this sort, with countless mutual interferences. (p. 101)

Begreppet strålning ska här förstås i sin vetenskapshistoriska kontext. Det var vid denna tidpunkt som Röntgen, Becquerel och Curie upptäckte den radioaktiva strålningen, även om osynliga former av strålning (infrarött, ultraviolett ljus etc.) hade upptäckts hundra år tidigare.

Men en sociologisk stråle skiljer sig från en fysikalisk. En imitativ stråle hänvisar i någon mening tillbaka till en innovation eller en uppfinning. Men eftersom dessa ”original” ofta är omöjliga att spåra upp när det kommer till vardagliga beteenden och handlingar, så är det egentligen sällan innovationerna som man vill studera, utan repetitionerna.

Imitativ strålning kan studeras i alla möjliga typer av material. Men när det kommer till fenomenen såsom opinionen eller offentligheten så vill man ju gärna komma åt ”den vanliga människans” tankar och handlingar. Problemet är att det är svårt att närgranska vad människor tycker och tänker eftersom det med konventionella metoder (enkäter, intervjuer) blir dyrt och krångligt, och dessutom måste man ju skapa frågor som respondenterna svarar på, vilket gör att man inte kommer åt det spontana och vardagliga. Vissa humanister och samhällsvetare tar då till ett ”knep” och läser istället vad som står i tidningen, sedan antar de att vanliga människor är ”produkter” av den ”diskurs” som tidningen sprider. En omväg och en irrväg.

Istället tänker jag att allt det som sägs och görs i sociala medier borde kunna användas som ofiltrerat råmaterial för att snappa upp fragment av den imitativa strålningen. Här finns enorma mängder material, tillgängligt mer eller mindre gratis (fast på Silicon Valleyföretagens villkor), som nästan bara används för marknadsföring och omvärldsbevakning.

Med utgångspunkt i Imitationens lagar har jag tidigare hävdat att Facebooks databas i framtiden skulle vara ett av de viktigaste arkeologiska fynden för den som ville studera det sociala livet i retrospekt, kanske som en slags mikrohistoria.

Men Facebooks databas är gigantisk även om man bara närmar sig en delmängd av den. Men någonstans måste man ju börja, så jag skrev ett Pythonskript som skrapar kommentarer som postas på hundra stora Facebooksidor (och genast anonymiserar dem), som i någon mening har en koppling till den politiska offentligheten på ett eller annat sätt. Här ryms politiska partier, nyhetsmedier, föreningar, religösa samfund, kampanjer och en del ljusskygga medborgargarden och gatuaktivister från höger till vänster. Min plan är att utvidga listan på grupper så att jag täcker in mer och mer.

Men bara dessa hundra grupper gav efter några timmars tuggande upphov till en halv miljon poster i min databas (jag delar gärna med mig av den, men jag tror att det skulle bryta mot Facebooks regler om jag lade ut den för allmän nedladdning, kontakta mig).

En halv miljon Facebookkommentarer är bara en droppe i datafloden. Men på samma sätt som man kan detektera även små mängder strålning av vissa isotoper, kan man med små mängder naturligt språk detektera de imitativa strålarnas repetitioner genom det sociala livets bakgrundsstrålning.

För att göra databasen sökbar skrev jag ett annat skript och frontend som genererar ett smidigt webbgränssnitt som kan göra avancerade sökningar medelst reguljära uttryck*. Så här:

search

För att testa hur väl det funkar började jag med ett samtidsfenomen som är tillräckligt litet och begränsat för att man ska kunna kalibrera träffsäkerheten mot andra källor. Jag sökte därför på ”Soldiers of Odin”, och alla tänkbara varianter av hur man kan skriva ut detta, med följande reguljära uttryck: SOO\s|Soo\s|SoO|\ssoo\s|[S|s]oldiers of|S\.O\.O.*.

Tidsmässigt verkar det som att det talas om Soldiers of Odin med största intensitet bara de senaste månaden:

soo

De första träffarna är från januari i år och sker på en sida av offentligheten som verkar gilla SoO.

medborgar

När jag söker i Mediearkivet (lite snabbt) så är det först en månad senare, i slutet av februari, som ETC rapporterar att SoO är på väg till Sverige. Det spelar ingen roll egentligen, det intressanta är ju hur en finsk ”innovation” smittar till Sverige, inte bara via de stora massmediekanalerna, utan underifrån. Vill man studera hur dessa aktivistgrupper formeras och sprids från land till land gör man nog bäst i att övervaka dessa grupper (tillsammans med Flashback) snarare än vad som skrivs i tidningarna.

När sedan SoO börjar patrullera gatorna i Sverige sker en explosion framförallt i vad vi kan kalla för löst sammanhållna antifascistiska Facebookgrupper.

anon

Men vid det här laget har ju SoO redan blivit rikskändisar genom att ha patrullerat bland annat i Göteborg.

\\

Man kan även observera återmedieringar i den andra riktningen. Ta begreppet ”selfie” som introducerades med pedagogiska förklaringar i pressen i början av 2013. En skärmdump från Mediearkivet:

selfie

Den imitativa strålen träffar sedan urskiljningslöst genom offentligheten:

selfiesok

Ett annat uttryck som kan vara intressant är ”svetsarn” (Stefan Löfven). Uttrycket existerade innan han blivit statsminister, men väldigt sparsamt i svensk press ändå:

svetsarn

Till en början kan man då tänka att detta är ett nedsättande högeruttryck som används av Löfvens politiska fiender (det är här alla ”diskursanalyser” av massmedier stannar). Men tittar vi i hur uttrycket används blir det mera komplext.

svetsarn2

Uttrycket ”svetsarn” tycks förekomma både i gillande och ogillande sammanhang.

Imitativa strålar får inte sin mening genom att en högre ordning tillskriver dem betydelse. Istället får de sin innebörd genom att repeteras och imiteras. Vad som ena dagen är ett skällsord och andra dagen ett smeknamn är alltid en empirisk fråga.

* Obs. i Linux behöver du bara installera regexp-modulen till sqlite3, medan i Mac OS måste du kompilera om sqlite3 från källkod.

Partiernas kön

I november förra året undersökte SCB i sin partisympatiundersökning hur fördelningen mellan män och kvinnor såg ut bland de som kunde tänka sig att rösta på ett visst parti i nästa val. Resultatet blev följande:

scb

Vad som kanske överraskade lite var den stora övervikten av män bland Sverigedemokraterna. Den var så stor att den fick alla andra partier att bli (svagt) kvinnodominerade. Sådan blir ju effekten av att ha riksdagsvalet som modell för vad som ”gör” ett parti. Allt kommer i slutändan bli 100 procent.

Finns det ett annat sätt att belysa kön på? En opinionsundersökning i linje med SCBs undersökning siktar ju bara på valresultatet som ett slag facit och ger ett extensivt mått. Men hur ser det ut när det politiska diskuteras? Ett sätt att studera det offentliga samtalet är att se vad som sägs på Facebook. På så sätt får man en mera processuell och rörelsebaserad indikation på hur det politiska byggs från handling till handling i offentligheterna. Vilka är det som dominerar i detta samtal?

För att undersöka detta laddade jag ned ett stort antal poster på de olika partiernas Facebooksidor (från 400 till 1000 poster, exklusive Kd som inte har något officiell sida) och gick igenom de ca. 100 000 namn som förekommer i kommentarstrådarna. Facebook håller förvisso ganska bra koll på vilket kön varje användare har, men denna information är inte öppet tillgänglig för övervakning via Graph-APIet som man använder för att skrapa data.

Så då fick jag lösa det med ett litet hack.

Jag körde alla hundratusen namn genom mitt lilla program gendercounter (som även utgör motorn i Genuskollen.se) och räknade hur ofta manliga och kvinnliga namn förekom (i absoluta tal, dvs. samma unika namn kan förekomma flera gånger). Resultatet blev så här:

resultat

När det kommer till kommentarer på Facebook är männen ständigt överrepresenterade, med undantag för Feministiskt initiativ som är det enda parti som har fler kommenterande kvinnor än män. Den generella trenden är att högerut är det fler män och vänsterut fler kvinnor. Men Sd sticker i denna undersökning inte ut mer än något annat högerparti. Istället är det Moderaterna som har flest män som kommenterar på sin Facebooksida.

Så här ser datamängden ut i tabellform för frekvens av namn (procenttalen avrundade, därför kan det bli 101% när man summerar):

Parti Kvinnor Män Obestämd N
Kommentarstrådar
Fi 55 32 13 10345 853
V 38 48 14 19429 998
S 37 48 15 20174 1004
Mp 34 53 13 15101 965
C 24 66 10 7512 732
L 27 65 9 10404 725
M 22 70 8 22354 1002
Sd 25 64 11 10529 427

Nu finns det flera metodproblem som jag ännu inte har löst, så dessa resultat ska läsas med försiktighet. Det som sorteras som ”obestämt” är  namn som inte förekommer i listorna som matchar namn. Det kan exempelvis röra sig om olika ”smeknamn”, men det kan även om genusneutrala namn. Jag jobbar kontinuerligt med att öka denna träffsäkerhet, men först måste man utsätta sig för riktig data innan man hittar anomalierna.

Trenden är ändå ganska tydlig. Kanske kastar denna typ av undersökningar nytt ljus på de politiska samtalens förutsättningar. Det verkar i så fall som att nästan alla Facebooktrådar är sorgligt mansdominerade.

\\

Metod / Kod

Först skrapade jag varje partis Facebooksida med följande skript. Fyll i sidornas ID-nummer och din access_token:

from facepy import GraphAPI
from django.core.serializers.json import DjangoJSONEncoder
import json

group_id =""
access_token = ""

graph = GraphAPI(access_token)
pages = graph.get(group_id + "/feed", page=True, retry=3, limit=1) #This is the number of posts per file!! original value 1
i = 0
for p in pages:
    print('Downloading page', i)
    with open('Partinamn/%scontent%i.json' % (group_id, i), 'w') as outfile:
        json.dump(p, outfile, indent = 4, cls=DjangoJSONEncoder, ensure_ascii=False)
    i += 1

Jag stoppade skriptet när det översteg 1000 poster för att inte översköljas av data.

Därefter körde jag följande skript för att räkna namn. Observera att jag importerar gendercounter som en modul, vilket gör att man först måste avkommentera några rader som sköter filöppning etc (se kodkommentarerna) samt lägga både gendercounter och dess namnlistor i samma katalog.

#-*- coding: utf8 -*-
import json
from json import load
from os import listdir
import gendercounter

counter = 0
kvinnocounter = 0
maencounter = 0
undetermined = 0
commentfield = 0

recordlist = []

directory = "Partinamn/"


#### Multi file parser from directory
for filename in listdir(directory):
    with open(directory + filename) as currentFile:
        jsondata = load(currentFile)

    for item in jsondata['data']:
        #print(item['status_type']) #For debugging
        if item:
            try:
                if item['comments']['data']:
                    commentfield += 1
                    print("Begin new post.")
                    for i in item['comments']['data']:
                        print("-" * 20)
                        namefield = i['from']['name']
                        splitted = namefield.split()
                        firstname = splitted[0]
                        print(firstname)
                        resultat = gendercounter.textinput(firstname)

                        if resultat[0][0]:
                            print("Kvinnonamn " + str(resultat[0][0]))
                            kvinnocounter += 1
                        elif resultat[1][0]:
                            print("Mansnamn " + str(resultat[1][0]))
                            maencounter += 1
                        else:
                            print("Couldn't determine gender")
                            undetermined += 1

            except KeyError:
                print("there was a key error")
            print("\n")


print("Results for the dicretory: " + directory)
print("There number of comment threads: " + str(commentfield))

summa = kvinnocounter + maencounter + undetermined
print("Summa namn: " + str(summa))

print("Kvinnocounter: " + str(kvinnocounter))
print("Maencounter: " + str(maencounter))
print("Undetermined: " + str(undetermined))

print("Kvinnor, " + str(kvinnocounter / summa))
print("Män, " + str(maencounter / summa))
print("Icke-bestämda, " + str(undetermined / summa))

 

Monadologiska försök att kartlägga nätverk där [POL] korsar [REF] i fallet medborgarvetenskap

Under hösten har jag dykt ned i forskning om medborgarvetenskap i projektet Taking Science To the Crowd. Eftersom projektet är internationellt har jag inte skrivit så mycket om det här, utan istället bloggat på engelska eller lagt tentativa analyser i projektets wiki.

Men ibland kan det vara bra att skriva ut tankarna även på denna blogg. Ofta funderar jag nämligen på hur man skulle kunna navigera sig fram i det mångtydiga fältet Citizen Science med hjälp av nätverksanalyser i det ”datascape”datalandskapet – som uppstår när en börjar följa olika aktörer.

Några utgångspunkter: Medborgarvetenskap skapar vad Latour kallar för referens [REF]. Samtidigt bedrivs medborgarvetenskap ibland av aktivister som söker bilda opinion kring olika sakfrågor. De arbetar alltså med att frambringa politiska cirklar i syfte att skapa politisk representation.

Referens [REF] och representation [POL] är två helt skilda existensmodi. Det förra skapar referenskedjor med hjälp av inskriptioner som mobiliserar världen, vilket leder fram till vetenskapliga publikationer. Det senare skapar tillfälliga autonoma punkter av representation som mobiliserar massorna(s fantomer). Det förra är relativt beständigt, det senare är flyktigt och försvinner så fort det inte mobiliseras.

Det intressanta tycker jag är när dessa två existensformer korsar varandra. Alltså, när politik och aktivism bedrivs med vetenskap och vice versa. Då får vi exempelvis medborgarvetenskap som räddar fisk i Mekongfloden, gör motstånd mot oljebolagen i Louisiana eller tillverkar instrument för att mäta oljespill. Vissa talar till och med om Extreme Citizen Science som en helt ny form av aktivism, utrustad med vetenskapliga metoder snarare än plakat och banderoller.

Men, vad är det som händer egentligen när en bedriver politik med vetenskap och vetenskap med politiska forskningsfrågor? En modernist skulle genast få kalla fötter. En kan ju inte blanda samman vetenskap och politik! Då rasar den objektivitet som präglar riktig forskning. Men även politiken kollapsar; om vi tar ”genvägen” via vetenskapliga fakta får vi en ytterst odemokratisk politik, en teknokrati!

Latour är dock inte speciellt orolig. Det är precis i dessa korsningar, i dessa mellanrum, som det sker intressanta saker.

Korsningarna, tänker jag, borde gå att studera genom analyser av de nätverk som utgör infrastrukturen. Här kommer några ytterst tentativa analyser.

\\

När en följer nätverk finns det ingen given mittpunkt att börja i. För ett tag sedan tog jag utgångspunkt i den publicerade vetenskapliga litteraturen. Då får man en bild av de citeringsnätverk som präglar medborgarforskningen.

Men vetenskapliga publikationer är givetvis bara en sida av de ytterst heterogena nätverk som skapar medborgarforskning. Visualiseringen ovan är en inzoomning på det fält av miljövetenskap/ekologi som dominerar medborgarforskningen. Men en sådan bild döljer alla de projekt som inte publicerar sig i kollegiegranskade tidskrifter.

Så, en kan likaväl börja i en annan ände: ”blogosfären”. Med hjälp av Issuecrawler skrapade jag länkar från 12 meborgarvetenskapsbloggar.

Här ser vi hur samma ekologi/miljövetenskapliga kluster finns representerat i nedre vänstra hörnet. Men vi ser även hur olika medborgarforskningsprojekt hakar in i sociala mediers plattformar (inzoomning nedan) och i viss mån till mera traditionella medier (Guardian, Scientific American, Nature osv.). Men, vi ser även hur det finns starka länkar till olika statliga (amerikanska) institutioner (.gov).

Länken till amerikanska myndigheter och forskningsfinansiärer blir ännu tydligare in en mycket större analys jag gjorde på 522 forskningsprojekts hemsidor. Här ser vi en oerhörd dominans av amerikansk forskningspolitik (pdf för större bild):

Medborgarforskning kostar pengar, även om tusentals människor arbetar gratis med att genomföra observationer och klassifikationer av data. Men det är inte så enkelt att vi kan dra likhetstecken mellan de gröna noderna i nätverken (.gov) och ”kapitalflöden”. Så enkla är aldrig nätverken. Medborgarforskningen befinner sig i korsningen mellan [POL] och [REF]. En länk kan alltså även betyda att forskningsprojekten vänder sig emot en myndighet i syfte att påverka exempelvis ett visst beslut eller myndighetsutövande.

Se även pdf.

Analyserna ovan är bara preliminära och översiktliga. Helheten är alltid mindre än delarna. Nyckeln till att hitta kvalitéer i datalandskapet är att zooma in, länk efter länk. Det är först då som tröskeln blir uppenbar och visar sig empiriskt.

Monader, slem och issuecrawler

slem

Som ett test skrapade jag några bloggar för analys av länkrelationer. Testet bestod mest av att se vilken typ av data som Issuecrawler kunde generera. Issuecrawler används bland annat av MappingControversies, som i sin tur använder sig mycket av Latour, Tarde och Dewey som teoretisk grund. Det verkar användbart även om jag inte har lyckats förstå exakt hur djupt Issuecrawlers motor går ned länkarna. Om någon vill testa, kolla källdatan i Gephi-format.

Jfr. även ”slemmappning

Monader, sociala nätverk och facebookövervakning

whole communityShip to Gaza Network

Jag har funderat lite vidare på det där med aktörsnätverk och monader och kände att det var på sin plats att testa några fler empiriska ingångar. Medelst ett pseudonymt spionkonto på Facebook började jag samla data.

\\

I samtidslaveriets tyckonomi skapas det hela tiden ett överflöd av ”åsikter” i sociala medier. Dessa är för det mesta ganska ointressanta på en innehållsnivå. Vad man kanske däremot inte tänker på är att varje litet klick på aggressiva/invasiva nättjänster som Facebook kommer att lagras, sorteras och användas för att zooma in på monadiska mönster som eventuellt går att omsätta till konsumtionsbeteende och annat matnyttigt. Det är inte konstigt att Facebook och Mastercard samkör sina datamängder. Ibland kallar vi detta för nätets kontrarevolution.

\\

Med hjälp av Gephi och NodeXL började jag skrapa ned Ship to Gaza Swedens facebooksida för att visualisera vad som gjordes där. Det går med vilken facebooksida som helst, det är mest att det är lite roligt att visualisera en ”aktivistsida” så att man kan betrakta eventuella känslor av paranoia på ett intressant sätt.

Jag tog bara ned data för en månad som ett litet test, men det blir ändå väldigt många relationer i databasen. Zoomar man in i mitten hittar man den mest centrala noden, som föga förvånande utgörs av administratören för sidan.

Om man öppnar upp hela denna monad som på bilden bara är förkortad till ”Ship…” (jag förkortar varje nod så att det inte står fulla namn i datamängden, lite ”integritet” kan ju vara lämpligt), får man följande händelse:

Ship to Gaza-Sweden: Anonym Anonymsson, har du någonsin belägg för vad du skriver? Vad är det för antisemitiska satirer du pratar om? Vilka medlemmar har uttryckt sig antisemitisk? Ship to Gaza har aldrig, och kommer aldrig uttrycka sitt stöd för Hamas eller någon annan palestinsk fraktion. Vi är politiskt oberoende!

Detta kallar vi under normala omständigheter för en ”debatt”. Dessa ”debatter” liknar kvällstidningarnas ”klick-monster” eller den pressens fåraktiga försvarstal när man som ursäkt för att ha publicerat något rasistiskt eller sexistiskt ”bara ville väcka debatt”. Att väcka debatt leder till klick som leder till cash. Denna centralaste nod i nätverket får massor av klick, likes och kommentarer, och datorns algoritmer använder dessa för att beräkna centralitet (i just detta fall).

Men, det är kanske inte primärt för att analysera klickmonster som man utför sociala nätverksanalyser. Istället vill man kanske kartlägga olika ”sub-communites”, eller ”delgemenskaper” i en större gemenskap. Håll i minnet: helheten är alltid mindre än delarna. Vi zommar in:

 

I hela datamängden räknade Gephi ut (matematiskt) att det fanns 30 undergemenskaper. Här har jag zoomat in i en grönfärgad sådan. De bildar en tillfällig gemenskap genom att de ”likear” varandra eller kommenterar i en tråd. I materialet hittar man även mera aktiva noder, som ofta länkar samman gemenskaper och fungerar som bryggor mellan dem. Ur ett monadperspektiv är det inte så intressant vad du säger, utan snarare ”vem du säger”. Det är på så sätt som delen är invikt i helheten och vice versa.

 

Helheten är alltid mindre än delarna – Latour, Tarde, Citizen Science och invasiva arter

Igår läste jag om Latour et. al’s artikel The whole is always smaller than its parts’ – a digital test of Gabriel Tardes’ monads från 2012. Temat med att låna in Tarde’s monad-begrepp (ursprungligen från Leibniz) känns igen från flera andra ställen hos Latour, men denna artikel är speciellt intressant eftersom det är en ”metodologisk” artikel snarare än en ontologisk, och att den vänder sig till ”sociologer” som bedriver empirisk forskning. Det finns nämligen ett metodologiskt argument i denna artikel, som Kalle för övrigt började skriva om redan för sex år sedan (återigen: journalartiklarna släpar långt efter forskningsfronten).

Tesen som Latour mfl. driver i denna artikel är att nya mängder av (meta)data har gjort det möjligt att skapa ”profiler” (profiles) av det som vi vill studera, följa eller analysera. Denna typ av data drömde Gabriel de Tarde om, vilket jag skrev om kort i förordet till den svenska översättningen av första kapitlet i Imitationens lagar:

Menar [Tarde] att eftersom varje liten detalj, varje liten imitation, ger upphov till och förklarar det sociala, måste statistikerna börja räkna på hela ”hushållets inventarier”, vilka böcker som publiceras, vilka kläder som säljs och vilka produkter som införskaffas vid vissa givna tidpunkter. Sådana empiriska undersökningar skulle i slutet av 1800-talet ha krävt en enorm logistik, för att inte tala om beräkningskraft. (s.18)

Nu är det ju inte längre slutet av artonhundratalet, så vi har chansen att plocka upp Tardes forskningsprogram lite drygt hundra år senare. Vilket är en ganska bra idé, tror jag.

\\

Just nu forskar jag bland annat om uppkomsten och utvecklingen av medborgarvetenskap, eller ”citizen science”, i ett projekt som heter Taking Science to the Crowd.  Här försöker vi följa hur denna praktik har vuxit fram, blivit alltmer relevant, och blivit alltmer av en hajp i forskningspolitiken.

Att kartlägga de nätverk som så att säga bygger upp citizen science kan då inspireras av Latours perspektiv på ett intressant sätt. Jag tänkte kasta ut lite preliminära datavisualiseringar här och testa mig fram.

Först några ord om de metodprinciper som återfinns i pappret från 2012. För det första finns det bara en analysnivå (Latour bryter med mikro/makro): monaderna utgör ”points of view” (p. 598) som ser ”hela nätverket”, men inte som en totalitet. Detta hänger samman med att det i sin tur inte finns några delar eller helheter: allt som finns är aktörer och nätverk. Aktörerna är nätverken och nätverken är aktörerna. Det är inte så, som mycket social teori utgår ifrån, att det sker ”interaktioner”. Inget interagerar med något, allt som finns är nätverk och aktörer som samtidigt definierar varandra. Det finns inga utbyten eller transaktioner: allt som finns är det som är: ontopolitik!

Men det där är ju ganska grundläggande. Spännande blir det först när det appliceras.

För att börja nysta i monaderna måste man ha en startpunkt. Jag tar min utgångspunkt i ett policydokument publicerat av Europeiska kommissionen: Green Paper on Citizen Science for Europe. Ett traditionellt sätt att analysera ett sådant policydokument är att ”dekonstruera” det, att kritiskt granska sättet som en viss sakfråga ”framställs på” och på så sätt synliggöra ett ”större sammanhang”, en kontext, eller en ideologi (”totalitet” om vi är riktigt modiga). Men, då begår vi misstaget att tro att det finns en del och en helhet, något större som avgör alla de mindre delarna. Literature is an assemblage. It has nothing to do with ideology. There is no ideology and never has been.

Istället kan vi börja analysera nätverket. Men då måste man börja plocka isär rapporten (dis-assemblage). Om man först hämtar ut de vetenskapliga artiklar som policyrapporten bygger på (se referenslistan) hittar man 21 artiklar, vars referensnätverk går att ladda hem från Web of Science (om man har universitetsaccess). Tack vare att vetenskapliga publikationer är uppmarkerade med metadata (som Tarde törstade efter), går det att använda policyrapporten som första monadologisk ”point of view” för att analysera det nätverk som (åtminstone delvis) definerar rapporten som aktör.

Först väljer vi en aspekt (aktant) av vetenskapliga publikationer: Författare. Klicka för att förstora:

 Skärmavbild 2014-10-31 kl. 11.15.50

Ur den första policyrapporten, Green Paper,  framträder ett (av flera) nätverk av forskare som gillar att citera varandra. Tittar vi i mitten hittar vi tre centrala forskare; Bonney, Phillips och Shirk, som tillsammans med andra forskare har skrivit artikeln Citizen Science: A Developing Tool for Expanding Science Knowledge and Scientific Literacy. Dessa forskare formerar en lokal centrumpunkt. Ofta lockas man då att tänka att de är ”centrala”, att man har hittat ”kärnan”. Men så är det ju inte med aktörsnätverk.  Studerar man i sin tur deras referenslistor och vilka som citerar dem, får vi ytterligare nätverk. Nätverk ger nätverk. Varje monad ger oss en oändlig ”utsiktspunkt” till nästa anhalt.

Men, forskares namn är ju bara en antropocentrisk etikett på ett nätverks noder. Tack vare dataöverflödet som Tarde drömde om kan vi välja en annan sida av monaderna. Vad sägs om samma ”innehåll” fast baserat på ”keywords”:

greenpaperkeywordmap

Här har jag hjälpt datorvisualiseringen (Gephi, Forced Landscape 2) lite på traven med att rita och skriva lite. Men, om vi analyserar den metadata som beskriver ”innehållet” i artiklarna (keywords) får vi ytterligare en utsiktspunkt som blickar ut över ytterligare nätverk. Observera hur lockande det är att tro att vi har hittat ”innehållet” i forskningsartiklarna. På ett sätt har vi ju det, de handlar ju om något. Men tänker vi innehåll kommer vi att fastna i reduktionism! Om vi istället tänker nätverk här får vi en bättre vinkel. Uppe i vänstra hörned ser vi hur artiklarna kopplar samman ”citizen science” med de nätverk som länge har studerat ”public scientific literacy”, ”public participation research” och så vidare. Här har vi så att säga en slags samhällsvetenskaplig tanke om att medborgarvetenskap är en fråga om kunniga, engagerade och deltagande medborgare. Lite spännande. Men följer vi sedan punkten ”Citizen science” ned åt höger stöter vi först på ett kluster som fokuserar de empiriska studieområdena. Det handlar om klimatforsknign, miljöforskning, och kristalliserar sig i biodiversitet. Därefter hamnar vi i ytterligare ett nätverk som handlar om observationer (av) invasiva arter, urval, populationer, observationers kvalitet (metod). Genom begreppet ”monitoring” öppnar sig sedan ytterligare studieobjekt: ”invasive plants”, ”plant invasions” och olika former av ”beredskap” för att hantera förändringar.

Fortsätter vi att zooma kan vi gå in på varje enskild artikel (källdata), här rankade efter globala citeringar (dvs. av alla källor i hela Web of Science):

Skärmavbild 2014-10-31 kl. 13.59.52

Här upptäcker vi att de två mest välciterade artiklarna leder till två psykologer: Ryan och Deci (de är även lyckoforskare, men det är en annan femma). Dessa psykologer sysslar en hel del med motivationsforskning. De är del av policyrapportens nätverk och de länkar sedan samman med ett ännu större komplex av motivationspsykologi. Detta fält är så stort att vi snabbt skulle förlora oss i det om vi fortsatte att följa nätverket åt det hållet. Dessa psykologer spelar en marginell roll i policyrapporten (de ger bara ”motivationsbiten”) men om vi ser in i dem som monader öppnar sig ett landskap där tre-fyratusen andra artiklar citerar dem. Som delar betraktade är de större än den helhet (policyrapporten) som vi började i. Detta gäller inte bara för citeringar. Citeringar är bara en liten aspekt av alla de nätverk av instrument, observationer, forskningsmedel, forskare, utrustning, allianser etc. som gör forskning möjlig. Dock är de väldigt väluppmärkta med metadata, vilket gör dem enkla att studera.

I en policyrapport, som eventuellt får politikerna i Bryssel att så småningom skyffla några forskningsöronmärkta miljarder Euro i ena eller andra riktningen, finner vi 21 vetenskapliga artiklar. Dessa öppnar monadologiskt upp ännu större nätverk som kopplar oss samman med invasiva arter, biodiversitet, global uppvärmning och bisarra habitat för flyttfåglar.

\\

De konventionella textanalysen tror att meningen finns ”bakom” eller ”mellan raderna”, i en abstrakt relation till en övergripande totalitet. Men, det känns som att man inte ens behöver genomföra analysen särskilt länge innan man hittar det där förväntade svaret om man jobbar så.

Mera intressant blir det om man kan länka samman en rapport med en invasiv fågelart som är relaterad till globala temperaturförändringar och som råkade flyga åt fel håll vilket gjorde så att politikerna i Bryssell….