Minnesanteckning Spridningskollen – Vilka operatörer har tvingats lämna ut uppgifter?

Minnesanteckning. Det har nog inte undgått någon att Spridningskollen ska börja skicka ut brev till människor vars IP-nummer trålats och identifierats som fildelande bittorrentnoder. Det känns som ett eko tillbaka till 2008 då man diskuterade piratjägarlagen IPRED. Vad som händer nu är konsekvenserna av detta, trots att många internetoperatörer har gjort motstånd mot lagens införande och praktik.

På Twitter diskuterades vilka operatörer som har tvingats (eller frivilligt) lämna ut uppgifter till Spridningskollen. Här kommer några screenshots från kundtjänsternas sociala-medierkonton där de svarar. Jag lägger dem bara här för arkivets skull (så man kan stämma av mot vilka, med vilken operatör, som faktiskt fått brev).

Om någon har kompletterade information, kommentera mer än gärna!

\\

Uppdatering: Jag kontaktade Telenors kundtjänst på Twitter och fin nummer på domarna som lett fram till att de tvingades lämna ut uppgifterna. Har lite annat att stå i för tillfället, men lägger ut dem här. Borde vara intressant läsning.


Stockholms tingsrätt:
Ärendenummer från domstolsbeslutet från 26 augusti:
Scanbox Entertainment./. Målnummer Ä8895-16
Crystalis Entertainment./. Målnummer Ä8785-16
Ärendenummer från tidigare fall, 17 december: Crystalis Entertainment./. Målnummer Ä14271-15
Ärendenummer från tidigare fall, 17 december, 16 juni 2015: Crystalis Entertainment./. Målnummer Ä4191-15

Hovrätten:
Detta domstolsbeslut överklagades till Hovrätten men fick avslag: Målnummer ÖÄ6116-15

\\

Uppdatering: På flashback har någon begärt ut två av domarna. Lägger kopia på pdferna för arkivets skull: Stockholms TR Å 8895-16 Slutligt beslut (ej särskilt uppsatt) 2016-08-26 och Stockholms TR Ä 8785-16 Slutligt beslut (ej särskilt uppsatt) 2016-08-26

\\

Telenor säger sig ha lämnat ut uppgifter till Spridningskollen:

telenor

Comhem svarar så här:

comhem

comhem2

Telia säger:

telia

Bredbandsbolaget verkar vara tydligast med sitt svar:

bredbandsbolaget

Uppdatering. Fick tips om någon som frågat Tele2. Tipstack och bra ställd fråga av Angelica på Facebook.

tele2

Data mining och medborgarprogrammering?

I artikeln Known or knowing publics? Social media data mining and the question of public agency i Big Data & Society (open access) skriver Helen Kennedy och Giles Moss om hur data mining kan göras tillgängligt för en bredare allmänhet och varför det är viktigt ur ett demokratiperspektiv.

Författarna belyser hur ”big data” innehåller en maktasymmetri eftersom dessa datamängder i princip uteslutande ägs av stora företag med kontor i Silicon valley. Både forskare och allmänheten ligger på efterkälken, och har varken (obegränsad) tillgång till data eller de resurser och kunskaper som behövs för att utvinna värdefulla kunskaper ur dessa datamängder. Denna utveckling har även lett till bekymmer med integritet och dataskydd, där å ena sidan allmänheten ofta är utelämnad till de villkor som företagen ställt upp, och, å andra sidan, forskare har svårt att närma sig dessa datamängder på grund av forskningsetik. Data och metadata är helt enkelt väldigt lätta att missbruka om de används i fel syften (eller läcker, oavsiktligt eller med flit).

Kennedy och Moss ställer upp tre teser om hur data mining kan förbättras:

1. Data-mining practices should be subject to greater public supervision and regulation.
2. Data mining (data, tools, and expertise) should be accessible for all to use.
3. Data-mining practices should be used in ways that help to make more reflexive and active publics.

Den första frågan snävar av mot en lagstiftande politik. Den andra frågan är både enkel och komplicerad. När det kommer till verktygen, framförallt mjukvaran, är öppen källkod såklart att föredra. Det är svårt att granska slutna lösningar och bökigt att använda dem vetenskapligt när man vill redovisa metoderna. Men när det kommer till tillgänglighet för data uppstår genast ytterligare en dimension. Det är (forsknings)etiskt problematiskt att göra data tillgängliga, dels för att en genomsnittlig Twitter eller Facebookanvändare knappast har haft i åtanke en sådan användning när hen tecknade kontot (även om det tillåter en sådan användning), och dels för att det blir omöjligt att radera data om den mångfaldigas i flera olika arkiv.

Men det intressantaste är den tredje punkten, att data mining (eller, jag gillar egentligen det bredare uttrycket ”digitala metoder”) bör användas av allmänheten för att skapa en mera reflexiv offentlighet. Som jag ser det är det ett solklart fall av medborgarprogrammering. Kennedy och Moss argumenterar vidare:

The first two of these [punkterna ovan] are already the subject of widespread discussion, but the third is less widely discussed in relation to data mining and analytics. Our contribution to this debate is to argue that all of these three ways of democratising data mining are necessary to address the problems of data power, because together, they provide the means by which publics may be empowered through data. Of course, these are not straightforward solutions and are far from being implemented in practice, but identifying and outlining them is a necessary part of our project of imagining alternative and more democratic forms of social media data mining.

Offentligheterna ska alltså gå från att vara ”known” till att bli ”knowing”. Från att vara studerade studieobjekt av de stora Silicon Valleyföretagen till att själva bli vetande subjekt som själva genererar reflexiva insikter och kunskaper om sig själva och om andra offentligheter. Kennedy och Moss går inte in på hur det skulle se ut i detalj (vilket inte förminskar deras argument, allt kan inte vara praxis), men man kan tänka sig att detta inte är helt fritt från paradoxer.

Jag drabbas alltid av en kritisk fantomsmärta varje gång jag läser att något ska vara ”demokratiserande”. Men, om jag bortser från detta, är jag ändå positivt inställd till att skapa ett utrymme för en slags fusion mellan ”medborgerliga” digitala metoder och forskningsmässiga. Till exempel, som jag skrev i förra bloggposten, är det intressant ur ett brett perspektiv att öppna upp data kring Almedalen samtidigt som det innebär värdefulla data för samhällsforskare.

Utkast till en trollalgoritm som söker i Facebookkommentarer

Som hobby och som programmeringsövning kastade jag i förra inlägget ut några hypotetiska metoder för att upptäcka generiska nättroll i stora mängder Facebookkommentarer. Här redovisar jag mina första skisser. (Inlägget innehåller några kodsnuttar som är högst frivillig läsning).

Eftersom jag var ute efter en viss typ av troll, de ”missionerande tangentbordskrigarna”, tänkte jag att deras sätt att ockupera ett territorium genom en serie av mikrotaktiska manövrar skulle lämna ett visst spår som kunde fungera som första indikator.

Så mitt första steg blev att skriva en funktion för att bara plocka fram de användare som kommenterat i minst sju unika Facebookgrupper (en siffra som man givetvis kan justera upp och ned). Jag tänker att det krävs en stor ihärdighet och uthållighet, en viss bestämd ”agenda” och ett specifikt tålamod för att verkligen kommentera i sju olika grupper.

def territoriality():
    '''This function extracts the trolls based on territorial occupation'''
    from collections import defaultdict
    listoftrolls = []
    trolldict = defaultdict(list)
    thedata = conn.execute("SELECT encryptedidfield, thedate, group_name, \
                            message FROM main;")
    for t in thedata:
        user = t[0]
        group = t[2]
        if group not in trolldict[user]:
            trolldict[user].append(group)

    troll_sorted = sorted(zip(trolldict.keys(), trolldict.values()))
    for t in troll_sorted:
        #adjust here the threshold for inclusion. Larger than X.
        if len(t[1]) > 7:
            #print(t[0], t[1])
            listoftrolls.append(t[0])
    return(listoftrolls)

Denna första sortering reducerar datamängden avsevärt. Vad som faller bort är de troll som inte är så aktiva utan bara gör färre insatser, samt de troll som håller sig till bara ett fåtal Facebookgrupper. En avvägning.

I nästa steg tänkte jag att man borde ge sig in på vad trollen skriver, men utan att ange specifika ord eller ämnen. Efter att ha läst igenom en massa trolltext så började jag se ett återkommande mönster: Bruket av CAPSLOCK och överanvändandet av utropstecken och frågetecken: !!! och ???.

Så jag skrev ytterligare en funktion som gör så att endast trolltext som både innehåller capslock och antingen frågetecken eller utropstecken i följd går vidare till mina resultat.

def trollcontent(listoftrolls):
    for l in listoftrolls:
        thecontent = conn.execute("SELECT group_name, message FROM main WHERE \
                    encryptedidfield = (?)", (l, ))
        for t in thecontent:
            capslock = re.findall(r'[A-Z]{3,10}', t[1])
            specialchar = re.findall(r'\!\!\!|\?\?\?', t[1])
            ''' Select here if you want AND/OR '''
            if capslock and specialchar:
                print(l[:4] + " | " + t[0] + " | " +  t[1])
            else:
                continue

När jag körde dessa två funktioner genom en sjuhundratusen Facebookkommentarer som jag samlat in, gick det att vaska fram rejält envisa troll.

Här följer fem kvalitativa smakprover. Varje blockcitat innehåller en och samma användares kommentarer:

  1. Trafiktrollet (affekt: vägvrede, ur gruppen ”Stoppa västlänken NU”). Vanliga i Göteborg och Stockholm där man har haft stora vägprojekt på gång.

BUUUU   GP !!!  Förbaskat BRA att jag sagt upp min prenumeration !!

”.. här kan pendlare västerut byta..”  BINGO !!!  Här står det ju ”indirekt” att det kommer att byggas en stor bytesterminal (med tillhörande köpcenter, lattecafeer etc) i Haga

”.. Nära till sahlgrenska sjukhuset..” ???  KYSS MNIG I ARSLET !!

Invånarantalet i Köpenhamn (tätorten) är 1 250 000  I hela storköpenhamn är det ca 2 000

000 …  Bara för att få lite perspektiv alltså!  DESSUTOM sade köpenhamnarna NEJ till ett förslag om trängselskatt !!  Och när en dansk säger NEJ så är det ett NEJ !!!

Oslo – Gbg – Kbh  600 km på 2 timmar är en MEDELHASTIGHET på 300 km/h  Skall sedan tåget stanna i Gbg och ev. ytterligare någon mellanliggande ort så krävs det ÄNNU HÖGRE hastigheter…  Säg att banan måste byggas för 400 km/h ..!!!!!!!!!!!!   Det finns INTE jag upprepar INTE någon järnväg i HELA EUROPA som idag är byggd för dessa medelhastigheter !!!   Passagerarunderlaget är dessutom ALLDELES för LITET för att denna investering i MÅNG-HUNNDRA-MILJARDERS klassen skall ”rättfärdiga” ett par tre tåg dagligen…  KOMPLETT TOKOT VANSINNE !!!

Du skall CYKLA !!!

2. Det konservativa trollet som ”värnar om landet”. Ur M och Kds Facebookgrupper. Det återkommande argumentet om att folk måste ”vakna” och kravet på utredningar och misstroendevotum.

Moderaterna | Snälla se till att gränsen stängs! VI MÅSTE värna om landets säkerhet!
IAF bättre säkerhetskontroll!!! PRESSA LÖFVEN!

Kristdemokraterna | Den misstänkte terroristen kom hit som asylsökande.
”Vi har kontroll” säger Löfven. Tack för den!
Och tack Kristdemokraterna för att ni låter dem hållas. VAR ÄR ERT MISSTROENDEVETUM??????

Kristdemokraterna | VAKNAAAA!!!!
http://www.expressen.se/kvallsposten/polisen-systemet-har-brakat-ihop/

Kristdemokraterna | Snälla se till att gränsen stängs! VI MÅSTE värna om landets säkerhet!
IAF bättre säkerhetskontroll!!! PRESSA LÖFVEN

3. Det gränslösa copy-pastetrollet. Dessa är vanliga och lite tråkiga eftersom de bombarderar offentligheten med samma budskap. Men för det mesta tar de i så hårt att de till slut blir obegripliga. De självdestruerar sina argument kan man säga.

Liberalerna | SVERIGES REGERING OCH ALLIANSREGERINGEN BÄR ANSVAR! Till terror runt i Europa! Koppling till utläningar i Sverige görs i person efter person! VILKA TJÄNSTEMÄN ÅTALAS-UTREDS?! INGEN! VILKA POLITIKER STÄLLS TILL ANSVAR?! INGA?! Som IKEA-MORDEN!! Alla går fria! Svenskar och europeer kan mördas urskiljningslöst och svenska ansvariga politiker och tjänstemän går helt fria!!! www.gd.se/gastrikland/gavle/is-terroristen-skots-ihjal-av-belgisk-polis-satt-i-styrelsen-for-hoforsforetag

Miljöpartiet | SVERIGES REGERING OCH ALLIANSREGERINGEN BÄR ANSVAR! Till terror runt i Europa! Koppling till utläningar i Sverige görs i person efter person! VILKA TJÄNSTEMÄN ÅTALAS-UTREDS?! INGEN! VILKA POLITIKER STÄLLS TILL ANSVAR?! INGA?! Som IKEA-MORDEN!! Alla går fria! Svenskar och europeer kan mördas urskiljningslöst och svenska ansvariga politiker och tjänstemän går helt fria!!! www.gd.se/gastrikland/gavle/is-terroristen-skots-ihjal-av-belgisk-polis-satt-i-styrelsen-for-hoforsforetag

Dagens Nyheter | DN ÄR EN KOMMUNISTISK TIDNING! Hade man varit som Aftenposten eller Jyllandsposten i våra grannlaänder så hade ju Avpixlat aldrig funnits!!! Hela media-Sverige är ett stort skämt….och något man skrattar åt i våra grannländer! Detta är icke asylpolitik utan masskolonisation av Sverige med främlingar från 3-världen som svenska folket aldrig har givit sitt medgivande till!! Likt en okupationsmakt får vi svenskar slava åt kolonisatörerna där man tömmer våra försäkrinringar och bankkonton och ger till främlingarna!! Bandiiter och rövare styr vårt land! Brött både mot grundlagen och högmålsbrott pågår! Har ickke ord över detta förakt mot Sverige och svenskarna! Hoppas Östermalm både får sexuella överfall, gruppvåltäkter, personrån, judehat, och allt härligt som de själva har tvingar på andra!!!

4. Capslock-cruise-control-for-coolnesstrollet. Ibland räcker det med att se på hur stor spridning (territorialitets-funktionen) ett troll har samt och graden av repetition med versaler och utropstecken. Den mest extrema användaren slår på CAPSLOCK och köttar sedan fram helt urskiljningslöst:

Socialdemokraterna | Lägg tid och pengar på att ta bort ”den bortre gränsen” istället!!!!!!!! FOLK LIDER NÖD SOM ÄR SJUKA OCH UTFÖRSÄKRADE!!!!!!!! YNKLIGT OCH SKAMLIGT!!!!!! DE HAR BETALAT SKATT OCH BEHANDLAS SÅ INHUMANT!!!!!!!!

Socialdemokraterna | NOG MED DETTA ATT VISSA LANDSTING LÅTER VISSA SOM HAR PENGAR FÅ KÖPA HJÄLPMEDEL SOM ÄR BÄTTRE!!!!!!!!! DISKRIMINERING ÄR VAD DET ÄR!!!!!!!!!!!!!!!!!!!

Socialdemokraterna | Rätt så!!!!!! Vi ska ALDRIG GLÖMMA!!!!!!! Inte heller nacismens Tyskland!!!!!!!! Inte heller 9/11 i USA!!!!!!! Inte Charlie Hebdo, eller något terrordåd!!!!!!!!! Hedersmord är för mig terrordåd, DÅ INGEN HAR RÄTT ATT AVGÖRA OM EN ANNAN MÄNNISKA SKA LEVA ELLER DÖ!!!!!!!!!!

Socialdemokraterna | Nu är det dags att göra något åt välfärden!!! Folk lider!!! Familjer med barn där föräldrar råkat bli sjuka får inga bidrag!!!!!! NU ÄR DET DAGS ATT SE TILL ATT VI FÅR HJÄLP NÄR VI BETALAR SKATT!!!!! INGET ÄR FÖRÄNDRAT TILL DET BÄTTRE I VÄLFÄRDEN ÄNNU!!!!!

Socialdemokraterna | Gränsen är nådd!!!! Sverige kommer inte att vara värt namnet Sverige om Alliansen vinner i höst!!!!! Titta på alla sjuka, funktionshindrade, gamla, barnens situation. Det finns inte pengar till bra mat ens till de gamla, eller till barnen i privata företag som tjänar pengar på det!!!! SKAMLIGT!!!!!!

Miljöpartiet | Ha ha ha, nä inte med deras metoder att flytta produktionen utomlands och låta andra ta skulden, så Sverige ska få fina siffror vad gäller miljön!!!!! Usch!!!!!! TACK MILJÖPARTIET FÖR ATT NI LYFTER FRAM SANNINGEN!!!!!! VI BEHÖVER DEN NU FÖR KOMMANDE GENERATIONER SKA HA EN REN VÄRLD ATT LEVA I!!!!!!!!

Vänsterpartiet | Inte Nato!!!!!!! Att  vara neutral är att vara klok inte feg!!!!!!! Trött på personer som tänker med reptilhjärnan utan mänsklig empati och normal intelligens!!!!!!!! DET DRABBAR FAMILJER!!!!!!! Barn och barnbarn!!!!!!!!!! Fega är de som vill ha ut ANDRA I KRIG!!!!!!!!!! KRIGA SJÄLV!!!!!!!!!!!! MASSOR AV  CHANSER ATT KRIGA FÖR  FN!!!!!!!!!!!!

Vänsterpartiet | Just det!!!!!!! SANDLÅDA!!!!!!! DAGS FÖR SOSSARNA ATT FÖRSTÅ ALLVARET!!!!!!!!!! ATT BÖRJA SAMARBETA FÖR BARNENS SKULL!!!!!!!!!!! DE LIDER I ALLIANSENS SPÅR!!!!!!!!!!!

Vänsterpartiet | Hoppas någon sätter dit dem för vad de gjort mot mänskligheten!!!!!!!! Enligt mänskliga rättigheter har de gjort fel!!!!!!!! Sverige har antagit FN:srättigheter!!!!!!!!! SKAMLIGT VAD ALLIANSEN GJORT!!!!!!

5. Tandtrollet. När det kommer till sjukdomar så finns det risk för att man hakar upp sig. Ofta vill man utkräva ”svar” från olika aktörer på varför ingen lyssnar på dem.

Moderaterna | Hur kunde ni tillåta att Hanna Stjärne VD på public service fick tillsätta Jan Helin som chef på SVT???????? Vi är chockade. Kommer från en vänstertidning som dessutom haft antisemitiska artiklar massor med gånger. HUR kunde ni gå med på detta???? Det är dödsstöten för det fria ordet inom public service.

Moderaterna | VAD tänker Nya Moderaterna göra för att tandvård skall kosta detsamma som sjukvård????????????NU kräver vi svar.  VI SOM ANSER TÄNDER TILLHÖR KROPPEN.

Moderaterna | BRYR du dig Carl????

Moderaterna | Och Joakim Winsgård………………….Stig ur bilen – få lite frisk luft och svara någon inom partiet OM NI ANSER TÄNDER TILLHÖR KROPPEN. Och så du chauffören Kent. SVARA!!!!!!!!!!!!!!!!!!!

Liberalerna | För en gångs skull hoppas jag ni nu svarar. TBC har ju fördubblats på ett mycket skrämmande sätt. Detta på grund av den ökade invandringen. Är nu bevisat det beror på denna faktor. Varför är alla partier så tysta då det gäller det? Människor försätts ju fara. Betänk att TBC varit så gott som utrotat fram till nyligen i Sverige. Vad tänker ni vidta för åtgärder??? /Jag är en av de som röstade på ert parti/

Kristdemokraterna | Nu måste ni även inom ert parti berätta vad ni kommer vidta för åtgärder då det gäller TBC som mångdubblats i Sverige och är bevisat det har sin orsak  i den ökade invandringen. Det är som inget parti vill låtsas om problemet. Vad tänker ert parti vidta för åtgärder???

Detta var bara en första skiss. Någon som har andra tänkbara indikatorer på troll som man skulle kunna bygga in i algoritmen för att göra den mera precis?

Offentligheten och imitativ strålning – konspirationsteoretiker och tangentbordskrigare

I förra inlägget skrev jag hur man tentativt skulle kunna studera imitativa strålar i digitalt material som man skrapade från Facebook. Här kommer ytterligare en trevande idé om hur man kan vaska fram vissa typer av beteenden som kan vara intressanta för att förstå det offentliga samtalets struktur.

När jag samlar data från Facebook har jag även sparat hashsummor av användarnas femtonsiffriga ID-nummer. Detta gör att jag kan följa individer genom hela materialet, fast utan att veta vem de är eftersom hashsumman inte är reversibel. Sociologi intresserar sig ändå inte för individer, och forskning handlar ju inte om att hänga ut någon (det lämnar åt journalistiken).

Men vad som är intressant tänker jag är att se vilka ”idealtypiska” nätbeteenden som man kan vaska fram. Ofta talas det ju om ”troll” och ”tangentbordskrigare”, fast sällan hänvisar man till empiri. Kanske finns det möjlighet att ändra på det, om vi experimenterar med samhällsvetenskapliga metoder litegrann.

Observera att det jag nu skriver om är enskilda kvalitativa exempel baserade på användarmönster, och inte något uttalande om fenomenens utsträckning (kvantitet, strålningsgrad).

\\

Först tänkte jag ge ett exempel på vad man kan kalla för en ”konspirationsteoretiker”. När jag söker jag på ”Bilderberg” i min datamängd kan man se att vissa individer ger ett speciellt avtryck om man visualiserar beteendet som ett nätverk (av imitativa strålar).

bilderberg1

Individen d3eb1 har kommenterat på Moderaterna, Centerpartiet och Socialdemokraternas Facebooksidor om Bilderberggruppen. Det här är vad hen säger (klicka för att förstora):

bilder4bilder3bilder2

En övertygad konspirationsteoretiker är dels missionerande och vill berätta för så många som möjligt. Men samtidigt känner hen sig begränsad av censur och inskränkningar i yttrandefriheten. Budskapet ska fram till varje pris, men priset en får betala är att bli tystad.

Den här typen av utläggningar är typiska:

/…/ de censurerar obekväma användare genom att radera deras inlägg samt tar bort deras möjlighet att kunna kommentera! De är under ALL kritik. För istället för att SVARA på sakliga frågor som folk ställer om socialdemokratiska partimedlemmar som springer på hemliga kontroversiella Bilderbergmöten och om den snedvinklade rapporteringen från Syrien, så RADERAR de inlägg,som de sedan förnekar att de har tagit bort och som jag nämnde tidigare, tar bort funktionen att kunna KOMMENTERA!! Är det DEMOKRATI DET? Jag kommer ALDRIG mer rösta på Socialdemokraterna. Ett gäng hycklare är vad ni är som kränker människors mest fundamentala rätt att få yttra sig utan att bli censurerad!!
Nu skall jag gå ut och skriva om det här på min blogg!!

En annan typ som vi ofta möter är ”tangentbordskrigaren”. I likhet med konspirationsteoretikern finns en missionerande ambition som vänder sig utåt och vill berätta överallt om ”sin sanning”. Tangentbordskrigaren detekteras ofta genom att man söker på något ”kritiskt” begrepp (ex. ”massinvandring”, ”flyktingpolitik”) och sedan zoomar in på en användare som rör sig över flera grupper; alltså, någon som har ett nomadiskt förhållningssätt till territorier (krigsmaskin, den ”lantliga fascismen”).

tangent

Användaren 2c2b9 rör sig över flera grupper när man söker på termen ”massinvandring”. Misstanken om att vi har att göra med en tangentbordskrigare stärks. Tar man fram vad hen säger genom hela datamängden ser man att hen täcker in ett stort territorium:

Centerpartiet|Är inte regeringens politik skäl nog för att misstroendeförklaras, vad är i såfall skäligt?
Centerpartiet|Framgår inte ett smack vad graferna står för mätdata. 😒
Liberalerna|Lägg ner tankar på att gå med i nato.
Fundera på vilka som låg bakom Palme-mordet…
http://www.friatider.se/oliver-stone-cia-bakom-statskuppen-i-ukraina
Nyheter Idag|Dom där snorungarna skulle kunna  vara barn till dom där ”ensamkommande barnen”.
I takt med att invandrare förgriper sig på svenskar så får SD ökat stöd, men visst är det MYCKET SYND att det i Sverige länge inte funnits någon större nationalistisk solidaritet i annat än sportsammanhang.
Expressen|Kom mördaren till landet genom från ett arabland genom ”fri invandring” eller var han en urinvåndare som blev förtryckt av arbetslinjen?!?
Sverigedemokratisk ungdom|Läckert kaxig reklam. Politik ska alltid vara aktuellt och det visar SD exemplariskt. Dock så tror jag inte Sverige blir bra direkt vid regeringsskifte 2018, utan då har sveriges ekonomi och demografi skadats något offantligt mycket om inte moderaterna öppnar både sina hjärtan och hjärnor och utlyser nyval tillsammans med SD och övriga allianspartier. Det måste bli slut med den vänsterextrema migrationspolitiken!!
SR P1|Meningen. Må bra å ha kul! 😀🙌👍
SR P1|Räcker det inte att man luktar skit på sin fritid? På arbetstid kan man väl försöka hålla en god stil?
Stoppa maktmissbruket|I trafiken finns nolltollerans. Men den allmänna moralen och brottsstävjandet?!? KATASTROF!! Moderater och Sossar bör packa och icke göra sig besvär i riksdag och regering framöver….
Stoppa maktmissbruket|Ska vi ta in Saudi-Arabien, Irak, Egypten, Somalia och Eritrea med i EU också? När vi ändå håller på?!? :-p
Friatider.se|I Sverige är det rasism, vi är blandade och mångkulturella…
Friatider.se|Syriska och Marokanska Europer.
Bra att vi har massinvandring till sverige av sådana va?
Snart i en Svensk Stad nära dig. Säpo kanske ska höja terrorhotnivån en grad från och med idag?
Friatider.se|Igen och igen…

Tangentbordskrigaren rör sig alltså mellan högerextrema partier och grupperingar, via ”alternativmedierna” och in och ut genom de etablerade partierna. Både tantentbordskrigarna och konspirationsteoretikerna tycks dela denna mikrotaktik; breda ut sig, ockupera ett kommentarsfält, gå vidare.

\\

Nu funderar jag på om jag ska skriva en liten algoritm för att detektera beteenden som delar samma abstrakta maskin som tangentbordskrigaren och konstpirationsteoretikern. Jag tänker att följande egenskaper kan vara intressanta att kalibrera algoritmen efter:

  • Gradvis repetetiva ord och fraser (ofta upprepar sig).
  • Stor spridning över olika facebookgrupper.
  • Frekvent användning av CAPSLOCK.

Vad tror ni? Med en sådan algoritm skulle man sedan kunna kvantifiera mina icke-systematiska observationer och kanske få en bild av olika nätbeteenden.

Imitativ strålning i en halv miljon facebookkommentarer

Jag har länge funderat på olika metoder för att studera fenomenet imitativ strålning, det vill säga de repetioner/imiationer som utgör det sociala livets väv, som genomkorsar oss, och som vi använder oss av för att gå vidare i världen.

I Social Laws (1879) definierade Gabriel de Tarde ”imitativ strålning” som:

This, let me say again, is what I mean by a ray of imitation, or imitative ray ; and the sum total of rays of this kind derived from any single inventor, originator, or innovator, whose pattern is reproduced, is what I call an imitative radiation. Our social life includes a thick network of radiations of this sort, with countless mutual interferences. (p. 101)

Begreppet strålning ska här förstås i sin vetenskapshistoriska kontext. Det var vid denna tidpunkt som Röntgen, Becquerel och Curie upptäckte den radioaktiva strålningen, även om osynliga former av strålning (infrarött, ultraviolett ljus etc.) hade upptäckts hundra år tidigare.

Men en sociologisk stråle skiljer sig från en fysikalisk. En imitativ stråle hänvisar i någon mening tillbaka till en innovation eller en uppfinning. Men eftersom dessa ”original” ofta är omöjliga att spåra upp när det kommer till vardagliga beteenden och handlingar, så är det egentligen sällan innovationerna som man vill studera, utan repetitionerna.

Imitativ strålning kan studeras i alla möjliga typer av material. Men när det kommer till fenomenen såsom opinionen eller offentligheten så vill man ju gärna komma åt ”den vanliga människans” tankar och handlingar. Problemet är att det är svårt att närgranska vad människor tycker och tänker eftersom det med konventionella metoder (enkäter, intervjuer) blir dyrt och krångligt, och dessutom måste man ju skapa frågor som respondenterna svarar på, vilket gör att man inte kommer åt det spontana och vardagliga. Vissa humanister och samhällsvetare tar då till ett ”knep” och läser istället vad som står i tidningen, sedan antar de att vanliga människor är ”produkter” av den ”diskurs” som tidningen sprider. En omväg och en irrväg.

Istället tänker jag att allt det som sägs och görs i sociala medier borde kunna användas som ofiltrerat råmaterial för att snappa upp fragment av den imitativa strålningen. Här finns enorma mängder material, tillgängligt mer eller mindre gratis (fast på Silicon Valleyföretagens villkor), som nästan bara används för marknadsföring och omvärldsbevakning.

Med utgångspunkt i Imitationens lagar har jag tidigare hävdat att Facebooks databas i framtiden skulle vara ett av de viktigaste arkeologiska fynden för den som ville studera det sociala livet i retrospekt, kanske som en slags mikrohistoria.

Men Facebooks databas är gigantisk även om man bara närmar sig en delmängd av den. Men någonstans måste man ju börja, så jag skrev ett Pythonskript som skrapar kommentarer som postas på hundra stora Facebooksidor (och genast anonymiserar dem), som i någon mening har en koppling till den politiska offentligheten på ett eller annat sätt. Här ryms politiska partier, nyhetsmedier, föreningar, religösa samfund, kampanjer och en del ljusskygga medborgargarden och gatuaktivister från höger till vänster. Min plan är att utvidga listan på grupper så att jag täcker in mer och mer.

Men bara dessa hundra grupper gav efter några timmars tuggande upphov till en halv miljon poster i min databas (jag delar gärna med mig av den, men jag tror att det skulle bryta mot Facebooks regler om jag lade ut den för allmän nedladdning, kontakta mig).

En halv miljon Facebookkommentarer är bara en droppe i datafloden. Men på samma sätt som man kan detektera även små mängder strålning av vissa isotoper, kan man med små mängder naturligt språk detektera de imitativa strålarnas repetitioner genom det sociala livets bakgrundsstrålning.

För att göra databasen sökbar skrev jag ett annat skript och frontend som genererar ett smidigt webbgränssnitt som kan göra avancerade sökningar medelst reguljära uttryck*. Så här:

search

För att testa hur väl det funkar började jag med ett samtidsfenomen som är tillräckligt litet och begränsat för att man ska kunna kalibrera träffsäkerheten mot andra källor. Jag sökte därför på ”Soldiers of Odin”, och alla tänkbara varianter av hur man kan skriva ut detta, med följande reguljära uttryck: SOO\s|Soo\s|SoO|\ssoo\s|[S|s]oldiers of|S\.O\.O.*.

Tidsmässigt verkar det som att det talas om Soldiers of Odin med största intensitet bara de senaste månaden:

soo

De första träffarna är från januari i år och sker på en sida av offentligheten som verkar gilla SoO.

medborgar

När jag söker i Mediearkivet (lite snabbt) så är det först en månad senare, i slutet av februari, som ETC rapporterar att SoO är på väg till Sverige. Det spelar ingen roll egentligen, det intressanta är ju hur en finsk ”innovation” smittar till Sverige, inte bara via de stora massmediekanalerna, utan underifrån. Vill man studera hur dessa aktivistgrupper formeras och sprids från land till land gör man nog bäst i att övervaka dessa grupper (tillsammans med Flashback) snarare än vad som skrivs i tidningarna.

När sedan SoO börjar patrullera gatorna i Sverige sker en explosion framförallt i vad vi kan kalla för löst sammanhållna antifascistiska Facebookgrupper.

anon

Men vid det här laget har ju SoO redan blivit rikskändisar genom att ha patrullerat bland annat i Göteborg.

\\

Man kan även observera återmedieringar i den andra riktningen. Ta begreppet ”selfie” som introducerades med pedagogiska förklaringar i pressen i början av 2013. En skärmdump från Mediearkivet:

selfie

Den imitativa strålen träffar sedan urskiljningslöst genom offentligheten:

selfiesok

Ett annat uttryck som kan vara intressant är ”svetsarn” (Stefan Löfven). Uttrycket existerade innan han blivit statsminister, men väldigt sparsamt i svensk press ändå:

svetsarn

Till en början kan man då tänka att detta är ett nedsättande högeruttryck som används av Löfvens politiska fiender (det är här alla ”diskursanalyser” av massmedier stannar). Men tittar vi i hur uttrycket används blir det mera komplext.

svetsarn2

Uttrycket ”svetsarn” tycks förekomma både i gillande och ogillande sammanhang.

Imitativa strålar får inte sin mening genom att en högre ordning tillskriver dem betydelse. Istället får de sin innebörd genom att repeteras och imiteras. Vad som ena dagen är ett skällsord och andra dagen ett smeknamn är alltid en empirisk fråga.

* Obs. i Linux behöver du bara installera regexp-modulen till sqlite3, medan i Mac OS måste du kompilera om sqlite3 från källkod.

Empati på internet, läsande och primitivism

Idag skriver jag och min forskarkollega Niclas Hagen en replik till Fredrik Svenaeus, som liknade internet vid ”hejarklackens logik”. Jag tänkte här bara länka till de referenser som inte får plats i tidningsformatet.

  • Hänvisningen till Julia Pennlerts forskning om poesi på internet finns publicerad i antologin Litteraturens nätverk.
  • Diskussionerna kring internet och arabiska kvinnliga poeter ägde rum på Göteborgs poesifestival förra året.
  • Bruno Latours begrepp homo fabricatus kommer från kapitlet om teknik i An Inquiry into Modes of Existence, närmare bestämt på sidan 230. Jag har även bloggat om detta här.
  • Läsvärt i sammanhanget om Helena Granströms teknik- och modernitetskritik är Isabelle Ståhls recension i SvD. Man blir lite mörkrädd av passagen om ”renskötaren”…

Uppdatering: Svenaeus skrev en replik till vår replik med titeln ”Ängsligt teknikkramande förbättrar inte nätkulturen”.

Recension: Digital politik: Sociala medier, deltagande och engagemang

Idag publiceras en recension av boken Digital politik: Sociala medier, deltagande och engagemang (Carlsson, Eric, Bo Nilsson & Simon Lindgren (red.) (2015). Göteborg: Daidalos) som jag har skrivit i tidskriften Human IT, som är helt och hållet open access.

Jag fick fritt fram att skriva långt, så recensionen är förhållandevis utförlig. Utrymmet gjorde även att jag fick möjlighet att driva ett antal metodologiska och teoretiska resonemang som visar hur boken med sitt diskursanalytiska perspektiv (tung inspirerat av Laclau och Mouffe) på många sätt missar den digitala politiken. Detta är dock mer än en metodfråga. Det får bland annat som konsekvens att man helt bortser från konsekvenserna av internets plattformisering, hur hypertext fungerar, vad meta-data betyder osv.

Men det finns även en annan brist i perspektivet. Genom att författarna i huvudsak analyserar hur man har talat om digital politik i konventionella massmedier, så missar man helt och hållet framväxten av ”alternativmedier” och deras (i många fall negativa) påverkan på det offentliga samtalet. Ur ett svenskt perspektiv känns det omöjligt att tala om digital politik utan att nämna Flashback, Avpixlat osv.

Eller vad tänker ni om detta?

 

Anonymisera facebookdata för forskning med hmac och hashlib

Om man vill samla in data från Facebook i forskningssyfte stöter man genast på forskningsetiska problem. Facebook ger alldeles för mycket information om informanterna, utan att man ens behöver be om lov.

Här tänkte jag bara ta upp en detalj som handlar om den ”farligaste” uppgiften i den datamängd som man kan extrahera med Facebooks API: det unika id-numret.

Varje Facebookanvändare har ett femtonsiffrigt nummer tatuerat i sitt digitala skinn. Det ser ut så här (i (förkortat) json-format):

    {
     "id": "48236456782311475_63332119186437",
     "message": "This is a message written by an informant",
     "type": "status",
     "from": {
         "id": "121506454323368",
         "name": "Jane Doe"
     },
     "created_time": "2011-06-11T25:48:31+0000",
     "status_type": "wall_post",
     "is_expired": false
    }

De två fält som är uppenbart identifierande är alltså id och name. Här tänkte jag bara ta upp id-numret. Att ersätta namnet men behålla man/kvinna-distinktionen är ett problem som måste lösas på ett annat sätt.

För att kunna bevara det unika med id-numret utan att kunna identifiera en riktig person tänkte jag att man skulle kunna använda kryptering. Men jag är inte så duktig på det så jag undrar nu om detta kan vara ett vettigt angreppssätt.

Eftersom id-numrena alltid är femtonsiffriga så är det nämligen möjligt att räkna fram alla hashsummor, även om det skulle ta lite tid. Men om man däremot använder HMAC så lägger man till ett lager av säkerhet genom att man använder en unik hemlig nyckel och krypterar med. Så här tänkte jag ungefär:

from json import load
from os import listdir
import hmac
import hashlib

#Some code for reading files and parsing the data to jsondata

    for item in jsondata['data']:
        print("-" * 20)
        print("Name: " + item['from']['name'])
        print("Facebook id: " + item['from']['id'])
        digest_maker = hmac.new(b'replacewithsuperecretk3y', item['from']['id'].encode(), hashlib.sha256)
        print("Encrypted id: " + digest_maker.hexdigest())

Detta skriver ut:

Name: Jane Doe
Facebook id: 121506454323368
Encrypted id: dfef8d5bed530668b004e28a29488e8252e5a5224d3178f00c0f7d0bf48e4b6a

Detta gör att man kan bygga om forskningsdatan och ersätta id-numret med det krypterade numret.

Nu finns det tusen andra saker i materialet som kan avslöja en användares identitet. Men, bortsett från detta, tror ni att den här krypteringsmetoden är tillräckligt bra?

Monadologiska undersökningar – Hyphe + Gephi + Sigma.js

Zooma genom att skrolla. Klicka för att aktualisera varje enskild monads nätverk. Se även fullskärmsversion
I mellandagarna har jag experimenterat med några verktyg för datalandskapsforskning/journalistik/aktivism. Detta i syfte att analysera världen med en monadologisk ontologi utifrån Gabriel de Tarde. Här tänkte jag dela med mig av några metodologiska/mjukvarumässiga knep som jag har lärt mig (autodidaktiskt) över många koppar svart te.

För att kunna se datalandskapet för vad det är, måste vi använda oss av några instrument som förstärker och förtydligar den snåriga djungel som uppstår i datamatrisens bördiga jord. Här vandrar en mängd muterade arter och avarter omkring. Men primärt är vi inte intresserade av deras ”essens”, utan istället deras performativitet. Varje nod definieras av sitt nätverk samtidigt som nätverket definierar noderna.

Tack vare internet lämnar nästan alla aktiviteter efter sig digitala spår. Genom att skicka ut spindlar (crawlers) går det att sniffa upp dessa spår och sedan analysera dem. Datalandskapet är fyllt av sådana spår och tack vare att vi lämnar dem efter oss är det enkelt att bevaka och övervaka nätet.

Vi är alla flugor i arachnidernas fiberoptiska fångstapparat.

\\

Médialab vid Sciences Po tillhandahåller ett antal open-sourcade verktyg som utgår från en monadologisk ansats. För att samla in data måste en ha en vettig crawler som kan skrapa och indexera den information en vill åt. Hyphe (github) är en mycket lättanvänd sådan, som tyvärr ännu är i ett tidigt utvecklingsstadium och därför inte helt enkelt att installera 1.

Hyphe tillåter att man genomför en slags ”snöbollscrawling”. I exemplet ovan utgick jag från en populär hemsida bland svenska män, vilket gav följande resultat:

Skärmavbild 2015-01-05 kl. 09.26.56

När man väl har angett en startpunkt, hämtar sedan Hyphe fram de relevanta länkarna till andra noder i nätverket:

Skärmavbild 2015-01-05 kl. 09.31.55

Hyphe sätter sedan igång att crawla alla noder en väljer att inkludera i nätverket. Allt som allt skapade jag detta nätverk på cirka tio minuter, bara för att testa. Men har en mera tid kan en dels bygga ett större nätverk, och dels sortera och klassificera noderna så att en får en tydligare visualisering.

Hela tiden skapar hyphe automatiskt förhandsgranskningar av det nätverk man bygger ihop:

Skärmavbild 2015-01-05 kl. 09.33.52

Sedan är det enklast att exportera resultatet till .gephx-formatet och sedan fortsätta bearbetningen i Gephi.

För att sedan publicera en interaktiv visualisering kan man dels installera ett plugin som exporterar Gephi-nätverk till sigma.js eller installera sigma.js-biblioteket på en webserver och direkt låta det läsa in gephx-filen (om man inte orkar Gephi).

Då blir det lite enklare och roligare att visa upp visualiseringen utan att skapa en massa statiska bilder.

\\

Att kravla och skrapa webben ger givetvis en begränsad mängd data som är av en viss typ. Noderna utgörs av ”web-entiteter” och en web-entitet består sedan av ytterligare nätverk. Tänk <a href=”http://www.expressen.se/nyheter/expressen-avslojar/namn-pa-anonyma-anvandare-knackta/”>alla de som kommenterar på bloggarna och hemsidorna</a> i nätverket! Men för att komma åt den nivån måste en utvidga med att <a href=”http://www.christopherkullenberg.se/monader-sociala-natverk-och-facebookovervakning/”>skrapa exempelvis sociala medier</a>.

Imitationer.

Noder som imiterar andra noder.

Näthatet uppstår

i nätverken.

Notes:

  1. Jag lyckades med att få igång Hyphe på en Debianserver (Debian 7). Dock är installationsskriptet aningen trasigt och måste läsas igenom manuellt för att tillgodose alla dependencies. En måste även lägga till GPG-nycklar manuellt och sedan lyckas klura ut hur Apache2 gör Alias-pekningar. Jag rekommenderar även starkt att en prövar först på en virtuell maskin eller på en maskin som man inte använder till något annat, detta eftersom installationen av scrapy-motorn kommer att ersätta sysvinit, vilket är ganska så risky business. Hör gärna av er till mig om ni kör fast.