Mysteriet med Bachs ofullständiga fuga Contrapunctus XIV

Med jämna mellanrum faller jag handlöst tillbaka i en kontemplation över Bachs Kunst der Fuga. För det mesta består dessa intensiva lyssningsperioder av en pendling mellan meditation och koncentration. De nästintill oändliga utrymmena för expanderande vyer i dessa fjorton fugor (vad man kan kalla ”fraktal variation”) gör att varje nytt möte med detta verk är en slags ny tanke. Jag upplever en själaglädje.

Man kan tröttna på sig själv. Men man kan inte uttömma Kunst der Fuga.

Öppenheten förstärks av den gåta som Bach lämnade efter sig – medvetet eller omedvetet – genom att inte fullborda den sista fugan, Contrapunctus XIV. Jag har länge levt i föreställningen att Glenn Goulds inspelning på piano (youtube, thepiratebay (bra kvalitet)) ligger så nära fulländningen som en jordisk akustik kan frambringa. Men på senare tid har jag ändrat mig, och istället börjat utforska olika spekulativa förslag på av denna sista fuga kan färdigställas.

Det hela började med att jag läste Indra Hughes mystiska avhandling Accident or Design – New theories on the unfinished Contrapunctus 14. Hughes lägger fram teorin att Bach medvetet lämnade fugan ofullständig så att framtida studenter och kompositörer skulle kunna skapa sina egna slut. En slags upplysningstanke i kombination med en nästintill alkemistisk gåta.

För en mycket sevärd tretton minuter lång introduktion till vad en fuga är för något, kolla den inbäddade videon.

Hughes presenterar även i sin avhandling ett ungefärligt förslag på hur Contrapunctus XIV skulle kunna fullbordas, men tvekar inför att framställa det som ett reellt förslag på en komposition.

Musiker har länge tvekat inför att ge sig i kast med något som anspråksfullt som att lägga sina egna toner till något som Bach, den stora mästaren, har komponerat. Men, som Hughes argumenterar mycket väl för, är det rimligare att tro att Bach på ett genuint sätt ville uppmuntra andra att tänka själva och se sig som medskapare till något som ändå var så mycket större än enskilda individers verk.

Tack vare internet har det numera blivit trivialt att distribuera både musik och noter, vilket har lett till att det poppar upp fler och fler förslag på hur fugan ska fullbordas, vissa ganska crazy. Jag tänkte här lista några stycken som jag har haft nöjet att lyssna på de senaste dagarna (en kvinna, resten män).

Av dessa är kanske Göncz version den mest kända eftersom han introducerade teorin om att Contrapunctus XIV följer en ”permutationsmatris” i sin komposition. Den ofullbordade versionen innehåller nämligen bara tre motiv (en trippelfuga). Men det finns anledning till att en fullständig version skulle återvända till det allra första motivet för hela Kunst der Fuga och på så sätt ”sluta cirkeln”. Men detta första motiv, de första tonerna i Contrapunctus I (Scharwieß föreslår dock variationen i Contrapunctus V, se ovan), som finns med i alla de tretton föregående fugorna, saknas i Contrapunctus XIV. Göncz upptäckte då en struktur (bilden nedan) för de tre första motiven, som sedan skulle kunna ge rum åt det fjärde.

Teorin om permuationsmatrisen, i kombination med den talmystik som Hughes presenterar, för tankarna till ett mysterium i stil med Umberto Ecos Foucaults pendel. Cavallaros förslag på ett färdigställande (ovan) ledde till att han även skrev en liten fiktiv novell om hur mysteriet med den försvunna fugan kunde ha gått till (gratis pdf bakom femton klick).

Vissa menar att Contrapunctus XIV gör sig bäst som den är, med sitt abrupta slut bestående av tonerna B-A-C-H. Men samtidigt infinner sig då känslan av att man snuvas på den stora upplösningen. Slutet på en fuga utgörs nästan alltid av ett klimax, en storslagen rekapitulering i riktning mot en avslutande harmoni. Kanske ville inte Bach att ett sådant avslut skulle skrivas i sten (eller, på papper) utan att det skulle fortsätta att utvecklas som en kontemplation.

Ibland är tystnaden, något som kanske Beethoven kände till allra bäst, den största musiken.

Uppdatering: Jag fick ett mail av Geir Øyvind Eskeland som tipsade om hans version, som kan lyssnas på här (youtube). Den är avsevärt längre än vad Hughes föreslår. Man kan läsa mer om resonemanget bakom på engelska och norska här.

 

Lite mer om felmarginalsuträkningar

Sitter och uppdaterar det lilla hobbyprojektet felmarginalen. Eftersom jag precis håller på att lära mig javascript är jag inte helt säker på att jag får de olika matematiska formlerna rätt när jag översätter dem till kod.

För att räkna ut felmarginalen har jag kodat:

Math.sqrt(((procentsats * (100 - procentsats)) / urval)) * 1.96

och, för att räkna baklänges, alltså för att få ut hur stort urval man behöver, har jag vänt på ekvationen så här:

Math.pow(1.96, 2) * (procentsats * (100 - procentsats)) / Math.pow(felmarginal, 2)

Ni som är bra på statistik och javascript, visst funkar detta?

Nästa steg blir att göra så att man kan välja säkerhetsnivåer (90, 95, 99 procent) samt eventuellt göra en graf i D3.js. Förslag och kommentarer mottages varmt.

Medborgarprogrammering

I början av året skrev Copyriot om förslaget att man bör satsa på programmering i skolan (även kommentarerna är väldigt intressanta att läsa). Jag har sedan dess tänkt ganska mycket på just denna fråga eftersom jag har börjat använda programmeringsinslag i min egen forskning. Vad är programmering bra för, bortom instrumentella anvädningsområden?

Men här tänkte jag varken diskutera programmering som forskningsmetod eller programmering som något som man lär sig för att bli ”programmerare”. Istället tänker jag att det finns utrymme för att beskriva en (tänkbar) programmeringspraktik som ryms inom begreppet ”medborgarskap”. Alltså, frågan blir istället, kan vi tala om programmering som en slags bildning, en praktik vi kan kalla medborgarprogrammering?

Mina programmeringskunskaper är förvisso (än så länge) ganska ytliga. Jag tillbringade några lata veckor på olika caféer i Beirut med självstudieboken Learn Python the Hard Way och repeterade sedan på Codecademy. Därefter var det enkelt att börja tillämpa dessa grunder på mera specialiserade problem. Python är nämligen inte bara enkelt till sitt syntax, vilket gör inlärningen relativt snabb, utan innehåller framförallt ett gigantiskt bibliotek av mjukvarupaket som enkelt går att importera i den programkod man skriver. Man behöver alltså inte uppfinna hjulet flera gånger.

Trots att mina programmmeringskunskaper är ganska ytliga har de i någon mening har de ändå gett mig en slags indikation på att det finns ett viktigt ‘kritiskt-intellektuellt’ element i programmering bortom den tillämpade praktiken, ett element som är svårt att tänka utan att först ha redskapen för att kunna tänka dem. Om vi går med på att ett medborgarskap ökar i omfattning och agens genom utökade kunskaper har alltså programmeringskunskaperna en dimension som överskrider ”anställningsbarhet i IT-samhället”, dvs. bortom standardargumentet för varför programmering är viktigt.

Ur ett medborgerligt perspektiv är det kanske viktigaste med programmering att vi kan tänka bortom världen så som den är given till oss eftersom vi i allt större utsträckning begriper den. I dagens samhälle utgör den ökade digitaliseringen en central förändringsanordning. Att acceptera den så som den är ”förprogrammerad” – att bara ge upp och bli ställd av den – är inte rätt väg framåt.

När man diskuterar värdet av programmeringskunskaper stöter man ofta på två skeptiska invändningar. Den första är mediehistorisk och lyder ungefär ”men typsättarna, boktryckarna, telegrafisterna, bokbindarna, kameramännen hade enbart tekniska kunskaper som andra sedan omvandlade till idéer, handlingar och kunskaper”. Det är kanske sant att om man kan binda en bok eller telegrafera ett meddelande så har man i dessa fall väldigt begränsade kunskaper och får inte mera makt över ”innehållet”. Man kan till och med tänka sig en icke-läskunnig bokbindare. Men, denna jämförelse haltar på flera sätt. För det första lämnar denna typ av (funktionalistisk) mediematerialistisk teori väldigt lite utrymme för att inkorporera ett tänkande i anordningarna som analyseras. För det andra inbegriper programmering bara i begränsad utsträckning något som har med ”medier” eller ”innehåll” att göra. Programmering omfattar ju alla typer av problem som kan omvandlas till maskininstruktioner, inte bara tillverkandet av något som kan ”medieras” (typsättarens datormotsvarighet är kanske html-kodaren, fast redan här är den senare kvalitativt sett mera avancerad).

Inte bara medier är programmerade. Även infrastruktur och saker som vi sällan lägger märke till i vårt vardagliga liv är programmerade, direkt eller indirekt. Att slänga soporna, låna en bok på biblioteket, gå till tandläkaren, handla mat – alla dessa aktiviteter är datoriserade. Och även om de är ”teoretiskt” genomförbara utan att blanda in datorer (så gjordes det ju ”förr”) så är det praktiskt taget omöjligt. Kostnaderna och prishöjningarna (alternativt lönesänkningarna) skulle vara alltför stora.

Moderniteten går inte att begripa i sin nuvarande form utan att begripa dess maskininstruktioner.

Med detta vill jag dock inte säga att man måste lära sig programmering för att förstå moderniteten, det vore ju minst sagt begränsande. Vad jag vill mena är istället att programmeringskunskaper bidrar till att förstå den produktiva infrastruktur som hela tiden skjuts framåt i en slags moderniseringsfront som präglar vår samtid. På samma sätt som massproduktion, standardisering, löpande band, byråkratisering utgör konstitutiva element i nittonhundratalets industrikapitalism, har datoriseringen utlöst en serie kvalitativa skillnader i hur våra moderna liv ”formateras”, för att låna ett begrepp från filsystemens värld. Förvisso är vi människor inga disketter (minns ni dem!) som formateras, men när vi ska köpa en liter mjölk är det praktist omöjligt att inte involvera programmerade maskiner.

Den andra invändningen brukar klinga i en tonalitet av falskt medvetande och ”totaliseringstänkande”. Denna skeptiska idé brukar i första led bestå av en kritik av ‘programmeringsoptimismen’ (en optimism som ofta uttrycks av politiker, ”evangelister” och företag) och istället visa hur denna är en produkt av vad man slarvigt kan kalla för en ”kapitalistisk ideologi”. All överbyggnad som talar varmt om programmeringens medborgerliga, demokratiska eller bildningsmässiga kapaciteter är i grunden underblåst av och hämtar sin näring från ett ökande behov av programmerare som arbetare. Google sponsrar programmering och öppen källkod med ett givet egenintresse av framtida arbetskraft. Politiker som säger att vi ska lära barnen att programmera har i baktanken en framtida tillväxt och välfärd.

Båda invändningarna har en viss giltighet. Speciellt när programmering utförs i allt mera specialiserade företag och när programmeringsarbetsuppgifter flyter fritt på en globaliserad marknad. De miljoner rader kod som vi dagligen använder oss av bara genom att slå på våra datorer, telefoner eller busskort är abstraherade produkter som köps och säljs på en global marknad. Vi förblir i stor utsträckning konsumenter av dessa produkter.

Men invändningarna motsäger inte att det parallellt med en sådan mittfåra kan finnas utrymme för en annan form av programmering, en form som upptäcker och omformar de existentiella maskininstruktioner som omger oss.

Jag vill inte definiera vad en sådan form skulle kunna inbegripa. Det är troligtvis en dålig idé eftersom exakt vad som är programmerbart och vad som kommer att vara programmerbart i framtiden är en ganska öppen fråga. Dessutom har jag börjat tänka på dessa saker först och främst genom att mina väldigt vardagliga observationer förändrades i takt med att jag tänkte alltmer på programmering medan jag lärde mig Python. Att se hur världen är programmerad gränsar i sin överdrivna form till hallucination, en kognitiv patologi där allt blir kod. Jag ser elementet i lägenheten och funderar på hur termostaten är programmerad med olika if-satser för att kunna slå av och på värmen vid rätt tillfälle. Jag åker spårvagn och funderar på om det går att hämta informationen om trafiken i realtid från något API på internet.

Jag funderar på när Vetenskap och Folkbildning gör en opinionsundersökning och om hur man lättare kunde räkna ut felmarginaler.

Medborgarprogrammering handlar inte om att man kan mäta ”demokratiska effekter” av olika projekt och produkter. Snarare tänker jag att man borde ta utgångspunkt i hur det kritiska tänkandet förändras. Om det alls förändras? Vad tror ni?

Vilka universitet nämns i Statens offentliga utredningar?

Jag funderar på ytterligare en dimension i SOUerna som ”kunskapsform”. Vilka universitet och högskolor nämns i utredningarna? Man kan anta att ett sådant omnämnande har två huvudsakliga orsaker. Antingen äger det rum när expertis från universiteten inkorporeras i utredningarna (professor X från Lunds Universitet, forskning vid Malmö högskola), eller när högskoleväsendet som sådant utreds.

Eventuellt skulle detta kunna vara ett alternativt sätt att mäta det som så populärt (och problematiskt) kallas för ”impact” eller ”samverkan”, givet att man kan antingen separera eller vikta de två olika ovan nämnda orsakerna till omnämning

Ambitionen är inte här att skapa ett sådant mått, utan att bara att visa hur mått kan skapas på väg mot en mätkritik av måtten. Måttkonstruktivism helt enkelt, i sin mest bokstavliga betydelse.

\\

Jag tänker att det borde vara ganska enkelt att med grova verktyg kunna göra en första insamling.

Följande lilla uttryck:


\s[A-Z]([^\s]*)\s(universitet|högskola)

Ger sökträffar i stil med:


381:samma universitet C O . Häggquist, dåvarande docenten vid Göteborgs högskola, professorn vid Stockholms högskola S. I. Karling, överbibliotekarien
390:förslag i tre promemorior, betecknade »P. M. angående Uppsala universitets drätselverk», P. M. angående Uppsala universitets kansli» och »P. M.
391:angående organisationen m. m. vid Lunds universitets kansli och räntekammare». Promemoriorna, som äro dagtecknade den 30 juni, den 3 september
398:15 januari 1947 till departementschefen avgivit en promemoria rörande Göteborgs högskolas ekonomiska ställning. Vid handläggningen av denna fråga
399:har beredningen biträtts av sekreteraren vid Göteborgs högskola, filosofie

Uttrycket säger ungefär: ”hitta allt som börjar med ett mellanslag, därefter en stor bokstav, därefter vad som helst förutom ett blanksteg, därefter ett mellanslag och sist antingen ordet ”universitet” eller ”högskola””. Uttrycket är väldigt snällt för att det går enkelt att hämta stadens namn i första parentesen och universitet/högskola i andra parentesen (ex. som $1, $2, Tyvärr ger denna sträng även några anomalier, exempelvis:


För högskolans
I universitetsstaden
En universitetslärare

Dessa går dock att sortera ut med en liten stoppordslista i ett senare skede. Vad man dessutom missar är nya uttryck såsom ”Mittuniversitetet”, ”Högskolan Väst” osv. Funderar vidare på hur dessa kan matchas.

Jag tänkte sedan stoppa in dessa uttryck i några små program. Men först kastar jag bara ut denna lilla anteckning och ni som vill kommentera är mer än välkomna att göra så.

SOUernas geografi

Var är Sverige utrett? Oftast frågar man efter hur och så tänker man sig att svaret skulle vara av kvalitativ art. Men det finns en annan väg, givet att man vet exakt vilka platser som har skrivits ned i alla statliga offentliga utredningar. Rad för rad. I denna bloggpost och instruktion hade jag tänkt att försöka mig på att ta ett steg närmare en sådan empirisk datamängd.

En spännande teoretisk fråga man då kan ställa sig handlar om hur staten ”blir till” (performativt) genom att utreda ort för ort. På samma sätt som ett nätverk av ryska gasledningar kan göra anspråk på ett territorium, kan ett nätverk av utredningar sakta men säkert släppa på och av flöden av ”statsgas” som letar sig ända ut i skogarna och värmer (eller kyler) stugorna med en känsla av att tillhöra ”staten Sverige”.

Nationens gränser finns inte, de måste hela tiden (om)skapas.

Jag tänkte med denna bloggpost lägga ut steg för steg hur jag har lyckats extrahera alla ortnamn ur SOUer 1922–1996. Jag lägger ut all rådata och alla steg i bearbetningen. Det blir kanske inte så läsvänligt, men å andra sidan kan alla mina steg replikeras och kritiseras så att datan blir fullt användbar för vem som helst att använda eller publicera. Dessutom krävde det hela mycket datorkraft, så det är en miljöinsats att använda mina filer.

Med andra ord, det är alltså fritt fram att göra vad ni vill!

\\
Steg 1 – Extrahera ortsnamn
Detta tog en vecka. I skripten som Peter Krantz publicerade finns lista på ortsnamn som man kan matcha mot alla SOUer med hjälp av:


grep -owf features.txt data/30tal/*.txt > trettiotal.txt

Jag körde detta för varje katalog i åtta screens på en riktigt snabb server. I detta läge använder sig grep av Aho Corasick strängmatchning. Den letar alltså efter träffar från en (jättelång) lista av ord och så printar den ut dessa till en fil. Kanske hade jag kunnat distribuera processorlasten över alla 32 processorer i mitt system, men jag ville heller inte krascha maskinen som delas med andra. Den råa datamängden från detta kan laddas ned som:

Men dessa filer innehåller massvis av skräpdata och är bökiga att arbeta med statistiskt. Således måste de bearbetas.

\\

Formatera data

För att göra datamängden statistiskt läsbar började jag karva fram variablerna Årtal, SOU-Nummer och Ortnamn enligt följande trixande med reguljära uttryck (kommentera gärna om ni har smidigare lösningar).

Först gjorde jag en första grov extrahering av Årtal (\d{4}), Nummer (:\d{2}) och sedan Ortsnamen som kommer sist på varje rad (.*):


ag -o '\d{4}:\d{2}.*(?<=:\d{2}.txt:).*' SOU1922-1996.txt > 1.txt

Sedan gjorde jag två olika versioner. Den första filen (2.6Mb)inneåller År, Nummer, Ort och gjordes om till en kommaseparerad fil med ett enkelt perl-handgrepp:


perl -p -i -e 's/.txt:/, /g' 1.txt

Men, för enkelhets skull gjorde jag även (2.4Mb) en version med bara År och Ort ur ovanstående fil:


perl -p -i -e 's/:\d{2}//g' 1.txt

\\

Stoppord

Men nu framträder ytterligare ett problem. Ortnamn, speciellt svenska ortnamn, har ju ibland betydelser även i vardagsspråket. Staden Kista och en sådan där trälåda man läggs i när man dör, stavas likadant. Ännu värre blir det med orten ”Vi” eller ”Gran”. Jag började först med att bläddra igenom filerna induktivt och hittade själv följande lista:

Vi|Bet|När|Bön|Håll|Mark|Böj|Vad|Färjan|Kap|Så|Alla|Verksamheten|Vecka|Källa|Varmvattnet|Hallen|Bo|Gran|Björk|Viken

Men detta var väldigt tidsödande, så jag frågade runt i sociala medier och fick massvis av svar. Här är de jag samlade in i går kväll:

Lyckan|Önska|By|Ön|Holmen|Strand|Vara|Mannaminne|Ensamheten|Bor|Kärleken|Skara|Bro|Viken|Skruv|Tving|Råda|Torp|Näs|Berg|Lugnet|Torp|By|Sand|Slut

För att sortera ut dessa falska positiver använde jag mig av lite perl.


perl -p -i -e 's/^.*\b(Vi|Bet|När|Bön|Håll|Mark|Böj|Vad|Färjan|Kap|Så|Alla|Verksamheten|Vecka|Källa|Varmvattnet|Hallen|Bo|Gran|Björk|VikenLyckan|Önska|By|Ön|Holmen|Strand|Vara|Mannaminne|Ensamheten|Bor|Kärleken|Skara|Bro|Viken|Skruv|Tving|Råda|Torp|Näs|Berg|Lugnet|Torp|By|Sand|Slut|Mom)\b//g' test.txt

Detta tar bort alla rader som innehåller något av ovanstående ord. Däremot lämnar det kvar blanka rader som jag tar bort med:


perl -p -i -e 's/^(\s*|\r|\n)$//mg' test.txt

Av någon anledning fanns fortfarande orten ”Så” med, så jag fick köra en ny vända med:


perl -p -i -e 's/.*Så//g' test.txt

Och sedan ta bort blanka rader igen.

\\
Datamängden

Sedan är det bara att döpa om txt-filen till .csv. Och så har vi datamängden SOU1922-1996artal-ort-filtered.csv.zip (1.5Mb).

Denna kommaseparerade fil borde man kunna läsa in rakt i Excel om man vill. För att göra allt replikerbart har jag dock bara gjort lite enkel statistik i R. För att skapa en enkel lista över orter i SOUer (i fallande ordning), kör jag bara (byt ut sökväg):


mydata <- read.csv("/home/anon/Desktop/SOU1922-1996artal-ort-filtered.csv") sink("Platserfrekvens.txt") df <- as.data.frame(table(mydata$Place)) ; df[order(df$Freq, decreasing=T), ]

Här instruerar jag R att skriva ut hela resultatet till filen Platserfrekvens.txt vars topplista ser ut så här:

Stockholm 73039
Göteborg 28937
Uppsala 26130
Malmö 20032
Danmark 17324
Norrland 15245
Örebro 14191
Lund 14143
Kalmar 10821
Bohus 8124
Frankrike 7372
Umeå 6948
Gävle 6569
Norrköping 6013
Västerås 5777
Luleå 5389
Skåne 5249
Linköping 5125
Karlskrona 5015
Hälsingborg 4695
Växjö 4190
Os 4069

Jag antar att "Os" är ytterligare en sökanomali. Stoppordslistan måsta alltså uppdateras.

Men detta vara bara ett test och ett sätt att få ut datamängden så att ni andra kan börja tinka med den. Det borde vara enkelt att skapa fina grafer över tid, kanske ned till varje enskild rapport. Det skulle även vara helt magnifikt med en sverigekarta som över tid uppdaterades dynamiskt med en "prick" på kartan varje gång en SOU nämnde en ort. Då skulle man, precis som med tekniska nätverk, se precis var någonstans det finns "täckning" och var någonstans det finns "vita fläckar". Tänk en täckningskarta för mobiltelefoner.

Kommentera mer än gärna. Vad finns det mer för idéer?

Ämnen i SOUniversum 3 – Topic Modelling

Det regnar ute och jag funderar på olika sätt som man kan behandla SOU-materialet på. För hundra år sedan skrevs en utredning på en skrivmaskin och nu ska jag behandla den med ett dator som är designad i Kalifornien och byggd i Taiwan. Om vi någonsin har varit moderna går det att snabbspola denna modernitet i gigahertz-hastighet.

En metod som har blivit populär inom digital humaniora är ”topic modeling”, som beskrivs av Journal of Digital Humanities som:

Topic modeling is a form of text mining, a way of identifying patterns in a corpus. You take your corpus and run it through a tool which groups words across the corpus into ‘topics’. Miriam Posner has described topic modeling as “a method for finding and tracing clusters of words (called “topics” in shorthand) in large bodies of texts.”

Mitt ursprungsläge präglas av skepsis. Varför ska vi använda maskininlärning på ett material som redan är systematiserat, kategoriserat och strukturerat av författarna. En SOU har ju en rubrik, innehållsförteckning, sammanfattning, osv., och har noggrant skrivits fram enligt rådande konventioner. Stopp och belägg! Åter till humaniora som det alltid har varit.

Men skepsis är en i grunden reaktiv affekt. Vi har ju redan datorerna i våra knän, varför inte experimentera och se vad som händer?

Jag började med att ladda ned programmet Mallet och följde sedan en välskriven installationsanvisning för samtliga operativsystem. Jag körde sedan några tester på engelska textkorpus för att få lite känsla för vad programmet gjorde. Denna teknologiska hermeneutik präglades av fullständig blackboxing till en början. Ofta är det ju så vi gör med teknologier som vi tror är ”verktyg”. Vi använder dem med en lätthet tills de inte gör som vi vill.

Problemet med SOUerna är ju att de innehåller massa brus och artefakter från inskanning och konvertering till text. Jag har fortfarande inte klurat ut hur detta ska lösas, men så länge kan man ”fuska” sig fram litegrann, för att få en helhetsbild.

Som testobjekt valde jag SOU 1924:35 Ylleindustriens produktionsförhållanden. Inget slår modernitetsångesten när det regnar. Man tänker på de där fabrikerna som nu huserar designbyråers kontor, men som en gång i tiden höll textilarbetare inspärrade vid dånande maskiner. Nu utvecklar man istället appar i dessa fabriker.

För att ta en genväg (som inte håller rent lingvistiskt) runt allt brus som finns i textfilen av denna SOU, valde jag att bara inkludera ord som är längre än fem tecken. Ett exempel på hur man kan göra detta är:


ag -o '\b[\wåäöÅÄÖ]{5}(.*?)\b' Ylleindustriens\ produktionsförhållanden\ -\ SOU\ 1924\:35.txt > ylle.txt

(byt ut ag -o mot grep -Eoi om du bara har det senare installerat)

Jag vet inte om man får göra så här. Om någon lingvist läser, kommentera gärna. Men nu har jag iallafall filen ylle.txt, som består av långa ord från hela SOUn. Här kan man läsa intressanta ord, exempelvis ”vicuñageten”. Här är en bild på ett sådant djur:

Vicugna-ESO

Därefter är det dags att använda Mallet. Jag lägger filen ylle.txt i en ny katalog och börjar med att bygga ett korpus:


./bin/mallet import-dir --token-regex '[\p{L}\p{M}]+' --input /home/anon/Desktop/ylle/ylleord/ --output ylle.mallet --keep-sequence --remove-stopwords

(observera att om ni använder windows ska ni inte skriva ./ i början, samt byta ut katalogstrukturen till motsvarigheten på erat system)

Jag vet inte riktigt vad jag gör här. Men --token-regex '[\p{L}\p{M}]+' ska iallafall göra det lite snällare för icke-engelsk text. Men nu har jag i alla fall korpuset ylle.mallet. Därefter är det dags för själva topic modelingen. Jag kör:


./bin/mallet train-topics --input ylle.mallet --num-topics 10 --output-state topic-state.gz --output-topic-keys ylle_keys.txt --output-doc-topics ylle_composition.txt

Jag väljer här att Mallet ska sammanfatta tio topics. Denna variabel går att öka och minska efter smak. Ur detta får jag dels tio olika topics i filen ylle_keys.txt samt en beräkning på hur hög täckningsgrad varje topic har i filen ylle_composition.txt. Här kan man se att topic 9 har den högsta sammanfattningsgraden (undrar om man kan säga så) på ungefär 12% (vet inte vad det betyder riktigt). Detta ämne lyder:

ylleindustrien bomullsindustrien kombinerade produktionskostnader produktion inventarier förbrukning totalkostnad sydamerikansk kapitalkostnaderna framträdande rörelsekapital importerat tillverkningar kamylleindustri uppdelning spridningen undersökningen sydamerikanska

Nästa ämne är topic 4 som lyder:

sammanlagt kamyllevä kardylleindustrien innehåller utredningen egenskaper produktionsf löngodsfabriker konsumtion tillverkningen kardyllebranchen beräknats resultatet världskriget spinnerier noteringar rentvättad kortulliga verkställd

Maskinen har arbetat. Jag vet inte riktigt vad jag har gjort.

Hur går jag vidare med detta? Skulle det vara intressant att göra en liknande analys av hela SOU-materialet? Finns det något mindre brutalt sätt att göra filerna rena och snygga och anpassade till svenskt alfabet och svenska stoppord? Blir vi bildade av denna kunskap eller är detta ett intellektuellt förfall? Kommentera!

Uppdatering: Sverker Lundin har gjort en liknande analys men med flera topics. Läs här!.

Uppdatering 2: Ändrade och uppdaterade efter att ha anpassat till svenska tecken, se kommentaren nedan.

Beck och Latour om kosmo(s)politik

Medan svenska tidningar domineras av olika ”debatter” (samt debatter om debatter), kan det vara uppfriskande att ta del av samtal från kontinenten. Frankfurter Allgemeine publicerade för ett par veckor sedan ett samtal mellan Ulrich Beck och Bruno Latour som i huvudsak handlar om global uppvärmning, men som samtidigt innehåller ett antal intressanta begrepp och distinktioner. Även om både Beck och Latour sympatiserar med varandra är de på vissa punkter väldigt olika, och framförallt har de två radikalt skilda sätt att angripa samma problem på.

Samtalet tar sin utgångspunkt i den antropocena tidsåldern, alltså den tidspunkt när en kvalitativ tröskel har överskridits,  och mänskligheten intar platsen som den primära geologiska förändringskraften.

Latour menar, lite provokativt, att den antropocena tidsålderns konflikter står mellan ”humans” och ”Gaians”, alltså, mellan ”människor” och ”Gaianer”. Med ”människor” menar Latour de varelser som genom moderniseringsprocessen har utkristalliserat ett specifikt själsliv som är vässensskilt från naturen ”där ute”. Genom en sådan separering kan global uppvärmning (”natur”) framträda som en ”social konstruktion” (”kultur”) för människorna. Människor har, med andra ord, en farlig böjelse för ”relativism”.

Gaianer, å andra sidan, lever som integrerade medskapare av jordklotet, de är aerosolerna i stratosfären och de är personerna i parlamenten. Gaianerna är inte utanför naturen, de tillhör naturen precis som alla andra varelser och ting.

Beck vill å andra sidan tänka konflikten i termer av kosmopolitik:

Wenn „humans“ gegen „Gaians“ das neue Freund-Feind-Schema ist, bedeutet das dann nicht, dass nationale, ethnische und religiöse Unterschiede überbrückt werden? Die Grenzen, die dann entstehen, bilden gerade nicht das alte nationalstaatliche Freund-Feind-Schema ab, sondern dessen radikale „kosmopolitische“ Transformation.

Beck vill hitta fram till en ny sorts kosmopolitik som inte är fastlåst i den gamla nationalstaten. Att havsnivån stiger är inget nationalstatligt containerproblem, havet bryr sig inte om våra moderna kartor som drar gränser mellan länder. Men paradoxalt nog är det fortfarande ”länder” som ska komma överens på de olika klimatmötena (som alltid havererar utan någon går med på att göra något (det hotar ju Ekonomin, som har ersatt Naturen)).

Latour vill istället använda begreppet ”kosmospolitik”:

Die eine ist die Auflösung unserer nationalen Grenzen. Das meint Ulrich mit „Kosmopolitisierung“. Die andere (meine) ist eine Politik des Kosmos, in der es um neue Grenzen geht, aber um ganz andere als nationalstaatliche, und hier überschneiden sich die beiden Begriffe. Aber die Grenzen werden nicht aufgelöst. Im Gegenteil, es müssen ziemlich konkrete Grenzen gezogen werden, beispielsweise zwischen denjenigen, die von „Klimawandel“ reden, und denen, die von „globaler Erwärmung“ reden.

Om kosmopolitik handlar om att riva ned gränser, handlar den latourianska kosmo(s)politiken om att upprätta nya gränser, framförallt för att kunna skapa bättre kunskap: exempelvis fallet klimatförändring vs. global uppvärmning. Detta tema resonerar direkt med Latours övergripande problemställning i An Inquiry into Modes of Existence, nämligen hur vi ska kunna skapa gemenskaper kring de nya problem som anhopar sig i Gaia. Latour vill här att vi ska gå från ”geo-politik” till ”Gaia-politik”, en ny församling som inte längre är beroende av metodologisk nationalism, utan som tar hänsyn till att vi idag har en annan utgångspunkt för det sociala kontraktet än vad som var fallet på Hobbes tid. Hobbes levde i ett annat kosmo(s)politiskt tillstånd, som krävde en annan Gaiapolitik. Det kosmos vi måste förhålla oss till idag, är en värld av aerosoler, ozon, växthusgaser, havsnivåer – kort sagt den antropocena tidsåldern. Detta kosmos kan inte göras beboeligt med hjälp av geopolitik längre, vi måste gå bortom nationella ”intressen”:

/…/ die neuen Konfliktlinien verlaufen nicht mehr zwischen humans mit unterschiedlichen (nationalen) Interessen, sondern zwischen Kosmen, die eingebunden sind in verschiedene Definitionen von Land, Erde, Boden, Luft, Wasser, Habitat – und das können wir beide als Kosmopolitik bezeichnen /…/

Den verkliga konfliktlinjen står alltså, enligt Latour, inte mellan olika ”människors” nationella intressen, utan mellan olika ”kosmologier” som inbegriper och definierar vad som är jord, vatten, luft, habitat etc. Med andra ord: kosmo(s)politik är en ontopolitik.

AIME 6: Kapitel 3: Korsningen REP REF

Jag fortsätter att läsa (om) baklänges i AIME. Denna gång tänkte jag skriva lite om korsningen mellan reproduktion [REP] och referens [REF]. Dessa båda modi är nödvändiga för att vi ska få den kunskapsform som de Moderna människorna värderar allra högst: den vetenskapliga.

Jag tänker gå selektivt in i ett par passager i boken och kapitlet, som utmärker sig för att behandla ett problem som Latour tidigare har skrivit om på en en mängd andra ställen, men som nu presenteras på ett annorlunda sätt.

Problemet handlar om en paradox hos de Moderna:

/../ the assurance that scientific results do not depend on the humans who nevertheless produce these results at great cost. (71)

Vi har alltså det klassiska problemet med korrespondens (mellan världen och påståenden om världen), eller annorlunda uttryckt: ett glapp mellan ”vetenskapsteori” (theory of Science) och ”vetenskapernas praktiker” (practices of science). Frågan är, antropologiskt sett, vad är det som gör att de Moderna kan skapa kunskap om något som inte är beroende av människor, samtidigt som dessa människor producerar kunskaperna till en hög kostnad?. Vad är det som gör det möjligt för de moderna att hitta galaxer ljusår borta, som inte är beroende av vår uppmärksamhet, samtidigt som det krävs enorma resurser för att mobilisera alla de verksamheter som möjliggör denna kunskap från första början?

Det är lika bra att gå rakt på Latours svar:

Let us thus use [REP], for reproduction (stressing the “re” of re-production), as the name for the mode of existence through which any entity whatsoever crosses through the hiatus of its repetition, thus defining from stage to stage a particular trajectory, with the whole obeying particularly demanding felicity conditions: to be or no longer to be! Next—no surprise—let us note [REF], for reference, the establishment of chains defined by the hiatus between two forms of different natures and whose felicity condition consists in the discovery of a constant that is maintained across these successive abysses, tracing a different form of trajectory that makes it possible to make remote beings accessible by paving the trajectory with the two-way movement of immutable mobiles. (91-92)

Det måste finnas reproduktion i form av repetition för att vi få en stabil existens av något slag. Galaxen måste fortsätta att vara, Hubbleteleskopet måste undvika att kollapsa helt plötsligt, radiolänken på teleskopet får inte rasa samman och forskarna på jorden måste fortsätta sin existens. Reproduktion är den tillfälliga stabilitet (från miljarder år hos galaxer, till de tillfälliga åren med forskningsfinansiering för ett forskarteam) som krävs för att en referenskedja [REF] skall kunna bildas.

För att vi ska kunna säga något om galaxerna måste informationen göras till inskriptioner, alltså någon form av visualisering som är begriplig för oss, så att vi kan klassificera observationerna (ibland går det inte med datorer så då måste vi hitta mängder av människor). Det är först när allt är på plats som vi kan nå de fjärran entiteterna (remote entities), i detta fall galaxer. Men det kan lika gärna handla om DNA-spiralerna i ett röntgenmikroskop, de är lika ”fjärran” som stjärnorna.

När allting har fallit på plats, och endast då, får vi en ”immutable mobile”: ”once everything is working without a hitch, we can say about correspondence what we would say about natural gas, or WiFi: “Reference on every floor.””(77) Det är då som vi kan lägga ut bilden på Carinae-nebulosan (ovan) och börja analysera den som vetenskaplig kunskap. Den är en immutable mobile, eftersom hela referenskedjan är intakt, byggd att fungera, reparerad, uppdaterad, internaliserad, analyserad etc. Vi har referens!

Tack vare dessa referenskedjor och immutable mobiles kan vi resa fantastiskt långt med våra vetenskaper:

Displacing the viewpoint is something at which chains of reference excel: the theory of relativity allows a cosmologist to circulate among the galaxies without leaving her little office in the Paris Observatory, as surely as I know where I am in the Vercors thanks to the topographic map. In this sense, scientific knowledge is indeed limitless. (84)

Utan att lyfta blicken från penna och papper kan jag sätta mig och räkna på ljusets krökning vid ett stort gravitationsfält. Jag kan sedan få mina beräkningar granskade av någon annan, som inte heller hen lyfter blicken mot stjärnorna för att ”kolla efter” (det går ju inte ens). Tack vare att referenskedjan går nästan hundra år tillbaka är ekvationerna med ljusets konstanta hastighet i alla riktningar och dess krökning stabila nog att omsvepa mig i en betryggande eter av referens.

Se även: Skillnaden mellan [FIC] och [REF].

Mitt grymma öde

För närvarande befinner jag mig i ett barockt sinnestillstånd. Detta gäller även för den ringa dos litteratur jag läser. Att då läsa Carl-Michael Edenborgs Mitt grymma öde ter sig som det mest harmoniska jag kan göra.

Jag gjorde det. Konsekvensen är att jag aldrig kommer lyssna på Händel på samma sätt igen.

Mitt grymma öde är alltså en roman om Händels liv, från det att han föds till att han dör. Den är kronologiskt skriven. Men någonstans där upphör den att vara en konventionell roman. Denna fantastiska bok är åtminstone två ytterligare saker: ett spekulativt affektfilosofiskt verk i barock anda, samt en idéhistorisk tes om hur Händel föregriper det moderna trots att han befinner sig i det för/tidigmoderna. Eftersom jag inte kan någon om romaner tänker jag uppehålla mig vid dessa två senare aspekter av Mitt grymma öde.

Min läsning kommer framöver att hänvisa till den Händel som Edenborg har frammanat i sin roman, inte den historiska Händel. Den senare lämnar vi till musikhistoriker att beforska. Från och med nu ger vi oss i kast med en ny Händel, som bör läsas som en musikalisk filosofisk-etisk berättelse av spekulativ art, snarare än mätas mot historiska fakta. Och då framträder ett mycket grymmare öde.

//

Händels primära affekt är hat. Hat mot allt och alla, förutom sig själv (inte förrän i slutet av hans liv vänder han hatet inåt). Händel hatar sin fader som slog honom, sin moder som våldtog honom, sin musiklärare som trakasserade honom sexuellt, och därefter nästan varenda människa han träffar vidare i sitt liv. Händel hatar dessutom kvinnor.

Hans främsta hämnd på världen består paradoxalt nog av hans fantastiska musik. Med sin förmåga att skriva fantastiska operor och oratorier, vilket möjliggörs av hans genius, kan han få människor att känna, att gråta och att bete sig som barn. Genom musiken kan Händel ta makten över andra människor och denna makt använder han för att uttrycka sitt hat. Han hatar inte längre Gud, han har gjort sig själv till Gud.

Därmed kommer vi till det moderna i denna barocka berättelse. Genom sitt tragiska liv har Händel konstant blivit utsatt för maktmissbruk och misshandel. Denna makt producerar hans motstånd, en figur som återkommer genom hela romanen. Denna manöver, som Foucault explikerade så noga i första bandet av Sexualitetens historia, gör att Händel överskrider sin egen tid. Nu är jag ju inte idéhistoriker, så jag vet egentligen inget om denna tids tänkande. Men, om vi skulle vara strikta Foucaltianer, innebär Händels manöver att ersätta Gud med Människan, samt att hämnas på världen genom mänskliga handlingar (att ta världen som objekt innebär att man måste definiera en ”position”), en omöjlig figur. Händel spränger barockens gränser med sitt hat och hans drivkraft är viljan till makt (i universell mening, tänk Nietzsche).

Att Händel är ”ur tiden” blir som allra tydligast i hans möten med de samtida naturfilosoferna. Det är dags att citera ur den fantastiska dialog som utspelar sig i mötet med Leibniz:

Filosofen [Leibniz] fortsatte:

– Vad säger ni om Bach? Han är i er ålder men har gjort sig ett ännu större namn i världen än ni.

– Vad önskar ni att jag ska säga?

– Bachs verk är en musikalisk översättning av min universalfilosofi. Hans kompositioner byggs upp av monader till andliga gestalter som skänker människan hennes rätta plats i det andligt-materiella kosmos, där allting motsvarar allting annat. Mannen Bach har förstått varats matematiska väsen.

Som en spottloska.

– Min musik är inte ämnad att göra oss hemmastadda utan att förvandla oss till monster för oss själva. Min musik är Guds röst som fräter bort köttet från människans ben.

Brottet kan inte bli tydligare. Om vi filosofiskt skapar en syntes mellan Bach och Leibniz, vilket jag tror är möjligt via Deleuze, får vi musik och existens för en barock människa. Inför den himmelska ordningen är vi antingen fromma, eller så utforskar vi den med proto-naturvetenskaper – sann upplysning. Jag står personligen nära Bach och Leibniz i denna fråga. På samma sätt som Newton upptäckte den klassiska mekaniken och Leibniz infinitesimalkalkylen, upptäckte Bach kontrapunkten och publicerade sitt fynd som das Wohltemperierte Klavier. Efter Newton fick vi en Einstein, men efter Bach har vi inte fått någonting (atonal musik är blott en negation av hans funna positiviteter). Men, jag ska inte ägna tid åt att argumentera om detta här.

Händel, å andra sidan, förkroppsligar fullständig ikonoklasm: Människans fromhet ska destrueras, hon ska inte längre känna sig hemma i världen (unheimlich), hon ska bli ett monster inför sig själv och inför andra. Musiken är inte längre en del av ett perfekt system eller ordning, den har förvandlats till en våldsam kraft. Musik ska beröra, fast den vackra och sentimentala beröringen utgör endast ett förstadium till en trollbunden förtvivlan och paralyserande sorg. När Händel får Europas furstar att bryta samman i tårar har han dem i sitt fullständiga välde, då är han gudomlig genom sitt genius. Då har han fått sin hämnd.

//

Mitt grymma öde är ett viktigt bidrag till den underrepresenterade genren ”spekulativ musikfilosofi”. Ibland ser vi glimtar av denna genre via film. I den fantastiskt vackra Amadeus framställs Antonio Salieri som ansvarig för Mozarts död. Eftersom Mozart har genius istället för Salieri, det är Mozart som har belönats med Guds röst, hämnas Salieri genom att sakta driva honom i fördärvet tills det att han avlider. Även denna berättelse är spekulativ. Men den mejslar fram musikaliskt intressanta aspekter.

Att lyssna på musik som föregår det moderna epistemet, den moderna produktionensformen och det moderna sättet att lyssna, kräver att vi utforskar de kringliggande förutsättningarna för dess tillblivelse. Detta kan vi göra genom historiska studier, filosofiska reflektioner och spekulationer. Till den sistnämnda kategorin utgör Mitt grymma öde ett fantastiskt intressant bidrag.

Uppdatering: Vertigomannen svarar.

1948 – Pfannenstill, "tattarna" och Borås

I mitt avhandlingsskrivande stötte jag på en massa trådar som inte kunde följas hela vägen ut. Jag antar att en avhandlings stora gissel är att man vill skriva för mycket och tvingas välja bort. En passage som dock endast figurerar som ett exempel i The Quantification of Society är sociologen Bertil Pfannenstills studie med titeln ”Tattarna – en sociologisk grupp och ett socialt problem”, publicerad som två artiklar i Statsvetenskaplig Tidskrift 1948. Eftersom jag endast omnämner den i korthet, kan det vara på sin plats att också sätta in den i ett annat sammanhang än min avhandlings snäva fixpunkter. Först ett introducerande självcitat ur avhandlingen:

Another case that clearly illuminates this strong state-science interface in this historical era is the work on the Romani minority by sociologist Bertil Pfannenstill (1948). During the spring of 1944, the National Board of Health and Welfare (Socialstyrelsen) commissioned a census of ”tattare”, a term for the Romani minority that is currently considered derogatory. According to the census, there were 8,000 ”tattare” living in Sweden. In this investigation, scientists were commissioned to conduct further research on this population. For example, racial biologists conducted ”anthropological” investigations of 60 individuals. However, these results were considered inconclusive […] (Kullenberg 2012: 181)

1948 utspelas även de så kallade tattarkravallerna i Jönköping, kravaller där både polisväsende och de tre tidningarna såg åt andra hållet medan en uppeldad lynchmobb kunde härja fritt i kristallnattsliknande misshandel och förstörelse. Om dessa händelser finns fortfarande några vittnen kvar, och det verkar som om det skrivs en avhandling om ämnet.

Men för att återknyta här till sociologin och vetenskapernas roll, är det intressant att se till Pfannenstills artikel. Efter det att Socialstyrelsen har fått i uppgift att registrera alla ”tattare” genom att skicka ut diverse lokala förmågor (oftast poliser) och producerat ett register på 8000 ”tattare”, lämnades frågan över till bland annat Rasbiologiska institutet i Uppsala. Professor Gunnar Dahlberg började mäta skallar på 60 individer, men lyckades inte hitta några signifikanta drag som skulle kunna definiera vad en ”tattare” egentligen var för något. Pfannenstill kommenterar:

Varför Dahlberg misslyckats i att över huvud taget göra en begreppsbestämning [av tattare] beror framför allt på att han uteslutande låtit den antropologiska synpunkten vara den avgörande. Även om tattarna ej utgöra en från den övriga befolkningen antropologiskt skiljbar grupp, kunna de dock utgöra en sociologisk grupp. Sociologiska skiljemärken få ej betraktas som mindre verkliga än de antropologiska. (p. 228)

Disciplinbeteckningen ”antropologisk” betydde vid den här tiden ”rasbiologisk” eller ”eugenisk”. Mot detta ställde Pfannenstill det sociologiska begreppet ethos och han var i viss mån influerad av Gunnar Myrdals studie An American Dilemma från 1944.

Pfannenstill definierar därefter sitt bredare syfte som:

[…] varför folk kommit att betrakta vissa släkter som tattarsläkter, är naturligtvis också en sociologisk fråga, som kräver sin lösning, om man vill göra allvar av alla de begrepp, som ligga i min defintion på tattre, och ur socialreformatorisk synpunkt gäller det sålunda att försöka förändra de betingelser – vare sig dessa äro rasbiologiska eller sociala -, som ligga till grund för uppkomsten av tattarsläkter, eller förhindra de icke önskvärda konsekvenserna av dessa betingelser.

Med denna oerhörda biopolitiska ambition ger sig sedan Pfannenstill ut för att göra sociologiska ”fältstudier”, vad vi idag skulle kalla ”kvalitativa intervjuer”, i staden Borås (en stad som några år senare skulle beforskas med helt andra metoder). En lång serie intervjuer genomförs, och Pfannenstill visar sakta men säkert att begreppet ”tattare” är mycket dåligt definierat både som ett vardagligt begrepp och som ett vetenskapligt.

I den andra delen av studien, börjar Pfannenstill ge sig in i att kommentera de olika åtgärder som föreslagits för att lösa ”tattarfrågan” som ett ”socialt problem”. Det förslag som vid denna tid sågs som helt legitimt, och som skulle komma att praktiseras fram till 1976, var tvångssteriliseringarna. Pfannenstill avvisade förslaget mycket bestämt:

En mycket pessimistisk syn på tattarnas anpassningsmöjligheter framträder i förslaget att låta sterilisering komma till flitigare användning för tattarna än för övriga befolkningsgrupper. Ett sådant förslag måste emellertid bestämt avvisas, ty som jag redan påpekat, är det många medlemmar av mycket ökända tattarsläkter, som äro på god väg att assimileras med den övriga befolkningen. (p. 316)

Eftersom Pfannenstill såg ”tattarnas” livssituation som i huvudsak orsakad av sociala faktorer, såsom fattigdom, alkoholism och utanförskap i förhållande till majoritetsbefolkningen, motsatte han sig dessa eugeniska metoder som antog att sociala egenskaper gick i biologiskt arv.

Pfannenstill avslutar sin artikel med att dra följande slutsats:

Det betyder, att man måste förändra såväl tattarnas livsföring som den övriga befolkningens attityd till tattarna. Kan man ej ändra tattarnas livsföring, har man ej heller stora utsikter att kunna ändra inställningen till tattarna, men kan å andra sidan ej denna inställning förändras, blir det svårt för tattarna att ändra om sin livsföring. (p. 335)

Att stoppa tvångssteriliseringarna blev inte av. Det rådde fortfarande politisk enighet i denna fråga. Inte heller fick Pfannenstill särskilt gehör för sin kanske för tiden radikala idé att även majoritetsbefolkningens attityder kunde spela in i att skapa ”sociala problem”.

Troligtvis är detta en av de första rent sociologiska undersökningarna av romer som gjordes i Sverige. Om man vill förstå de svenska samhällsvetenskapernas historia, måste man även betrakta dessa mörka episoder.