Vad är medborgarforskning?

Igår publicerades min och Dick Kasperowskis studie What is Citizen Science – A Scientometric Meta-analysis i open-accesstidskriften PLOS ONE. I ett pressmeddelande på svenska förklarar vi att:

Medborgarforskning, eller ”citizen science”, har på allvar slagit igenom inom flera vetenskapliga discipliner. Fenomenet finns både inom natur- och samhällsvetenskaperna, visar den hittills största systematiska analysen av medborgarforskning, som publiceras i tidskriften PLOS ONE.

− Vi ser att forskare inom naturvetenskaperna framför allt har samlat in och klassificerat data med hjälp av intresserade volontärer. Inom samhällsvetenskaperna har fokus legat på att bjuda in berörda delar av allmänheten för att få kunskap om hur forskningen påverkar deras liv. Det kan till exempel handla om miljöproblem och risker, säger Christopher Kullenberg, vetenskapsteoretiker.

Det som är speciellt roligt med PLOS ONE är, förutom att den är helt öppen för vem som helst att läsa, är att all källdata också går att ladda ned. Detta gör inte bara att man kan replikera och verifiera/falsifiera våra resultat, utan detta är även värdefullt för den som vill göra andra typer av analyser med materialet än vad vi har gjort. Dessutom kan man med öppen data bygga vidare från resultat till resultat på ett intressant sätt. Humaniora har nog en del att lära av naturvetenskaperna på detta område.

Dessutom är det fritt att använda alla våra visualiseringar och figurer, så länge man refererar korrekt!

\\

För den datorintresserade:

PLOS ONE har en policy att all data ska vara helt och hållet replikerbar, figur för figur. Eftersom Excel är ett svåranvänt program för att göra saker med data fick jag göra en liten bisarr lösning. I S1 Appendix finns ett litet Pythonskript som emulerar en Topic-sökning i Web of Science. Detta används för att räkna hur många artiklar ett citizen science-projekt har producerat, men man måste ta ut och återimportera data ur Excel/LibreOffice för att kunna återskapa detta resultat. Det är lite otydligt när det bara är inklistrat i ett kalkylark, men så här ser det ut:

#Use with Python 3 or greater
import re

#Export the raw data from the Excel sheet as a comma separated file.
with open('NamesSearch633recs20151016.csv','r') as csv:
    next(csv) #skip the first line containing only headers
    WoSdata = [line.strip().split('","') for line in csv] # Change the delimiter according to your desired output. Could be \t or simply one comma.

#Save the project names from the Excel file as a plain text file delimited with a newline (\n)
with open('projectnames.txt', 'r') as thefile:
    projectnames = [] #build a list to iterate the search below
    for line in thefile:
        projectnames.append(line.rstrip().split("\n"))

for n in projectnames: #Iterate over each project name to build a search string
    searchword = n[0] #This accesses the project name
    counter = 0 #reset the counter to count occurences.
    for W in WoSdata:
        TSsearch = W[4] + W[8] + W[10] #This emulates the WoS Topic Search, accessing Title, Keywords, and Abstract (but leaves out keyword plus as found in W[9])
        match = re.findall(searchword, TSsearch, flags=re.IGNORECASE) #Ignorecase is needed (as this is default in WoS TS)
        if match:
            counter +=1

    print(searchword + "\t" + str(counter))

#To re-import to excel, pipe the output to a new text file,
#which will in turn be a tab-separated file that can nicely
# be pasted into a spreadsheet and then sorted

Detta hade man säkert kunnat göra inuti Excel, men det känns icke-transparent på något sätt. För att emulera en Topic-sökning i Web of Science så söker man efter ett ord i Titel, Abstract eller Keywords. Nuförtiden har WoS lagt till Keyword Plus (maskininlärda nyckelord), vilket är väldigt oberäkneligt, eftersom man då måste veta exakt hur Keyword Plus-algoritmen i sin tur är tränad. Så lösningen ovan tar bort det problemet. Detta är en slags funktionalitet som jag tänkte skriva rent som en enskild funktion, men även lägga in i Citepy.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Time limit is exhausted. Please reload CAPTCHA.