Söka i SOU via Linköpings universitet

Linköping University Electronic Press har gjort SOU-materialet sökbart i fulltext. Sökresultaten levereras i form av länkar till fulltext-pdferna på Kungliga Bibliotekets hemsida.

Testa sökverktyget här.

I en kommentar av signaturen MartLenn föreslogs programmet Solr som ett bra sökverktyg, vilket ledde till att Anders Fåk satte upp en testversion, som nu gjorts mera permanent tillgänglig.

Tjänsten är väldigt smidig för att snabbt hitta till rätt utredning, som genast blir tillgänglig. Att jämföra detta med att släpa sig ned till hyllorna för SOUer på biblioteket snuddar vid det bisarra. Detta gör det tusen gånger enklare att söka ofta och mycket.

\\

När det kommer till sökfunktionaliteter finns det ju många ingångar. Själv har jag mest jobbat med olika varianter av Grep för att även kunna inkludera sökträffarnas ”sammanhang”, alltså, för att få fram hela kontexten som ett ord figurerar i.

Men sökningar i textfiler som ligger på en hårddisk är långt ifrån optimalt. Mina programmeringskunskaper är ännu inte riktigt där, men snart tänkte jag bygga något som har ungefär den här funktionaliteten:

  • Läser in alla SOUer och sparar dem i en databas eller hashtabell som kan hållas i datorns minne. Exempelvis borde SQLite fungera bra.
  • Tillåter sedan sökningar både med enkla ord och reguljära uttryck.
  • Returnerar resultat dels som länkar till pdf-filerna (som ovan) men även som direkta textsjok ur plaintext-databasen.
  • Ovanpå detta bygger man ett gränssnitt som går att lägga ut på webben.

Funderingar kring detta?

Jag har en kraftfull maskin på GUs nät som kan användas för att göra en sådan söktjänst permanent tillgänglig för allt och alla.

2 reaktioner till “Söka i SOU via Linköpings universitet”

  1. Hej Christopher,
    skissar nu på en ansökan kring hela riksdagens öppna data. Jag har pratat med Lars Brink som nu ordnat så att även de nyare utredningarna finns tillgängliga på riktigt – inte bara som textfiler med bokstäver huller om buller som tidigare…. 🙂 Jag har ju byggt lite sökfunktionalitet i Mathematica men med det välbekanta problemet att det inte är webbaserat och öppet… maila mig gärna om du vill vara med i projektet – du är nummer ett på min lista. 🙂

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Time limit is exhausted. Please reload CAPTCHA.