Tilltalsbloggen

Både bredd och djup på Tekniska museet

”Digitala modeller” bjöd in till seminarium på Tekniska museet den 17 maj. För tredje gången samlades de projekt som fått stöd i Riksbankens jubileumsfonds och Vitterhetsakademiens speciella satsning på Samlingarna & forskningen.

Dagen öppnades av Åsa Marnell som dels betonade att material som digitaliserats blir mer använda, efterfrågade och nyttiggjorda, även internationellt, dels att det för Tekniska museet varit viktigt att också lägga en publik dimension till forskningsarbetet. Bland annat så har scanningen av Polhems mekaniska alfabet genomförts inför besökare, och resultaten presenteras nu i en fysisk utställning på museet.

Presentation av projekten

Därefter presenterades i högt tempo alla berörda projekt. Många utgår naturligtvis från text-källor av olika slag, och de problem och möjligheter som ligger i OCR (& HTR) och NER (named entity recognition) togs upp i flera presentationer. Värdet av TEI- och XML-kodning betonades av bland annat Text till Tiden på Kungliga bibilioteket och TORA på Riksarkivet. Samtidigt som jag också tycker att vi ser ett ökat intresse för andra typer av källor, visuellt material av olika slag och i projektet Tilltal även ljudinspelningar.

Per Fallgren, KTH, berättar om verktyg för taligenkänning.

Per Fallgren, KTH, berättar om verktyg för taligenkänning.

Annars var den tydligast återkommande frågan hur man kan hitta sätt att (åter)koppla källmaterial som egentligen hör ihop. Talinspelningarna på Isof är till exempel svåra att hantera utan de interna sekundärkällor – fältdagböcker, inspelningsjournaler, exceperingar etc – som kan ge dem sammanhang och därmed bidra till en fördjupad förståelse för innehållet. Evighetsrunor och Vardagens bilder beskriver liknande utmaningar, kompletterade med att det där även finns fysiska föremål att lägga till buketten. Bekönade rum söker ofta sina källor i material som inte alls upprättats i linje med projektets syften, och visar tydligt att ny kunskap kan utvinnas då material från olika domäner tvinnas samman. I Aroseniusprojektet ökar svårighetsgraden ytterligare då relevanta källor också finns långt utanför institutionerna, i privatarkiv eller hemma hos konstnärens släktingar och vänner. För Beundran och förundran, om Museum Stoaeanum i Lund, är hela syftet just att försöka samla ihop en splittrad samling. Sammantaget visar projekten att det är ett resurskrävande, men djupt meningsfullt, arbete att söka knyta ihop dessa ”trådar” (Nordiska museet) eller ”knippen” (Isof) och återge källorna deras dignitet.

Länkade öppna data (LOD) lyftes fram speciellt av TORA-projektet på Riksarkivet, som utgår ifrån den extremt detaljrika by/gårds-informationen i de kartor som mättes upp och ritades av det svenska Lantmäteriverket (det första i världen) på 1600-talet. TORA påminde också om att LOD i grunden inte är en teknikfråga, utan framför allt handlar om sådant som konsekvent metadatastruktur & informationsarkitektur.

Möjligheter och begränsningar

Avslutningsvis pekade Pelle Snickars på de möjligheter och begränsningar som följer med nya digitala representationer av samlingsmaterial. 3D-tekniken gör det till exempel möjligt att virtuellt vrida och vända på ett objekt, men det är fortfarande svårt att se de mekaniska principer som Polhemsmodellerna är tänkta att visa. Språkteknologi kan vara fantastiskt användbart för textanalys, men ofta krävs initialt mycket arbete med att rätta OCR och träna språkmodeller. Det är alltså viktigt att komma ihåg att de digitala samlingarna (också) kräver löpande kurering och stegvis förbättringsarbete. Bara för att man överfört ett analogt original till digital form är man inte klar.