Tilltalsbloggen

Tilltals workshop på KTH

 Tilltals-projektets senaste workshop ägde rum på KTH i Stockholm den 11–12 april 2019. Tanken med dagen var att presentera läget för de olika spåren i forskningsarbetet, och med en mindre krets särskilt inbjudna gäster fördjupa diskussionen och pröva nya tankar.

Dagarna inleddes av Johan Oomen, från Nederlands Instituut voor Beeld en Geluid (Netherlands Institute for Sound and Vision) som berättade om sina erfarenheter av att arbeta med både gammalt och nytt ljudmaterial på en institution som är museum och arkiv i ett, både bevarande, forskningsfrämjande och publik. Johans presentation finns här. Länk till annan webbplats. och han visade också några webbtjänster som exempel på tal-användning: Mind of the Universe Länk till annan webbplats. och Voice of Rembrandt Länk till annan webbplats..

Därefter presenterade Rickard Domeij de övergripande idéerna bakom Tilltal och sedan fick vi aktuella dragningar av de tre spår som på olika sätt söker svar på hur vi idag kan arbeta med äldre talinspelningar i relation till andra material.

Spår 1

Susanne Nylund-Skog (spår 1) berättade för oss om Gilstrings arkiv, hans informant nr 92 Carl Nelson, och hur dennes minnen från Småland – dokumenterade i brev och inspelningar – kvarstår och förändras efter många decennier i USA.

Spår 2

Jenny Öqvist (spår 2) presenterade sin forskning om lingvistisk variation i tid och rum, som alltid med särskilt fokus på stockholmska uttal. Jenny belyste också behovet av att hitta metoder för att på bästa sätt kunna använda de korresponderande källor som finns inom arkiven och som har stor potential att underlätta förståelsen för det rena taldatat. Inspelningsjournaler, fältdagböcker och transkriberingar kan t ex ge avgörande kontext till rösterna på banden. Erik Petzell har utgått ifrån vad språkforskare gjorde innan det fanns teknik för att spela in tal – noterade informanternas uttal, för hand och på landsmålsalfabet. Sådant material finns i rikt mått inom ISOF och är svårläst för de flesta som inte har särskild träning i ryggen. För att göra materialet lättare att forska på har Erik arbetat med HTR (hand written text recognition) och tränat datamodeller på Transkribus. Resultaten är över förväntan!

Spår 3

Jens Edlund (spår 3) påminde om att det inte finns någon motsättning mellan kvantitativ och kvalitativ metod, han visade exempel på samtalsinteraktion och berättade om hur TMH processar inspelat tal som ljud. Jens tog också upp human-in-the-loop, ett vanligt buzzword i AI-svängen, men det pekar på något viktigt. Maskiner kommunicerar bra om vissa typer av saker, men på många områden får man avsevärt bättre resultat om man kompletterar med mänsklig feedback – i all synnerhet om den kommer från folk med relevant ämnesexpertis. Så demade Per Fallgren sitt arbete med verktyg för automatiserad klustring av superkorta ljudsegment. Hur kan man ringa in vad som är tal respektive inte-tal? Eller kanske hitta vokalerna?

Internationella gäster avslutade dagen

Därefter följde ett pass där våra internationella gäster generöst delade med sig av sina erfarenheter på området. Janne Bondi Johannesen, från Text-lab Oslo, presenterade LIA (language infrastructure made available) som innehåller bl a dialektkorpusar av norskt dialektmaterial, både bandat & transkriberat. Christoph Draxler, från BAS München, underströk vikten av att balansera IPR/GDPR mot allmänintresse, att lära sig och använda flera verktyg (så att man inte blir alltför beroende av ett) och att säkra sina data för framtiden mm.

Både Janne och Christoph visade också verktyg och webplattformar som kan vara till nytta i vårt fortsatta arbete. Det är vi tacksamma för!

/Johanna Berg