Projektet Tilltal

Projektet Tillgängligt kulturarv för forskning i tal (Tilltal) undersöker hur talteknologiska metoder kan göra historiska talinspelningar mer tillgängliga för forskare.

Underutnyttjat material

På bilden dokumenteras en av de många intervjuer som på 1960-talet gjordes med utvandrade svenskar i Chicago.

De äldsta inspelningarna i Isofs samlingar är från 1890-talet och inspelningstekniken har skiftat flera gånger sedan dess. På bilden dokumenteras en av de många intervjuer som på 1960-talet gjordes med utvandrade svenskar i Chicago (Isof, ULMA Sv-Am 1962:1:77).

I arkiven på svenska minnesinstitutioner finns stora mängder inspelat tal som innehåller information av stort intresse för humanistisk och samhällsvetenskaplig forskning. I nuläget utnyttjas sällan dessa källor eftersom det saknas metoder för att hantera arkivens ljudande material. Projektet Tilltal utgår från talinspelningar i isofs arkiv och undersöker hur talteknologiska metoder och verktyg kan anpassas och utvecklas för att bearbeta stora mängder historiska talinspelningar.

Projektet startade under 2017 och är ett samarbete mellan institutet, Kungliga Tekniska högskolan och Riksarkivet med koppling till forskningsinfrastrukturprojektet SWE-Clarin. Från Isof deltar både språkteknologer och forskare i dialekter och folkminnen.

Delstudier inom olika forskningsområden

Projektet rymmer tre delstudier och en användarstudie. I delstudierna undersöks hur talteknologin kan användas för att undersöka frågeställningarna inom olika ämnesområden (etnologi, språkvetenskap och samtalsforskning). I användarstudien anläggs ett verksamhetsteoretiskt perspektiv för att undersöka hur arkivmaterialen används för forskning. Med hänsyn till forskarnas behov föreslås språkteknologiska lösningar och bedöms deras användbarhet i praktiken med hjälp av användningsfall.

Från erfarenhetsberättelser till kulturarv

Delstudien är en undersökning av Karl Gösta Gilstrings samling vid Dialekt- och folkminnesarkivet i Uppsala. Samlingen består av tiotusentals brev och uppteckningar samt 250 timmar inspelade intervjuer. Språkteknologiska metoder prövas för att hantera det stora och varierande materialet. Förhoppningen är att olika materialkategorier kan sammanföras så att det till exempel går att från en intervjusituation länka vidare till när samma ämne eller berättelse omtalas i brev eller annat skrivet material.

svartvit bild på man i kostym som sitter bredvid äldre kvinna

Karl Gösta Gilstring spelar in intervju med Judith Johansson.

Språklig variation i tid och rum

Målet med denna delstudie är att utveckla nya metoder för att undersöka språklig variation och förändring i talmaterial. I studien genomförs undersökningar av språklig variation på olika nivåer; fonetisk/fonologisk, prosodisk och syntaktisk. Tidigare studier på området blir viktiga utgångspunkter och genom att använda talteknologiska metoder för liknande frågeställningar ges en uppfattning om vad dessa metoder kan tillföra. Ett exempel kan vara att med talteknologiska metoder automatiskt hitta och samla alla belägg på ett visst ljud. De talteknologiska metoderna kommer att anpassas och utvecklas för att analysera talspråk med dialektal prägel.

Interaktionsmönster i tid och rum

Inom talteknologi har man skapat modeller som besvarar frågor inom samtalsforskningen: hur ordet växlar från en talare till en annan, hur återkopplingen fungerar, hur medhåll eller ifrågasättande uttrycks och hur gemensam förståelse uppnås. Delstudien syftar till att ta fram en sådan interaktionsmodell för material som består dels av olika samtalstyper, dels av jämförbara material från olika tider. Resultatet blir en beskrivning av likheter och olikheter mellan typer (synkrona jämförelser) och tid (diakrona jämförelser; språkutveckling) ur ett interaktionellt perspektiv.

Slutrapport: Att tillgängliggöra kulturarvsmaterial för forskning i tal

I juni 2021 publicerades rapporten Att tillgängliggöra kulturarvsmaterial för forskning i tal Pdf, 2.2 MB.. Rapporten tar bland annat upp de studier och aktiviteter som genomförts inom projektet.

logotyper

Länkar och lästips

Riksbankens jubileumsfond: Tilltal - Tillgängligt kulturarv för forskning i tal Länk till annan webbplats.
Nätverket SWE-CLARIN Länk till annan webbplats.

Publikationer

Johanna Berg (2021): Att tillgängliggöra kulturarvsmaterial för forskning i tal: Upptäckter och lärdomar från ett tvärvetenskapligt samarbetsprojekt Länk till annan webbplats.. Institutet för språk och folkminnen.

Johanna Berg, Rickard Domeij, Jens Edlund, Gunnar Eriksson, David House, Zofia Malisz, Susanne Nylund Skog & Jenny Öqvist (2016): Tilltal – making cultural heritage accessible for speech research Länk till annan webbplats.. Paper vid CLARIN Annual Conference 26–28 oktober 2016. i Aix-en-Provence, Frankrike.

Johanna Berg, Rickard Domeij, Jens Edlund, Gunnar Eriksson, David House, Zofia Malisz, Susanne Nylund Skog & Jenny Öqvist (2017): Involving users and collaborating between disciplines in making cultural heritage accessible for research Länk till annan webbplats.. Paper vid CLARIN Annual Conference, Budapest Ungern, 18–20 september 2017.

Johanna Berg, Rickard Domeij, Jens Edlund, Gunnar Eriksson, Per Fallgren, David House, Eva Lindström, Zofia Malisz, Erik Magnusson Petzell, Susanne Nylund Skog & Jenny Öqvist (2018): Making Archival Speech Recordings Accessible for Research – A Report from the Tilltal Project. I Skott & Strandberg (eds) (2018) Svenska landsmål och svenskt folkliv 2018 Länk till annan webbplats., s. 171 – 178: The Royal Gustavus Adolphus Academy for Swedish Folk Culture, Uppsala.

Rickard Domeij, Gunnar Eriksson, Eva Lindström, Zofia Malisz, Erik Magnusson Petzell, Susanne Nylund Skog, Fredrik Skott & Jenny Öqvist (2019): Text as an entryway to speech – a journey into the most inaccessible areas of the archives. I: Book of abstracts 4th Conference of The Association Digital Humanities in the Nordic Countries DHN Länk till annan webbplats., Copenhagen Danmark 6–8 mars 2019.

Rickard Domeij, Jens Edlund, Gunnar Eriksson, Per Fallgren, David House, Eva Lindström, Susanne Nylund Skog & Jenny Öqvist (2020): Exploring the archives for textual entry points to speech - experiences of interdisciplinary collaboration in making cultural heritage accessible for research. I: Steven Krauwer & Darja Fišer (red) Proceedings of the Twin Talks 2 and 3 Workshops at DHN 2020 and DH 2020 Länk till annan webbplats., s 45–55. Ottawa Canada & Riga Latvia, 23 juli & 20 October 2020.

Per Fallgren, Zofia Malisz & Jens Edlund (2018): Bringing Order to Chaos: A Non-Sequential Approach for Browsing Large Sets of Found Audio Data Länk till annan webbplats.. LREC Tokyo Japan 7–12 maj 2018.

Per Fallgren (2019): Towards fast browsing of found audio data: 11 presidents Länk till annan webbplats.. DHN, Köpenhamn Danmark 6–8 mars 2019.

Per Fallgren (2019): How to annotate 100 hours in 45 minutes Länk till annan webbplats.. Interspeech. Graz Österrike 15–19 september 2019.

Per Fallgren & Jens Edlund (2021): Human-in-the-Loop Efficiency Analysis for Binary Classification in Edyson Länk till annan webbplats.. Interspeech. Brno Tjeckien 30 augusti – 3 september 2021.

Per Fallgren (2022): Found speech and humans in the loop: Ways to gain insight into large quantities of speech Länk till annan webbplats. (Doctoral dissertation, KTH Royal Institute of Technology).

David House, Per Fallgren & Jens Edlund (2019): Speech Technology for Swedish: Current Impact Areas for Applications and Edyson, an Innovative Tool for Accessing Speech Data. I Proceedings: Language Technologies for All (LT4All): Enabling Linguistic Diversity and Multilingualism Worldwide Länk till annan webbplats., Unesco, Paris Frankrike, 4–6 december 2019.

Erik Magnusson Petzell (2019): Automatisk transkribering av landsmålstext. I Skott & Strandberg (red): Svenska landsmål och svenskt folkliv 2018 Länk till annan webbplats., volym 141, s 184–199. The Royal Gustavus Adolphus Academy for Swedish Folk Culture, Uppsala.

Erik Magnusson Petzell (2020). Handwritten Text Recognition and Linguistic Research Länk till annan webbplats.. I: Reinsone et al. (red) Proceedings of the Digital Humanities in the Nordic Countries 5th Conference, s. 302–309. DHN Riga 20-13 oktober 2020.

Zofia Malisz, Jenny Öqvist, Per Fallgren, Jens Edlund & David House (2017): Visualising vocalic variability in space and time – automatic exploration of “found data Länk till annan webbplats.. Paper vid 47th Poznań Linguistic Meeting, Adam Mickiewicz University, Poznań, Polen 18–20 September 2017.

Susanne Nylund Skog (2019): CLARIN Knowledge Centre for the Languages of Sweden. Interview 138–139 ff. I Fišer & Lenardič (red) Tour de CLARIN Vol 2. Common Language Resources and Technology Infrastructure Länk till annan webbplats.. November 2019.

Susanne Nylund Skog (2019): Från Småland till Michigan, och tillbaks igen: Verklighetens fiktiva platser i en svenskamerikans berättelser. I: Svenska Landsmål och Svenskt Folkliv: Tidskrift för talspråksforskning, folkloristik och kulturhistoria Länk till annan webbplats., Volym 141, s. 75–92.

Susanne Nylund Skog (2020): From Oskar Parish, Småland, to Manistique, Michigan: Placing People and Depicting Places. I: Culture Unbound, Volume 12, issue 1 Länk till annan webbplats., 2020: 196–216. Published by Linköping University Electronic Press.

Susanne Nylund Skog (2020): A Formidable Success and an Exceptional Storyteller: Analyzing Stories From an Interview Conducted by Barbro Klein in 1967. I: Western Folklore, Volume 79, Number 4 Länk till annan webbplats.: 427–451.

Maria Skeppstedt, Magnus Ahltorp, Rickard Domeij, Gunnar Eriksson & Jenny Öqvist (2021): Mining for Recurring Themes in Speech Recording Descriptions Länk till annan webbplats.. Presented at the The 9th Swedish Workshop on Data Science.

Maria Skeppstedt, Rickard Domeij & Fredrik Skott (2021): Snippets of Folk Legends: Adapting a Text Mining Tool to a Collection of Folk Legends Länk till annan webbplats.. Post-Proceedings of the 5th Conference Digital Humanities in the Nordic Countries (DHN 2020).

Projektfakta

Projektansvarig
Rickard Domeij, språkvårdare med ansvar för språkteknologi, Isof

Projektdeltagare

Varaktighet
2017–2020

Samverkan
Samverkansprojekt mellan Isof, Kungliga Tekniska högskolan och Riksarkivet.

Bidragsgivare
Drivs med anslag från Kungl. Vitterhetsakademien och Riksbankens Jubileumsfond