Vad är språkteknologi för små språk?

Vad är språkteknologi och vad används det till? Och varför saknas det teknologi för små språk? Trond Trosterud, professor i samiska språk vid Giellatekno på universitet i Tromsö, Norge berättar varför språkteknologiska verktyg är viktiga för att kunna läsa, skriva, förstå och prata små språk i Norden.

Trond Trosterud befinner sig i ett klassrum.

Trond Trosterud under en undervisning om språkteknologi på Tromsö universitet. Foto: Dagmara Szydlowska.

Vad är egentligen språkteknologi?

Språkteknologi är läran om hur en dator kan programmeras för att hantera mänskligt språk. Vi har större och större krav på att språk ska fungera i samhället idag med hjälp av en dator. Utan fungerande teknologiska verktyg blir det svårt att lära sig och utveckla ett språk.

Kan du ge exempel?

Enkelt förklarat, utan tangentbord, ingen text. Språkteknologi är en förutsättning för att man ska kunna använda ett språk i skrift. Vi språkteknologer som arbetar med minoritetsspråk jobbar med grundläggande språkteknologi. Till exempel att vi ska ha de rätta bokstäverna i språket för att kunna läsa.

Det ligger flera års arbete bakom varje bokstav och tecken som ska ha en egen kod eller ett tal. Språkteknologerna måste studera varje tecken noga och undersöka hur och om de används. Om inte bokstäverna finns blir det svårt att läsa en text. Det finns en internationell standard som innehåller merparten av världens tecken. När denna togs i bruk hade flera små språk i Norden problem med sina bokstäver. Till exempel kan det än i idag stå O??asat i mediabolagens appar om nyhetsprogrammet Ođđasat.

Först måste du kunna läsa språket. Nästa steg är att kunna skriva och då behöver du ett tangentbord för mobiltelefonen och datorn. Sen behöver du veta om det du har skrivit är rätt och då behöver du ett rättstavningsprogram. Du vill kanske också ha en grammatikkontroll, fortsätter Trond Trosterud.

Ett rättstavningsprogram markerar ord det inte känner igen med ett rött streck. För användare av ett litet språk kan det bli många röda streck för att programmet inte kan tillräckligt många av språkets ord och det blir svårt att veta om texten är korrekt.

En annan del av språkteknologi är att förstå text. Här jobbar språkteknologerna med maskinöversättning och ordböcker.

Och så har vi ljud, kan du till exempel prata med datorn om du är blind? Kan datorn läsa upp text för dig eller ge instruktioner när du kör bil? Detta funkar på svenska, men funkar det på meänkieli? Nej, inte idag. Kan du prata med datorn på nordsamiska till exempel? Nej, det går inte. Det är detta som är ljudteknologi.

Vilka språkteknologiska verktyg finns för de små språken i Norden idag?

Det varierar mycket. Det mesta som hänt inom språkteknologin för små språk i Norden har hänt här i Tromsö eller på Grönland. Vi i Tromsö har bland annat tagit fram rättstavningsprogram för sydsamiska, nordsamiska, lulesamiska, enaresamiska och skoltsamiska. Vi har också gjort digitala ordböcker som kan grammatik. Däremot har vi inte så mycket ljudteknologi, men vi jobbar på det. I förhållande till andra minoritetsspråk så är detta jättebra. Vi har även tangentbord för dator och mobiltelefon.

De nordiska minoritetsspråk som är minst utvecklade är de romska språken, men också meänkieli, kvänska och karelska har utmaningar, berättar Trond Trosterud.

Varför saknas det språkteknologi för små språk?

Minoritetsspråken blir uteslutna från de stora plattformarna som Google och Microsoft. De vill inte använda tredjepartsteknologi, utan vill göra allt själva. Vi har gjort jobbet, men vi får inte erbjuda våra program till minoritetsspråksanvändarna i Google- eller Microsoftprogram.

De stora techgiganterna har heller inget intresse att arbeta med de små språken. Isländskan som är ett statsbärande språk, men ett litet språk i jämförelse med övriga statsbärande språk i Norden, har fått kämpa för att inkluderas av de stora plattformarna.

Men det finns lösningar för de små språken, menar han.

Vårt förslag är att man skapar trepartsallianser mellan universitet, språkvetare och de berörda språksamhällena. Problemet idag är att språkbärararna inte fullt ut känner till vad vi gör.

Hur ser du på utvecklingen av språkteknologiska verktyg för små nordiska språk?

Alla minoritetsspråk drar nytta av det arbete vi har gjort för nordsamiskan. Om andra vill bygga och utveckla sin egen språkteknologi för andra små språk så kan de få grunden från oss, men vi kan inte uppmana språkbärarna att revitalisera sitt språk, det måste de göra själva – men vi kan erbjuda dem verktygen.

Lyssna på Trond, när han sätter sina egna ord på språkteknologi.

Ett kort utdrag från intervjun.

Undertexter och syntolkning. Filmen har undertexter. Klicka på ikonen T i det nedre högra hörnet i filmspelaren för att få fram undertexten. Filmen är också transkriberad. Aktivera transkribering i filmspelaren (ser ut som en pratbubbla med streck i).

Vilka språkteknologiska verktyg finns i dag?

Gå vidare till en översikt: Språkteknologiska verktyg för några av de små språken.

Gå vidare till de olika verktygen

Giellateknos hemsida: Giellatekno.uit.no. Länk till annan webbplats.

Divvuns hemsida: Divvun.no. Länk till annan webbplats.

Ordbok meänkieli-svenska-meänkieli: Språk.isof.se/meänkieli. Länk till annan webbplats.

Färöiska ordböcker: Sprotin.fo. Länk till annan webbplats.

Text: Karin Skoglund.