Öppna språkdata

På den här sidan finns information om och länkar till Isofs öppna språkdata.

Vad är öppna språkdata?

Öppna språkdata är språkresurser som är fritt tillgängliga att ladda ner, sprida och använda. Det kan till exempel vara ordlistor och textsamlingar. Resurserna kan bland annat användas som stöd för översättning och tolkning, forskning och som data för utveckling av språkteknologiska verktyg.

Språkresurser från Isof

Bland Isofs resurser finns ordlistor på några av de nationella minoritetsspråken, Lexin och myndighetsdata. I tabellen nedan hittar du en sammanställning över de resurser som i nuläget finns tillgängliga i Isofs resurskatalog. Du hittar också mer information om resurserna och deras metadata hos Svensk nationell datatjänst Länk till annan webbplats..

Namn

Beskrivning

Sökväg

Termlistor från Rikstermbanken

Termlistor i Rikstermbanken som kommer från offentlig verksamhet, Terminologicentrum TNC och Svenska datatermsgruppen.

Gå till termlistor från Rikstermbanken i Isofs resurskatalog Länk till annan webbplats.

Termlistor från Terminologicentrum TNC

Termlistor från Terminologicentrum TNC som rör olika fackområden. Listorna innehåller facktermer på flera språk, bland annat svenska, franska, engelska, tyska och ryska.

Gå till termlistor från Terminologicentrum TNC i Isofs resurskatalog Länk till annan webbplats.

Svensk-romska ordlistor

Svensk-romska ordlistor är en samling ordlistor mellan svenska och olika romska dialekter. Ordlistorna är ämnesinriktad på samhällsord, det vill säga ord för den som vill orientera sig i det svenska samhället. Det rör sig till viss del om ord och begrepp som är unika för det svenska samhället och som därför kräver särskilda översättningar. De romska dialekterna som förekommer i datamängden är arli, kalo, kelderasch och lovari. Totalt ingår 14 ordlistor.

Gå till svensk-romska ordlistor i Isofs resurskatalog Länk till annan webbplats.

Myndighetstermlistan

Termlistan är utarbetad inom Myndighetstermgruppen, en arbetsgrupp med representanter från olika svenska myndigheter. Gruppen leds av språkvårdare och terminologer från Språkrådet, Isof. Myndighetstermgruppen initierades av Språkrådet och bildades i samband med projektet Flersamterm hösten 2021. Listan är på svenska, engelska, finska, arabiska, romska (arli och kelderasch).

Gå till Myndighetstermlistan i Isofs resurskatalog Länk till annan webbplats.

Läs mer om Myndighetstermlistan och projektet Flersamterm Länk till annan webbplats.

Meänkieli-svensk-meänkieli ordbok

Meänkieli-svensk-meänkieli ordbok är en digital ordbok som består av cirka 30 000 ord med översättningar från meänkieli till svenska och från svenska till meänkieli. Orden är märkta med ordklass. I vissa fall finns exempel och geografisk märkning.

Gå till Meänkieliordboken i Isofs resurskatalog Länk till annan webbplats.


Läs mer om Meänkieliordboken Länk till annan webbplats.

Jiddisch-svensk-jiddisch ordbok

Jiddisch-svensk-jiddisch-ordboken innehåller omkring 8 200 uppslagsord. Den består av tre delar: en svensk-jiddisch del, en jiddisch-svensk del där sökorden följer det hebreiska alfabetet och en transkriberad jiddisch-svensk del där sökorden följer uttalet utifrån det svenska alfabetet.

Gå till Jiddischordboken i Isofs resurskatalog Länk till annan webbplats.

Lexin

Lexins flerspråkiga lexikon omfattar mellan 5 000 och 28 500 uppslagsord; vardagliga ord och fraser samt samhällsord. Till uppslagsorden ges språkexempel, satskonstruktion, stilistisk och grammatisk kommentar, sakupplysning samt förklaring och/eller synonym. Den svenska ordbasen som ligger till grund för de tvåspråkiga lexikonen har utarbetats av Göteborgs universitet.

Gå till Lexin i Isofs resurskatalogen Länk till annan webbplats.

Myndighetstext och terminologi

Språkdata i form av översättningsminnen, parallella texter och termresurser från svenska myndigheter på svenska med översättningar till ett eller flera europeiska språk.

Gå till myndighetsdata i Isofs resurskatalog Länk till annan webbplats.

Sverigefinska ordlistor

Svensk-sverigefinska ordlistor inom olika områden, framtagna av Sverigefinska språknämnden och Språkrådet. Ordlistorna behandlar bland annat socialförsäkring, vård och omsorg, politik, utbildning, djur och natur i Sverige.

Gå till sverigefinska ordlistor i Isofs resurskatalog Länk till annan webbplats.

Tolkordlistor

Omfattar termer inom rättsväsendet, den allmänna försäkringen, sjukvården och arbetsmarknaden. Finns på flera språk.

Gå till tolkordlistor i Isofs resurskatalog Länk till annan webbplats.

Om upphovsrätt

Syftet med öppna språkdata är att det ska vara fritt att använda. Därför har Isof släppt språkdata med olika fria upphovsrättslicenser.

De flesta av Isofs språkresurser går under licensen Creative Commons BY (CC-BY). Det innebär att vi tillåter andra att använda, sprida, göra om, modifiera och bygga vidare på materialet, även i kommersiella sammanhang – mot att den som använder, bearbetar eller sprider materialet ser till att det framgår att Isof är upphovsman.

Mer information om CC-BY hittar du här Länk till annan webbplats.

En del av materialet är tillgängligt via licensen Public Domain Mark (PDM) eller CC0. Dessa resurser har ingen upphovsrätt. Det är material som inte innehåller verk eller skyddade prestationer, alternativt innehåller enbart handlingar som är undantagna från upphovsrätt enligt 9 §, eller verk för vilka skyddstiden har gått ut.

Mer information om PDM hittar du här. Länk till annan webbplats.

Mer information om CC0 hittar du här. Länk till annan webbplats.

Vilken licens varje öppna språkdata har framgår i resurskatalogen.