Tilltalsbloggen

Vad är problemet?

Många arkiv i världen innehåller stora mängder inspelat tal, som borde kunna vara en fantastisk källa för både forskning och allmänhet. Men tyvärr är materialen ofta svårgenomträngliga eller nästan omöjliga att orientera i. De kan vara bristfälligt etiketterade och metadatasatta, och finns det utskrifter någonstans är det inte säkert att de kan kopplas till rätt bärare eller ljudfil.

New York Public Library (NYPL) använder crowdsourcing för att transkribera inspelningar i projektet Together we listen.

Med tal-till-text-teknik kan man låta en dator förvandla ljud till bokstäver. Den är under snabb utveckling och det är lättare än förr att dela ljud på webben. Men de transkriberingar som kan genereras automatiskt gör fortfarande missar och fel, så de måste gås över av ett mänskligt öga och rättas för att ge användbart resultat. Vore det inte en bra idé försöka få dator och människa att samarbeta så smidigt som möjligt?

New York Public Library (NYPL) gör många bra saker. De har bl a tagit fram flera fina crowdsourcing-projekt de senaste åren, och driver sedan 2013 också ett Community Oral History Project Länk till annan webbplats., som med hjälp av volontärer samlar muntligt berättande i olika delar av staden. I april 2016 kopplades dessa olika utvecklingslinjer samman i Together We Listen. Länk till annan webbplats. som tagit fram ett online-verktyg. för att göra det lättare för vem som vill att hjälpa till att rätta automatisk transkribering.

Så kan materialen bli mer tillgängliga för alla användare. Den som inte hör kan läsa. Den som inte kan engelska kan översätta. Den som är nyfiken på Harlems historia eller de stora grönsaksodlingarna i Bronx kan få sitt lystmäte. Det är fint!

/Johanna Berg