Tilltalsbloggen

Vad var det de sa?

För en sökmotor är icke transkriberat ljud omöjligt att hitta. I en skriven text som den här blir varje ord ett spår, som kan hjälpa nya användare att hitta fram till och upptäcka material online. Men i talad form blir samma ord osynliga, och det gör att inspelade röster sällan får den publik de förtjänar.

Pop Up Archive. vill göra mycket mera ljud sökbart och hittbart på webben. Så här fungerar det: Man laddar upp en ljudfil med inspelat tal. Tjänstens programvara transkriberar innehållet och märker upp det. Därefter kan man lätt justera den automatiska transkriberingen, tjänsten tillhandahåller verktyg, eller bara låta sökmotorerna göra sitt med de nyckelord som programmet genererat.

Pop Up Archive är en kommersiell, internetbaserad tjänst för arkivering och organisering av digital media. Det uppdrag de åtagit sig är att göra ljud sökbart och bygga ett arkiv över inspelningar till glädje för forskare, journalister och medieaktörer i hela världen.

Som komplement till Pop Up Archive finns också en specialutvecklad sökmotor för poddar och radio i fulltext. Audiosear.ch. omvandlar tal till text, indexerar och analyserar det för att kunna bygga ett API med miljontals datapunkter (dvs ämnen, enheter, personer etc) primärt för att hjälpa radiostationer och annonsörer att göra bra innehåll.

Sorgligt nog fungerar tjänstens programvara för tal-till-text bara på engelskspråkiga material. Och eftersom transkriptionsmodellen är tränad på massmedia (radioinspelningar), fungerar den allra bäst på dialekter som är välrepresenterade i brittisk och amerikansk etermedia.

Men Pop Up Archive visar ändå vad som är möjligt att åstadkomma om man bara har tillräckligt mycket data att träna sina modeller på, och det är imponerande.

/Johanna Berg