Månadens profil: Jim O´Regan
Jim O´Regan är språkteknolog och doktorand på Språkbanken Tal. Han arbetar med flera projekt inom Nationella språkbanken, bland annat med taligenkänning av Riksdagens debatter om terrorism och med talteknologi för minoritetsspråk.
Vad jobbar du med just nu?
–Jag arbetar med flera projekt. Ett av dem är SweTerror, vars mål är att visa hur terrorism figurerat i svensk politik från 1968 fram till idag.
Vi använder data från riksdagen, och tar avstamp i material från de senaste 10 åren som består av 5 000 timmar ljudinspelningarna av debatterna i riksdagen. Sammantaget spänner materialet över 70 år, även om allt inte är digitiserat ännu.
Vi kommer att använda teknik för att omvandla tal till text på de här ljudupptagningarna. Ljudbanden från debatterna är redan kompletterade med texter, men de är ofta inlämnade i förväg, så talen skiljer sig ofta från textunderlagen.
Vilka resultat hoppas ni på?
– Ljudbanden från debatterna ger ökad inblick i vad som sagts om terrorism, vilka ord som har använts, hur de sägs och hur begreppet terrorism har förändrats över tid
När texterna är transkriberade på nytt analyserar psykologer materialet och några resultat har redan presenterats. Bland annat kan våra transkriberingar göra det möjligt att studera känslornas betydelse i debatten om terrorismen.
Vi tränar ett system med mål att få ett dataset som är skräddarsytt för den här typen av tal där vi kan skapa anpassade modeller för varje talare för att få mer korrekta transkriptioner och fonetiska transkriptioner. Med vårt system kan vi därför även få helt nya möjligheter att se hur språket förändrats över tid.
Vad händer framöver?
– En generell trend inom AI är att om du tränar en modell på en sak, kan den fungera för andra. Till exempel kan modeller tränade på stora samlingar av tal sedan finjusteras för andra uppgifter där det finns mycket mindre data. Just nu undersöker jag hur vi kan skapa en struktur för taligenkänning för svenska, och i förlängningen även för minoritetsspråken i Sverige.
Tillsammans med forskare i Sverige, Finland och Norge arbetar jag med taligenkänning för samiska. Samisk arkiv, Sámi Arkiiva i Norge har en stor samling med över 6 000 tusen timmar inspelningar av nordsamiska. Här tränar vi nätverk för att få system som fungerar. Därefter hoppas jag kunna skapa fungerande taligenkänning även för meänkieli, jiddish och romani.
Publicerad den
Uppdaterad den