AI som risk och möjlighet inom arkiv

Kan AI hjälpa oss att förstå historien bättre – eller riskerar den att förvränga den? Med hjälp av inspelningar som tillgängliggjorts av Språkbanken Sam utforskar Johannes Widegren, doktorand vid Linnéuniversitetet, hur AI kan öppna samiska arkiv.

Vad är målet med projektet?

– I mitt avhandlingsprojekt ”Människocentrerad artificiell intelligens för förbättrad tillgänglighet och sökbarhet i samiska arkivsamlingar” vill jag undersöka hur AI kan användas för att göra arkiv mer tillgängliga och sökbara. Just nu kartlägger och granskar Sanningskommissionen för det samiska folket den politik som förts gentemot samerna i ett historiskt perspektiv och dess konsekvenser för det samiska folket. Som en del av mitt projekt vill jag se vilka möjligheter AI kan ge för att öka kunskapen om samisk historia. Kan AI bidra till att bredda historieskrivningen, eller riskerar den att förvränga den?

Hur har du gått tillväga?

– Jag har arbetat med 14 intervjuinspelningar från Institutet för språk och folkminnens samiska samlingar. Inspelningarna är på svenska med inslag av nord- och sydsamiska, och det är vanligt att talarna växlar språk mitt i en mening, vilket skapar särskilda tekniska utmaningar. För att bearbeta materialet har jag använt verktyget KB-Whisper för automatisk transkribering och Googles Gemini för att skapa ett tematiskt index som man kan öppna i exempelvis excel, tillsammans med en tesaurus utvecklad av SAMLA och Språkbanken för att strukturera och ämnesindexera innehållet. Resultatet blir tidskodade transkriberingar som går att söka i, och som dessutom kan organiseras i tematiska sektioner med rubriker och nyckelord.

En viktig aspekt i arbetet är att arkivmaterial ofta är känsligt och innehåller personliga berättelser. AI kan innebära en risk för att kontrollen över materialet minskar, så jag är intresserad av att undersöka hur mycket som är möjligt att göra lokalt på en dator.

Vilka fördelar ger AI?

– För att söka i ett digitalt arkiv krävs exakta taggade nyckelord för att få en träff. Med AI kan man få en automatisk beskrivning snabbt som ökar chanserna att få en träff. Särskilt ljudarkiv, som tidigare varit tidskrävande att söka i, blir möjliga att navigera i på helt nya sätt. I förlängningen innebär det att fler människor kan få tillgång till källmaterial. Det öppnar också för en mer direkt upplevelse av historien. Det blir nästan som att sitta vid ett kaffebord och lyssna.

Vilka utmaningar finns?

– Arkiv formar vårt kollektiva minne, men hur vi tänker om historien beror på vilket material vi har tillgång till. Om vi söker med hjälp av AI, vilka prioriteringar och perspektiv har byggts in i tekniken? AI fungerar generellt bättre för material på majoritetsspråk och ämnen där det finns mycket information. För mindre språk och nischade ämnen fungerar det inte alls, eller ger en skev bild av innehållet. Tekniken saknar den kulturella förståelse som krävs för att tolka materialet. Vems världsbild speglas? Jag samarbetar därför med användare och olika kulturarvsinstitutioner. Tanken är att vi tillsammans ska bedöma om AI har gjort ett bra jobb.

Publicerad den

Uppdaterad den

Språkbanken Sam
Språkteknologi
Artificiell intelligens
Johannes Widegren, doktorand vid Linnéuniversitetet.

Johannes Widegren, doktorand vid Linnéuniversitetet. Foto: Samuel Åhl.