Språkbanken Sam

Språkbanken Sam gör Isofs, Institutet för språk och folkminnens, arkivmaterial mer tillgängligt för både forskare och allmänhet.

Isof har stora mängder tal- och textmaterial. Språkbanken Sam arbetar för att göra detta material mer tillgängligt och användbart för forskning inom exempelvis humaniora och samhällsvetenskap. Det sker med hjälp av verktyg och metoder från språkteknologi och digital humaniora. Infrastrukturen som tas fram ska även användas för att tillgängliggöra material för allmänheten.

Språkbanken Sam fokuserar på två olika materialtyper:

  • Samhällstexter och termer för forskning om samhällskommunikation och samhällsförhållanden. Materialet är flerspråkigt med svenska texter och översättningar till exempelvis nationella minoritetsspråk och teckenspråk.
  • Berättelser och andra material i text och tal från dialekt- och folkminnessamlingarna. Handlar till exempel om uppteckningar, dialektordlistor, brev och inspelningar.

Arbetet innebär bland annat att:

  • Utveckla metoder för inhämtning av data. Handlar till exempel om webbfrågelistor, crowdsourcing, automatisk taligenkänning och webcrawling och skördning.
  • Utveckla lexikoninfrastruktur för att lagra, redigera, integrera och tillgängliggöra dialekt- och samhällsord.
  • Utveckla möjligheter att med hjälp av språkteknologiska verktyg märka upp, bearbeta och utforska text- och talmaterial i arkiven.
  • Utveckla gränssnitt, system och metoder för att hantera och tillgängliggöra digitalt arkivmaterial i kontext.

Läs mer

Publicerad den 05 augusti 2020

Uppdaterad den 25 augusti 2020