Rapport från LREC-COLING

20–25 maj arrangerades konferensen LREC-COLING i Turin, Italien. Arianna Masciolini och flera andra medarbetare från Språkbanken Text var på plats.

Berätta om konferensen!

– The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) arrangerades av Language Resources Association (ELRA) och International Committee on Computational Linguistics (ICCL). Med 1 551 artiklar, 27 spår, över 40 workshoppar och tutorials och cirka 3 000 deltagare, varav de allra flesta på plats, hade konferensen ett rikt och stimulerande - till och med nästan överväldigande - program.

Hade konferensen något tema?

– LREC har ett särskilt fokus på språkresurser och COLING behandlar datalingvistik ur ett bredare perspektiv. Den gemensamma konferensen omfattade därför ett stort antal olika teman.

Stora språkmodeller var dominerande men även mer teorinära forskning fick gott om utrymme. Till exempel tilldelades priset för bästa artikel ett bidrag med titeln Targeted Syntactic Evaluation on the Chomsky Hierarchy.

Vad bidrog Språkbanken Text med?

– Två forskare och fyra doktorander var på plats och två distansdeltagare presenterade sitt arbete både på huvudkonferensen och på olika workshoppar. Jag fick en intensiv start på workshoppen Building and Using Comparable Corpora (BUCC) där jag presenterade mitt eget arbete med L2-parsing och SweDiagnostic, en språkresurs utvecklad av min kollega Felix Morger inom SuperLim-projektet.

Dimitrios Kokkinakis var huvudarrangör för RaPID-5, en workshop med fokus på resurser och bearbetning av språkliga, paralingvistiska och extra-lingvistiska data från personer med olika former av kognitiva, psykiatriska och utvecklingsmässiga funktionsnedsättningar. En av talarna på workshoppen var Marica Belmonte, tidigare praktikant på Språkbanken Text. På en parallell workshop, NLPerspectives, presenterade Anna Lindahl sitt arbete om inter-annotator disagreement i argumentationsanalys.

Dana Dannélls, Maria Irena Szawerna, Ricardo Muñoz Sánchez och Elena Volodina var några av författarna till tre artiklar som presenterades vid huvudkonferensens välbesökta postersessioner. Teman var semantisk rollmärkning, pseudonymiseringskategorier över domängränser och annoteringsverktyg för inlärarkorpusar. Vi deltog också i de workshops som hölls efter konferensen. Vid workshoppen om språkteknologi för historiska och forntida språk (LT4HALA) presenterade Ricardo en översiktsartikel om NLP för fornegyptiska, ett ämne som var särskilt passande då Turin är hemvist för ett berömt egyptiskt museum. Vid den allra sista postersessionen på Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD), presenterade Emilie Francis och jag en kort artikel om generering av syntetiska ordföljdsfel.

Nämn några höjdpunkter!

–Gästföreläsaren Michele Loporcaros bidrag med temat romanska dialekter i Italien blev särskilt omtyckt trots - eller kanske tack vare! - dess icke-tekniska innehåll, som gav oss datalingvister en kort men välförtjänt paus från vårt primära fokusområde. Personligen var dock den främsta höjdpunkten utan tvekan nätverkandet. LREC-COLING gav mig möjligheten att äntligen träffa forskare som jag hittills bara haft virtuell kontakt med, samt att diskutera idéer med människor som arbetar med ämnesfrågor med nära anknytning till mitt avhandlingsprojekt. Jag var särskilt glad över att lära känna det slovenska teamet som jag hoppas kunna börja samarbeta med i en nära framtid.

Publicerad den

Uppdaterad den

Språkbanken Text
Doktorander från Språkbanken Text

Deltagare på konferensen från vänster till höger: Ricardo Muñoz Sánchez, Marica Belmonte, Anna Lindahl, Emilie Francis och Arianna Masciolini.