Hvad er dit forskningsfelt – kort beskrevet?
Mit forskningsfelt er Natural Language Processing (NLP), på dansk sprogteknologi. NLP beskæftiger sig med at udvikle (primært maskinlærings-)metoder til at behandle eller generere tekst automatisk. Disse metoder bliver anvendt til at lave holdningsanalyse, maskinoversættelse eller til at besvare spørgsmål i såkaldt naturligt sprog.
Min forskning fokuserer især på, hvordan naturlige sprogbehandlingsmetoder kan bruges til at studere og løse samfundsproblemer. Eksempler på dette er metoder til at lave automatisk faktatjek og afdække rygter for at bekæmpe falske nyheder online. Jeg har yderligere undersøgt metoder til at kvantificere forudindtagethed om køn indlejret i sprog.
Hvad er de forskningsmæssige udfordringer på dit felt?
Et væsentligt problem med de metoder, der pt. yder bedst, er, at de er uigennemsigtige, dvs. at det er vanskeligt at forklare, hvordan modellerne fungerer, og hvorfor de når frem til de forudsigelser, de gør. Det er især et problem ved de store sprogmodeller såsom ChatGPT, som netop kun kan tilgås via en API (en software, der får programmer og apps til at tale sammen). Til dette formål har jeg foreslået nye metoder til at generere og automatisk evaluere forklaringerne om, hvordan maskinlæringsmodellerne virker. Disse såkaldte Explainable AI (XAI) metoder kan bruges til at forstå, hvornår modellerne laver fejl, og dermed forbedre maskinlæringsmodeller. XAI-metoderne kan også bruges til f.eks. at forklare til brugerne af en online platform, hvorfor deres opslag er blevet fjernet automatisk.
Hvorfor er netop dette forskningsområde så interessant?
Sprogteknologi er blevet en del af vores hverdag. Det er efterhånden kun få mennesker, der aldrig har brugt søgemaskiner, værktøjer til at rette grammatik, programmer til automatisk oversættelse, eller chatbots. Der findes i dag mange kommercielle løsninger med sprogteknologi, og de nyeste generationer af sprogmodeller producerer tekst, som virker meget naturligt. Men modellerne har stadig svært ved at forstå nuancer i sprog, og nogle gange producerer de svar, som for os mennesker virker ulogiske. Dette sker, fordi modellerne er bygget til at opdage mønstre og genanvende dem i nye sammenhænge ved hjælp af statistiske metoder. Sprogmodellerne forstår altså ikke sprog. De producerer blot svar, som er højst sandsynlige, baseret på de tekstdata, de har observeret. Jeg synes, det er rigtig spændende at arbejde med at finde nye metoder, som forbedrer denne egenskab ved NLP-modeller – så det virker, som om de forstår sprog, selvom de ikke gør det.
Hvad forventer du af dit medlemskab af Videnskabernes Selskab?
Jeg forventer spændende tværvidenskabelige diskussioner, arrangementer omkring vigtige samfundsrelevante emner, dialog omkring forskningspolitik, og at kunne udvide mit netværk inden for den danske forskningsverden. De sidste tre år har jeg været medlem af Det Unge Akademi under KDVS, som har tilsvarende arbejdsgrupper, dvs. samarbejdsudvalg, forskningspolitisk udvalg og formidlingsudvalg, og jeg har været meget glad for at være med. Jeg håber, at det bliver lige så inspirerende at være en del af KDVS.
Fortæl lidt om mennesket bag forskeren
Jeg er opvokset i den sydvestlige del af Tyskland og har læst sprogteknologi på Heidelberg Universitet, efterfulgt af en ph.d. og postdoc i Sheffield og London. I kølvandet på Brexit-afstemningen flyttede jeg til Danmark sammen med min britiske kæreste for at tiltræde en stilling som adjunkt på Datalogisk Institut ved Københavns Universitet. Siden er det gået meget stærkt karrieremæssigt, og jeg er meget beæret over at være blevet forfremmet til professor i 2022 som den yngste kvinde i Danmark nogensinde. I min fritid holder jeg mig aktiv med taekwondotræning, men kan også godt lide at slappe af med dejlig mad eller en god bog.