Professor og sektionsleder ved Datalogisk Institut, Københavns Universitet
Hvad er dit forskningsfelt – kort beskrevet?
Mit kerneforskningsområde er naturlig sprogbehandling (natural language processing, NLP), der udvikler (primært maskinlærings-) metoder til automatisk behandling eller generering af tekst - til anvendelse i opgaver som holdningsanalyse, maskinoversættelse eller besvarelse af spørgsmål.
Hvad har motiveret dig til at blive forsker?
Siden jeg var lille, har jeg været en ivrig læser – jeg brænder for at lære nye ting. Det sidste år på gymnasiet lærte jeg om naturlig sprogbehandling fra en veninde, og jeg har været optaget af emnet lige siden. Mens jeg læste på min bacheloruddannelse i datalingvistik, fik jeg mulighed for at komme i praktik som forskningsassistent. Derfra var det et naturligt næste skridt for mig at skrive en ph.d. og blive forsker.
Hvad er de forskningsmæssige udfordringer og perspektiver på dit felt?
De NLP-metoder der pt. yder bedst, kræver mange manuelt annoterede eksempler pr. applikationsopgave, hvilket udgør en betydelig flaskehals.
Derfor har en stor del af forskningen indenfor NLP fokuseret på at mindske dette problem ved at foreslå metoder, der kan lære af en lille mængde opmærkede data.
Et andet problem med de metoder der pt. yder bedst er, at de er uigennemsigtige, dvs. at det er vanskeligt at forklare, hvordan algoritmen fungerer, og hvorfor den når frem til de løsninger, den gør. Til dette formål er det vigtig at udvikle metoder til at generere og automatisk evaluere forklaringerne om, hvordan maskinlæringsmodellerne virker.
Udover at opbygge kommercielle løsninger til f.eks. maskinoversættelse, kan NLP bruges til at studere og løse samfundsproblemer, bl.a. til løsninger indenfor automatisk faktatjek og afdækning af rygter for at bekæmpe falske nyheder online.
Hvad vil du bruge dit medlemskab af Det Unge Akademi til?
Allermest ser jeg frem til at møde forskere fra andre forskningsfelter, der hver især er internationalt førende indenfor deres forskningsområde. Naturlig sprogbehandling er i sig selv et tværfagligt felt i skæringspunktet mellem datalogi og lingvistik, og jeg får mange af mine forskningsideer fra tværvidenskabelige diskussioner.
Derudover synes jeg, det er vigtigt at have tværfaglige dialoger omkring de udfordringer, vi møder som forskere, inklusive forskningspolitiske udfordringer – f.eks. en nedskæring af midler til grundforskning eller en lav tillid til forskeres arbejde fra regeringen.
Hvordan mener du, at man kan styrke tværfagligheden – og hvad kan den bruges til i dit arbejde?
Mit forskningsområde betragtes ofte som en leverandør af metoder til forskellige anvendelser. Selvom det ikke er et helt forkert synspunkt, kan det føre til, at der ikke er tid nok til at udvikle nye metoder i forskningsprojekter, der kan bruges mere generelt, og at man i stedet blot anvender eksisterende metoder til nye slags data. Generelt synes jeg, det er vigtigt at identificere forskningsspørgsmål, som kan føre til reelle gennembrud på tværs af forskningsområder.
Lidt om mennesket bag forskeren:
Jeg er oprindeligt fra det sydlige Tyskland og har boet nogle år i Storbritannien som ph.d.-studerende og postdoc. Herefter jeg flyttede til Danmark sammen med min kæreste og vores kat i kølvandet på Brexit-folkeafstemningen for at tiltræde en stilling på Københavns Universitet. I min fritid holder jeg af at dyrke taekwondo, sejle kajak og slappe af på sofaen med en god bog.