Johannes Bjerva

Lektor, Institut for datalogi, Det tekniske fakultet for IT og design, Aalborg Universitet

Hvad er dit forskningsfelt – kort beskrevet?

Mit forskningsområde er sprogteknologi, også kendt som Natural Language Processing (NLP). Jeg arbejder med at gøre sprogteknologi mere tilgængelig, for mindre sprog og samfund i verden. De seneste metodologiske fremskridt inden for NLP, såsom f.eks. ChatGPT, kræver nemlig enorme mængder af data, hvilket mindre sprogsamfund aldrig vil være i stand til at bygge op. I mit nuværende forskningsprojekt forsøger vi at forbedre situationen, gennem at bruge det vi ved om sprog fra lingvistikkens side, til at informere vores modeller, der er baseret på kunstig intelligens.

Hvad har motiveret dig til at blive forsker?

I løbet af min bachelor og kandidat havde jeg muligheden til at være del af et meget aktivt forskningsmiljø som forskningsassistent på Institut for Lingvistik ved Stockholms Universitet. Det aktive forskningsliv inspirerede mig til at ansøge til en ph.d.-stilling i Holland. Livet som forsker indebærer en arbejdsdag fyldt med små og store udfordringer, og giver en unik måde at give tilbage til samfundet på. Dels gennem at flytte barrierer inden for ens egen forskning, men også når det gælder at uddanne den næste generation af bachelorer, kandidater, og forskere. Fleksibiliteten man har som forsker, både i arbejdstider og arbejdsopgaver, er endnu et stort plus for mig personligt.

Hvad er de forskningsmæssige udfordringer og perspektiver på dit felt?

Sprogteknologi bygger på kunstig intelligens, og alle moderne metoder kræver absurde mængder af data for at fungere godt. Det har vi heldigvis i forvejen for større og rigere sprog som engelsk, spansk og kinesisk. Dansk er heller ikke helt dårligt stillet, men hvis vi kigger på mindre sprogsamfund som Færøerne og Grønland, er situationen en helt anden. Kort fortalt, vil moderne teknologier såsom store sprogmodeller der ligger under f.eks. ChatGPT aldrig fungere i sådanne samfund. Der er ikke nok data, og det vil ca. 50,000 mennesker heller aldrig være i stand til at skabe. Ud af de ca. 7000 sprog i verden, er der måske 700 der bruges i samfund og kontekster der kan have gavn af denne slags teknologi - og ud af de 700, er der måske kun 50 der har ressourcerne.
I min forskning forsøger jeg at udvikle metoder sådan at sprogteknologi også kan fungere godt med små mængder data. Vejen derhen er at bruge det vi ved om sprog og hvordan de ligner hinanden, med hjælp fra lingvistik. På den måde kan vi bruge data mere effektivt, låne data fra større sprog, og forhåbentlig også gøre teknologien tilgængelig for mindre samfund.

Hvad vil du bruge dit medlemskab af Det Unge Akademi til?

Med de seneste udviklinger inden for sprogteknologi, ser jeg store muligheder for tværvidenskabelig samarbejde med andre fagområder. Jeg håber på at diskussioner med andre medlemmer kan stimulere til sådanne samarbejder, og måske også deciderede tværvidenskabelige samarbejdsprojekter. Derudover håber jeg på at få flere muligheder for forskningsformidling, og at bidrage til samfundsdebatten med indspil fra akademiet baseret på en bredere faglighed, end jeg selv kan gøre med kun min egen faglige baggrund.

Hvordan mener du, at man kan styrke tværfagligheden – og hvordan kan den bruges i dit arbejde?

Det sker alt for tit, at forskere i fagområder med teknisk kunnen, som f.eks. datalogi, kommer med "løsningen" til problemer indenfor f.eks. humaniora og social science. Det forestiller jeg mig ikke at der særlig ofte kommer noget produktivt ud af, der faktisk er til gavn for den tværvidenskabelige forskning. Jeg ser for mig, at det optimale vil være at sørge for at domæneekspertisen fra et givet fagområde får være i fokus, og at en mere metodologisk orienteret disciplin som min tager rollen som facilitator i at eksempelvis basere analyser på større mængder data.

Lidt om mennesket bag forskeren

Jeg kommer oprindeligt fra Norge, og er vokset op i et tosprogligt hjem med norsk og finsk. Jeg har flyttet rundt ret en del i mit liv - først til Sverige for at studere, derefter til Holland for min ph.d., inden jeg flyttede til Danmark i 2017, for at påbegynde en postdoc på KU. Nu er jeg bosat tæt på naturen i Farum med min kone og snart to døtre. I min fritid dyrker jeg triatlon, og gennemførte Ironman i København i 2022. Nu forsøger jeg egentlig bare at holde mig nogenlunde i form, da den træningsmængde der kræves for langdistance triatlon for mig bliver for meget at balancere med familie og arbejde.