maar zijn computer straks wel. 'Ik wil iets goeds doen voor de Friese taal'

 

dragosMasterstudent Dragoș naast een pompeblêd op de trap van Campus Fryslân in Leeuwarden. Foto: Niels Westra
 
Zelf verstaat de masterstudent aan Campus Fryslân geen woord Fries. Toch traint Dragoș Alexandru Bălan (22) uit Roemenië een computermodel in het herkennen van onze spraak.

Goeiedei! ”, zegt de toekomstig onderzoeker in het Friese faculteitsgebouw van de RUG. „ Myn namme is Dragoș. En ik weet ook dat cheers tsjoch is.” Maar daar blijft het bij, want verder spreekt hij alleen Engels en zijn moedertaal Roemeens. Niet gek, want Dragoș, die geboren is in Boekarest, woont nog geen vier jaar in Nederland. Aan de TU Delft studeerde hij eerst informatica en technologie, in Friesland volgt hij nu een Engelstalige vervolgopleiding spraaktechnologie.

‘Ik weet nu dat het nauw verwant is aan Oudengels’

Die is volgens de brochure van Campus Fryslân enig in zijn soort. Op heel het Europese vasteland bestaat de master namelijk alleen in Leeuwarden, waar de Friese taalorganisaties om de hoek liggen. Vandaar dat veel studenten hier hun masterscriptie schrijven over het Fries, een taal waar Dragoș tot voor kort amper wat van wist. „Ik weet nu dat het nauw verwant is aan Oudengels.” Dat het Fries niet overal herkend wordt, is niet alleen voorbehouden aan mensen. Ook computers hebben er last van. Waar gesproken Engels of Nederlands steeds beter automatisch kan worden omgezet naar tekst, ligt dat voor de Friese taal lastiger.

Kunstmatige intelligentie

Dit moet anders, vinden ze bij Campus Fryslân. De kunstmatige intelligentie is immers al zover en daarnaast bestaan er kant-en-klare databases met duizenden uren aan gesproken Fries dankzij het zogeheten FAME!-corpus en het Mozilla Common Voice-project. Aan Dragoș nu de taak om het zelflerende model hiermee te trainen. Dat is een kwestie van draaien aan de virtuele knoppen, prompts invoeren, voorbeeldaudio door het systeem jassen en kijken of de omzetting van het model overeenkomt met de echte tekst. Belangrijk is daarbij de zogeheten word error rate (WER), oftewel het percentage verkeerd begrepen woorden. Het doel is om die ver beneden de 20 te brengen, een cijfer waar bestaande modellen nu nog rond blijven hangen. Hoe hij is terechtgekomen in de wereld van de spraakherkenning? „Op school was ik best goed in wiskunde. Maar al snel ontdekte ik dat ik vooral geïnteresseerd ben in de praktische kant ervan. Daar liggen ook veel carrièrekansen.” Dragoș ziet grote toekomst in de spraaktechnologie. „Het kan worden toegepast om kinderen op school te leren hoe ze Fries moeten schrijven en uitspreken, maar ook om robots te ontwikkelen die ouderen helpen in verzorgingstehuizen.”

‘Ik hou van de fietscultuur in Nederland’

Zijn master loopt tot het einde van dit studiejaar. Of zijn toekomst daarna in Friesland ligt, weet hij niet, maar in Nederland wil hij best nog wel even blijven. „Ik hou van de fietscultuur hier.” Voor nu wil hij vooral iets goeds doen voor de Friese taal. „In deze provincie hebben de mensen hun eigen taal hoog zitten en dat moedigt me heel erg aan. Ik hoop dat mijn werk ertoe bij kan dragen om het Fries te behouden.”