We weten steeds meer van taal en spraak af en maken naarstig gebruik van NLP, ASR en andere AI-technieken om ervoor te zorgen dat spraakherkenning zo goed mogelijk gaat. En het gaat ook steeds beter, maar hoe beter ASR loopt, hoe meer duidelijk wordt wat we nog niet kunnen. Denk aan dialect-spraak (of spraak met zware accenten), spraak van mensen met een afwijkende stem, spraak van kinderen en meer. Zal het ooit 100% correct lopen? Nee, mar ongetwijfeld zal het beter gaan dan nu. We zien dat al bij onze grote broer: het Engels dat het al veel beter doet dan het Nederlands. Over ong 3 jaar kunnen we dat ook (alleen zal het Engels dan natuurlijk ook vooruit gegaan zijn).
En welke toepassingen komen er voor ons beschikbaar als AI beter wordt met de Nederlandse taal?
BNR heeft een boeiende podcast gemaakt die zich hiermee bezig houdt. Het gaat om gesprekken met drie mensen die ieder vanuit hun hoek het probleem belichten: Antal van de Bosch, Marlou Snelders en Peter-Paul de Leeuw. Ze geven antwoord op vragen als:kan AI de herkenning van dialecten, jargon zelfs straattaal beter maken, hoe goed is AI nu met de Nederlandse taal en wat kunnen we eraan doen om dit te verbeteren?
In deze aflevering zijn te gast:
- Prof. dr. Antal van den Bosch, hoogleraar taal, communication en computatie aan de Universiteit Utrecht. Antal doet veel onderzoek naar en ontwikkelt betere AI op het gebied van taal.
- Marlou Snelders, innovation liaison bij Security Delta en coördinator voor de werkgroep Veiligheid, Vrede en Recht bij de Nederlandse AI Coalitie. Marlou is verantwoordelijk voor het NAIN-project, waarbinnen verschillende partijen uit de industrie samengebracht worden om de Nederlandse taal in AI te verbeteren.
- Peter-Paul de Leeuw, CEO en oprichter van Amberscript. Amberscript is een bedrijf dat het transcriberen van gesproken tekst automatiseert met behulp van kunstmatige intelligentie. De software van Amberscript ondersteunt inmiddels 39 talen, maar hoe zit het met Nederlandse dialecten en bijvoorbeeld jargon?