Exploring infrastructure for Dutch speech recognition

Kalender
TST
Datum
25-06-2024 13:00 - 17:00
Locatie
SURF

Beschrijving

logo SURFDoor ontwikkelingen in AI verandert de wereld van automatische spraakherkenning (ASR) snel. Nieuwe ASR-systemen lijken een overweldigend nauwkeurige transcriptie van spraak te leveren. Maar hoe presteren deze systemen onder atypische omstandigheden en in grootschalige toepassingen?

Het seminar is een gezamelijk initiatief van SURF en de Stichting Open Spraaktechnologie en vindt plaats bij SURF in Utrecht (vlakbij Utrecht CS).


ASR-systemen die recentelijk op de markt zijn gekomen, zoals Whisper, lijken een overweldigend accurate transcriptie van spraak te leveren. Maar hoe presteren deze systemen onder atypische omstandigheden? Bijvoorbeeld in het geval van dialecten, spraak van kinderen of ouderen of spraak van niet-moedertaalsprekers? Wat gebeurt er als er meerdere sprekers zijn of achtergrondgeluiden? En wat moet je doen als je zeer grote hoeveelheden spraakgegevens wilt transcriberen? Wat is de beste manier om dit op een meer (infra)structurele manier aan te pakken?

In dit seminar tonen we voorbeelden uit verschillende toepassingsgebieden en bespreken we praktische, operationele en strategische aspecten van:

  • De noodzaak van het beschikbaar maken van hoogwaardige (Nederlandse) spraakherkenningsengines in onderzoeks- en onderwijscontext, bijvoorbeeld om spraak uit colleges, interviews of vergaderingen te transcriberen naar tekst.
  • Of het al dan niet belangrijk is dat spraakherkenningsengines kunnen worden ge-update wanneer betere engines of modellen beschikbaar komen, of dat verschillende versies van modellen kunnen worden geselecteerd voor specifieke taken (bijv. specifieke soorten spraak).
  • Hoe open standaarden toegepast kunnen worden en 'Explainability' zoveel mogelijk bevorderd kan worden (hoe worden modellen gemaakt, met welke datasets, prestatiespecificaties).

Dit seminar heeft niet als doel om onderzoek naar spraaktechnologie te faciliteren, maar richt zich op het gebruik van bestaande spraaktechnologie-oplossingen, en hoe dit (verder) gefaciliteerd kan worden: laten we naar duurzame oplossingen zoeken voor onderzoek en onderwijs!

 

Meer informatie staat hier: https://www.surf.nl/agenda/exploring-infrastructure-for-dutch-speech-recognition

 

Locatie informatie

SURF

Straat
Moreelsepark 48
Plaats
3511 EP Utrecht
Provincie
Utrecht
Land
Nederland