Dutch Speech Technology Day

Date Monday June 8, 2020
Time 9.00-18.00 (lunch will be included) Followed by drinks
Location Commissiekamer 3, Aula Building, Delft University of Technology

Speech technology has made lots of progress in recent years. For instance,  automatic speech recognition (ASR) systems of good quality are now  available for Dutch, e.g., via Google. Importantly, recently, an open  source ASR for Dutch, based on Kaldi, is made available for companies and  the academia. The availability of speech technology for Dutch has led many  companies and government agencies to develop tools and applications that  use speech-based input. However, the Dutch speech technology landscape is  fragmented. Small groups of people are working on similar ideas and face  similar problems as others without knowing about it and knowing one  another. For instance, due to privacy restrictions, it is not always  possible to send speech to the Google speech recognition system, but  rather the speech needs to stay in-house and the ASR systems need to be  run and maintained in-house as well. How best to do that? At the same time, many of our long-term goals overlap.

The Dutch Speech Tech Day aims to build a community of researchers and  users of speech technology in all its forms in the Netherlands. We want to  give students the opportunities to talk to companies, researchers, and  governmental agencies about jobs/internships. We want to provide a  platform for researchers, companies and governmental agencies to learn about the newest research, learn about each other's needs and wishes, and  allow for the building of networks for collaborative research or project  proposals. Although the focus will be on speech technology for Dutch,  there will be ample space to present work on speech technology on other languages. The Dutch Speech Tech Day is for all people interested in and  working on speech technology, irrespective the language.

In short, the Dutch Speech Tech Day will be an excellent opportunity to  learn about the newest insights on speech tech from academia, to hear about what companies and governmental organisations are working on, to network, etc.

 

Programme

  • Invited talks by people from industry, academia, and governmental organisations
  • Poster session
  • Panel discussion on the future of Dutch speech technology: The panel discussion will focus on e.g., what are the problems companies face, what wishes do they have, where should the focus be on developing new speech  technology for Dutch, how can we obtain funding for the further development of speech technology for Dutch for academics.
  • Networking & Drinks
Max number of attendees 80 *First come, first serve*
Costs We will work towards reducing the costs as much as we can but it is possible/likely that we will ask participants a small fee to cover the costs.
Language English
 
If you are interested in joining and want to be put onto our mailing list, please reply to Siyuan Feng () and Odette Scharenborg ().
 
More information, including a call for posters, to follow.
 
See you on Monday June 8!
 
We are planning to make the Dutch Speech Tech Day an annual event.
 
With kind regards,
Odette Scharenborg
Siyuan Feng
 
The organising committee of the first Dutch Speech Tech Day

NOTaS 2019

NOTaS beleefde in 2019 een uitstekend jaar met twee zeer goed bezochte en inhoudelijk boeiende netwerkbijeenkomsten (achtereenvolgens bij de Universiteit Tilburg en het LIACS in Leiden) en een geanimeerde netwerklunch bij Karel V rond de ontwikkeling van ISO-standaarden voor TST.

Als bestuur zijn we alweer druk bezig om nieuwe bijeenkomsten op te zetten in 2020, waarbij we voortbouwen op de succesformule van de vorige bijeenkomsten: een interactieve miniconferentie i.s.m. een voor de TST-sector interessante gastorganisatie waar zowel academische sprekers als productontwikkelaars en gebruikers ingaan op een overkoepelend thema. Zoals gebruikelijk blijven nieuwe introducées van harte welkom, want NOTaS heeft nog steeds de ambitie om te groeien.

Activiteiten

Onze eerstvolgende bijeenkomst is op donderdag 19 maart in de Jaarbeurs Meetup in Utrecht, waar de Belastingdienst ons ontvangt met een veelzijdig programma rond ethische aspecten van AI-toepassingen bij overheidsdiensten, waarbij uiteraard ook de ethiek van Taal- en Spraaktechnologie aan bod zal komen. Save the date!

Twee dagen eerder organiseert de Hogeschool Leiden ook een boeiend symosium rond E-discovery. Verder bestaat de mogelijkheid om op maandag 8 juni deel te nemen aan de 1e editie van de Nederlandse Spraaktechnologiedag bij de TU Delft en hier zelf een posterpresentatie te verzorgen.

Verder wil het bestuur jullie graag informeren over drie recente besluiten:

  • - de contributie 2020 en de bijbehorende deelnemersfactuur
  • - de sponsorbijdrage aan de Stichting Open Spraaktechnologie
  • - het herstel van de onverwachts offline gehaalde NOTaS-site

Bestuur

De samenstelling van het bestuur is ongewijzigd en bestaat uit Fabrice Nauze (vz), Staffan Meij (vvz), Henk v.d. Heuvel (pm), Arjan van Hessen (webmaster) en ondergetekende (secr).

Veel leesplezier en hopelijk tot 19 maart!

Met vriendelijke groet,

Namens het bestuur,

Oele Koornwinder

META-FORUM 2019: Introducing the European Language Grid

Met 24 officiële talen in de EU en nog veel meer niet-officiele talen, kan de meertaligheid en een inclusieve digitale interne markt in Europa alleen mogelijk worden gemaakt door middel van taaltechnologie. Het Europese TST-bedrijf wordt gedomineerd door duizenden kleine en middelgrote ondernemingen en een paar grote spelers. Veel MKB-bedrijven zijn van wereldklasse, met technologieën die soms beter presteren dan die van sommige wereldspelers.

De Europese TST-business is echter ook gefragmenteerd - per natiestaat, taal en sector. Dit is waarschijnlijk een van de redenen waarom het Europese landschap en de Europese taaltechnologische gemeenschap er nog niet in geslaagd is haar volledige potentieel te bereiken. De uitdaging om hier iets aan te doen wordt aangaan door de ELG op te richten als het belangrijkste platform voor taaltechnologie in Europa.

De ELG zal een schaalbaar cloud-platform ontwikkelen en implementeren, dat op een gemakkelijk te integreren manier toegang biedt tot honderden commerciële en niet-commerciële taaltechnologieën voor alle Europese talen, inclusief het gebruik van tools en diensten en datasets en -bronnen.

Het zal de commerciële en niet-commerciële Europese TST-gemeenschap in staat stellen hun technologieën en datasets in het platform te deponeren en te uploaden, ze via het netwerk in te zetten en verbinding te maken met andere bronnen.

Het Europees Talenraster zal de meertalige digitale interne markt een impuls geven in de richting van een bloeiende Europese taaltechnologiegemeenschap, die nieuwe banen, nieuwe markten en nieuwe kansen zal creëren.

 

European Language Grid (ELG) gelanceerd

logo elgIn januari 2019 werd het door de EU gefinancierde project European Language Grid (ELG) gelanceerd. Het doel van dit project is de ontwikkeling van het primaire platform voor Europese taaltechnologieën.

Het platform zal plek bieden aan duizenden datasets en honderden LT-tools en -diensten die rechtstreeks vanuit het netwerk kunnen worden gebruikt. We willen dit platform zo nuttig en efficiënt mogelijk maken. Daarom vragen wij u als potentiële gebruiker van de ELG om uw input.

Enquête

Voor iedereen die zich bezig houdt met TST: er is een enquête gemaakt om meer te weten te komen over de eigen gebruikscases en vereisten met betrekking tot taaltechnologie. Het duurt ongeveer 15-20 minuten om de enquête in te vullen. De reacties wordt vertrouwelijk behandeld en alleen gebruikt in verband met de ontwikkeling van het ELG-platform. De gegevens worden niet aan derden verstrekt.

De enquête is online beschikbaar op het volgende adres:
https://www.surveymonkey.com/r/5RHHWPS

We willen erop wijzen dat de ELG een initiatief is van de Europese LT-gemeenschap voor de Europese LT-gemeenschap. Onze missie en doel is het verzamelen en implementeren van zoveel mogelijk van de behoeften die we in onze gemeenschap kunnen vaststellen.

 

Beweeglijk Nederlands

Een eeuw geleden spraken betrekkelijk weinig Nederlanders Standaardnederlands (toen ABN genoemd); de meesten spraken een dialect van het Nederlands of een van de regionale talen. Het Standaardnederlands was de taal van de maatschappelijke bovenlaag en verder vooral een schrijftaal.
Tegenwoordig raken de traditionele dialecten in veel regio’s in onbruik, maar ze laten sporen na in het regionale Standaardnederlands. De opvattingen over wat ‘goed Nederlands’ is veranderen mee. 

Sprekend Nederland

sn2Het onderzoek van taalverandering vergt grote hoeveelheden vergelijkbaar, goed gedocumenteerd taalgebruik van spreek(st)ers uit verschillende regio’s, met uiteenlopende onderwijs- en culturele achtergronden. Voor Nederland is dat recentelijk verzameld in Sprekend Nederland, een grootschalig crowdsourcing project over spraak en oordelen over spraak. Van ruim 10.000 deelnemers zijn er door middel van een gratis app spraakfragmentjes opgenomen (in totaal ruim 530 uur), zo’n 3.000 deelnemers verstrekten verschillende gegevens over hun achtergrond.

Beweeglijk Nederlands

NWA logo

logo levendverleden

In het project Beweeglijk Nederlands willen we rond deze gigantische gegevensverzameling fundamenteel-wetenschappelijk en spraak-technologischonderzoek doen en ons daarbij tevens richten op zowel  maatschappelijke als commerciële toepassingen. Wij ontwikkelen voor dit project een subsidie-aanvraag in het kader van de Nationale Wetenschapsagenda (NWA), meer in het bijzonder in de hoofdroute Levend Verleden.

Match-making bijeenkomst

Op woensdag 10 april a.s. vindt er van 13.00 tot 16.30 uur in het IISG (Cruquiusweg 31, 1019 AT Amsterdam) een bijeenkomst plaats waarin wij onze plannen nader willen voorstellen en toelichten aan geselecteerde vertegenwoordigers van academische, maatschappelijke en commerciële instellingen.
Voor deze bijeenkomst willen wij jullie (organisatie) graag uitnodigen.

Inschrijven kan hier!

Een voorwaarde voor het indienen van een subsidie-aanvraag bij de NWA is dat 10% van het projectbudget (in cash of in kind) gedragen wordt door derden, meer bepaald maatschappelijke en commerciële partijen.
Gezien de expertise van de NOTaS-deelnemers, zou het voor ons en jullie interessant kunnen zijn om te participeren in het project. Als jullie dat ook vinden, dan zouden we graag met jullie in gesprek willen gaan over de meest geschikte manier om mee te doen aan dit onderzoek.
Onderwerpen uit ons onderzoek die relevant kunnen zijn voor NOTaS-deelnemers zijn o.a.:

  • moet de Spraakgeneratie aangepast worden opdat er ook regionaal Standaard Nederlands mee kan worden gesproken?
  • moet Spraakherkenning aangepast worden om sprekers van regionaal Standaard Nederlands toch goed te kunnen herkennen?
  • zijn de suggesties die software doet om een tekst helder en begrijpelijk te maken ook geschikt voor mensen die meestal regionaal Standaard Nederlands spreken?

De presentatie op 10 april van onze plannen bestaat uit een korte algemene inleiding, gevolgd door gesprekken met geïnteresseerde genodigden; deze gesprekken kunnen naar behoefte in klein verband of met individuele geïnteresseerden gevoerd worden. 

Wij zouden het geweldig vinden wanneer we veel NOTaS-deelnemers op 10 april mogen begroeten op het Instituut voor Sociale Geschiedenis in Amsterdam. Als het die dag niet lukt maar je wel geinteresseerd bent, laat dat dan weten; dan maken we zo snel mogelijk een afspraak.

 

Met een vriendelijke groet,    

 

Henk van den Heuvel (CLST, Radboud Universiteit) & Arjan van Hessen (HMI, Universiteit Twente)

mede namens

Prof. dr. Frans Hinskens (Meertens Instituut Amsterdam & Radboud Universiteit Nijmegen)
Prof. dr.Paul Boersma (Universiteit van Amsterdam)
Prof. dr. Antal van den Bosch (Meertens Instituut Amsterdam & Radboud Universiteit Nijmegen)
Dr. Stefan Grondelaers (Radboud Universiteit Nijmegen)
Dr. Nanna Haug Hilton (Universiteit Groningen)
Prof. dr. David van Leeuwen (Radboud Universiteit Nijmegen)
Dr. Roeland Ordelman (Nederlands Instituut voor Beeld en Geluid, Hilversum & Universiteit Twente)
Prof. Dr. Martijn Wieling (Universiteit Groningen)