Liplezen levert verbetering van spraakherkenning

plaatjeDe huidige systemen om gesproken teksten om te zetten in uitgeschreven teksten, maken doorgaans alleen gebruik van audio-opnames. Eigenlijk is dat gek want mensen gebruiken vaak de bewegingen van de mond van een gesprekspartner om te begrijpen wat iemand zegt.

Dat laatste gegeven heeft Meta - het moederbedrijf van Facebook - als uitgangspunt genomen voor het systeem Audio-Visual Hidden Unit BERT (AV-HuBERT). Het bedrijf claimt door het systeem te laten liplezen tot wel 75% betere transcripties te komen. Vooral in situaties waar achtergrondgeluiden een rol spelen, zoals op een feestje of buiten op een markt, bewijst de gecombineerde aanpak zijn voordelen.

Het voordeel van AV-HuBERT is bovendien dat het maar een tiende van de gelabelde data nodig heeft om te trainen ten opzichte van eerdere AV-spraakherkenningssystemen. Dat biedt veel kansen voor het gebruik bij talen waarvan niet zoveel gelabelde audiofragmenten beschikbaar zijn, meldt Venturebeat.

 

Het gehele artikel staat hier.

 

Whatsapp gaat goed, Instagram is lastiger

Dixit 2018Nu de wereld digitaliseert, zijn er ook steeds meer bedrijven die de technieken toegankelijk maken voor blinden en slechtzienden. Al is het nog best lastig geld verdienen met zo’n kleine doelgroep.
Op 7 oktober jl. stond er een artikel in NRC Handelsblad over technieken voor blinden en slechtzienden, met een interview met Jesse Wienholts. Jesse vertelde al eerder over zijn ervaringen in de DIXIT van 2018 (blz. 9).

 

 

DRONGO talenfestival: Lezen verliest zijn dominantie, maar niet zijn belang.

impact lezen¿LEZEN! is het thema van het DRONGO talenfestival op 2 en 3 oktober. Met een uitroepteken én een vraagteken. Want wie het veld van ontlezing, laaggeletterdheid en leesonderwijs overziet, ontkomt niet aan de vraag waaróm het zo slecht gaat met lezen in Nederland. Tientallen organisaties en duizenden mensen zetten zich vol passie in om dat tij te keren. Ís boeken lezen wel zo belangrijk voor nieuwe generaties, nu er zoveel andere kanalen beschikbaar zijn om verhalen en informatie te delen? Is de crisis in het boekenvak grotendeels aan de boekenwereld zelf te danken?

dc Het festival laat zien dat de oplossingen voor de leescrisis voor het oprapen liggen. In tientallen online presentaties en webinars kan de bezoeker kennis maken met recent onderzoek, nieuwe initiatieven en leermethoden. De Britse taalkundige David Crystal bespreekt met de bezoekers hoe leesontwikkeling samenhangt met de taalontwikkeling van jonge kinderen. Ook de wereldberoemde taalpsycholoog en schrijver Steven Pinker maakt zijn opwachting met een interactieve sessie over wat de cognitieve wetenschap ons leert over goed schrijven. Verder bevat het programma diverse presentaties over hoe kinderen aan het lezen te krijgen, is er aandacht voor laaggeletterdheid, technologie en taal, de breedte van het taal- en leesspectrum en biedt het een overzicht van de vele taal- en leesactiviteiten die worden ingezet door de verschillende organisaties. sp
hdb In vier live talkshows bespreekt Hadassah de Boer de ontwikkelingen met een reeks aansprekende gasten. Moeten we misschien de nadruk op lezen loslaten, om het lezen te laten overleven?  
PC  Paulien Cornelisse vertelt over haar dagelijkse worstelingen met het Japanse schrift, waarin zij zich een laaggeletterde voelt. Laaggeletterdheidsprofessor Maurice de Greef presenteert de bevindingen van nieuw Europees onderzoek naar de beste manier om laaggeletterden te bereiken. Mohammed Benzakour belicht de kloof tussen de hoog- en de laaggeletterde.  Lidewijde Paris (De Leesambassade), Lev Avitan (Mensen Zeggen Dingen) Gerlien van Dalen (directeur van Stichting Lezen) en Ruth de Jager (Storytel) gaan met elkaar in gesprek over hoe de ontlezing tegen te gaan. Is het luisterboek een impuls voor de literatuur, voor het lezen? Over het lees- en literatuuronderwijs spreken onder andere Bas Steman (‘Lekker Boekie’), Matijs Lips (leraar Nederlands van het jaar 2019), Thoni Houtveen (leesexpert), en Maud Vanhauwaert (voormalig stadsdichter van Antwerpen).  
avd Adriaan van Dis en Özcan Akyol bevragen elkaar in de slotsessie openhartig. Waar vroeger generaties zichzelf door boeken konden ontdekken en herkennen, is volgens van Dis die rol tegenwoordig niet meer uitsluitend het domein van de literatuur. Akyol vindt dat de literatuur en de elitaire bubbel dringend toe is aan vernieuwing. Er wordt volgens de heren over lezen net zoveel gelogen als over seks. Lezen verliest dus misschien zijn dominantie, maar niet zijn belang. ÖA

Het festival wordt dit jaar voor de 9e keer georganiseerd, en wordt vanwege Covid-19 geheel online gehouden op www.drongotalenfestival.nl. Een deel van het programma wordt op 2 en 3 oktober gelivestreamd, er worden live webinars gehouden, en verder bied het festival een keur aan van tevoren opgenomen programmaonderdelen. Deelname aan het festival is gratis, registeren kan op www.drongotalenfestval.nl

Dutch Speech Technology Day

Date Monday June 8, 2020
Time 9.00-18.00 (lunch will be included) Followed by drinks
Location Commissiekamer 3, Aula Building, Delft University of Technology

Speech technology has made lots of progress in recent years. For instance,  automatic speech recognition (ASR) systems of good quality are now  available for Dutch, e.g., via Google. Importantly, recently, an open  source ASR for Dutch, based on Kaldi, is made available for companies and  the academia. The availability of speech technology for Dutch has led many  companies and government agencies to develop tools and applications that  use speech-based input. However, the Dutch speech technology landscape is  fragmented. Small groups of people are working on similar ideas and face  similar problems as others without knowing about it and knowing one  another. For instance, due to privacy restrictions, it is not always  possible to send speech to the Google speech recognition system, but  rather the speech needs to stay in-house and the ASR systems need to be  run and maintained in-house as well. How best to do that? At the same time, many of our long-term goals overlap.

The Dutch Speech Tech Day aims to build a community of researchers and  users of speech technology in all its forms in the Netherlands. We want to  give students the opportunities to talk to companies, researchers, and  governmental agencies about jobs/internships. We want to provide a  platform for researchers, companies and governmental agencies to learn about the newest research, learn about each other's needs and wishes, and  allow for the building of networks for collaborative research or project  proposals. Although the focus will be on speech technology for Dutch,  there will be ample space to present work on speech technology on other languages. The Dutch Speech Tech Day is for all people interested in and  working on speech technology, irrespective the language.

In short, the Dutch Speech Tech Day will be an excellent opportunity to  learn about the newest insights on speech tech from academia, to hear about what companies and governmental organisations are working on, to network, etc.

 

Programme

  • Invited talks by people from industry, academia, and governmental organisations
  • Poster session
  • Panel discussion on the future of Dutch speech technology: The panel discussion will focus on e.g., what are the problems companies face, what wishes do they have, where should the focus be on developing new speech  technology for Dutch, how can we obtain funding for the further development of speech technology for Dutch for academics.
  • Networking & Drinks
Max number of attendees 80 *First come, first serve*
Costs We will work towards reducing the costs as much as we can but it is possible/likely that we will ask participants a small fee to cover the costs.
Language English
 
If you are interested in joining and want to be put onto our mailing list, please reply to Siyuan Feng (S.Feng@tudelft.nl) and Odette Scharenborg (o.e.scharenborg@tudelft.nl).
 
More information, including a call for posters, to follow.
 
See you on Monday June 8!
 
We are planning to make the Dutch Speech Tech Day an annual event.
 
With kind regards,
Odette Scharenborg
Siyuan Feng
 
The organising committee of the first Dutch Speech Tech Day

NOTaS 2019

NOTaS beleefde in 2019 een uitstekend jaar met twee zeer goed bezochte en inhoudelijk boeiende netwerkbijeenkomsten (achtereenvolgens bij de Universiteit Tilburg en het LIACS in Leiden) en een geanimeerde netwerklunch bij Karel V rond de ontwikkeling van ISO-standaarden voor TST.

Als bestuur zijn we alweer druk bezig om nieuwe bijeenkomsten op te zetten in 2020, waarbij we voortbouwen op de succesformule van de vorige bijeenkomsten: een interactieve miniconferentie i.s.m. een voor de TST-sector interessante gastorganisatie waar zowel academische sprekers als productontwikkelaars en gebruikers ingaan op een overkoepelend thema. Zoals gebruikelijk blijven nieuwe introducées van harte welkom, want NOTaS heeft nog steeds de ambitie om te groeien.

Activiteiten

Onze eerstvolgende bijeenkomst is op donderdag 19 maart in de Jaarbeurs Meetup in Utrecht, waar de Belastingdienst ons ontvangt met een veelzijdig programma rond ethische aspecten van AI-toepassingen bij overheidsdiensten, waarbij uiteraard ook de ethiek van Taal- en Spraaktechnologie aan bod zal komen. Save the date!

Twee dagen eerder organiseert de Hogeschool Leiden ook een boeiend symosium rond E-discovery. Verder bestaat de mogelijkheid om op maandag 8 juni deel te nemen aan de 1e editie van de Nederlandse Spraaktechnologiedag bij de TU Delft en hier zelf een posterpresentatie te verzorgen.

Verder wil het bestuur jullie graag informeren over drie recente besluiten:

  • - de contributie 2020 en de bijbehorende deelnemersfactuur
  • - de sponsorbijdrage aan de Stichting Open Spraaktechnologie
  • - het herstel van de onverwachts offline gehaalde NOTaS-site

Bestuur

De samenstelling van het bestuur is ongewijzigd en bestaat uit Fabrice Nauze (vz), Staffan Meij (vvz), Henk v.d. Heuvel (pm), Arjan van Hessen (webmaster) en ondergetekende (secr).

Veel leesplezier en hopelijk tot 19 maart!

Met vriendelijke groet,

Namens het bestuur,

Oele Koornwinder

secretaris@notas.nl