Mijn telefoon begrijpt me niet

Mensen maken voortdurend elkaars zinnen af. Toch hebben computers en smartphones moeite om onze woorden correct te voorspellen. Hoe komt dat? En hoe verbeter je de woordsuggesties?

Maak zelf heerlijke atoomgewichten, inclusief receptenboek. Atoomgewichten? Stoomgerechten, bedoelde de adverteerder op Marktplaats. Weer iemand die te snel op send drukt en een onbegrijpelijke boodschap de wereld in stuurt.

Autocorrectie is vaak autocorruptie. Het is een dagelijkse ergernis van 2,6 miljard smartphonegebruikers in de wereld. Je typt een woord, drukt op de spatieknop en de ingebouwde software maakt er iets heel anders van – spatieknop wordt ‘statieknop’ bijvoorbeeld.

Een boeiend artikel over taaltechnologie in NRC-Next door Marc Hijink met daarin een interview met Antal van den Bosch.

Voor het volledige artikel zie de website van de krant.

LAB Taal & Toegang

Achtergrond

Onze samenleving verandert. In 2024 zal het aantal mensen van boven de 80 verviervoudigd zijn. Driekwart van de 80-plussers heeft in meer of mindere mate behoefte aan zorg. Tegelijkertijd worden mensen meer op zichzelf en elkaar aangewezen.
(Bron: Ik ben Alice, 2015, Documentaire)

Nederlandse Taalunie Kennisland

Wat wordt er gedaan?

Kennisland en de Taalunie organiseren een lab Taal en Toegang om te onderzoeken hoe taal en taal- en spraaktechnologie kunnen worden ingezet om ouderen nog beter te laten participeren aan de samenleving en hen toegang te verlenen tot nieuwe en bestaande producten en diensten. Het kan hierbij gaan om zowel zorggerelateerde producten en diensten die te maken hebben met ouderdomsgebreken, als producten en diensten ter verhoging van de kwaliteit van de leefwereld van ouderen.

Werkwijze

De werkwijze voor het lab wordt gekenmerkt door een doelgroepgerichte benadering, waarbij de beoogde doelgroep in alle fasen van het lab betrokken wordt. Zo zijn in een vooronderzoek eerst de leefwereld, behoeften en wensen van ouderen in kaart gebracht. Op de workshopdag, die plaatsvindt op 14 december, zullen experts en ouderen nadenken over mogelijke producten en diensten. De deelnemende ouderen zullen erop toezien dat de ideeën aansluiten bij hun leefwereld. De expertskomen uit uiteenlopende disciplines: taal- en spraaktechnologen, (social) designers en mensen uit het bedrijfsleven.

Met de uitkomsten van het lab willen Kennisland en de Taalunie nieuwe samenwerkingen rond het thema stimuleren, waarbij gebruik wordt gemaakt van bestaande taal- en spraaktechnologie voor het Nederlands.

Meedoen?

Wie interesse heeft in de resultaten van het lab of in deelname aan de workshopdag op 14 december aanstaande, kan contact opnemen met:
Tessa Askamp van Kennisland ().

ReadSpeaker opnieuw in Software top 50

Voor de derde keer op rij heeft ReadSpeaker een plaatsje weten te veroveren op de http://www.mainsoftware50.com/. Deze keer wist ReadSpeaker zelfs een plek in de top tien te veroveren. De Software top 50 wordt elk jaar samengesteld door Main Capital en is een ranglijst van onafhankelijke Nederlandse software bedrijven. De ranglijst wordt opgesteld op basis van een mix aan criteria, waaronder omzet groei, percentage van omzet uit abonnementen (versus licenties) en internationalisatie. Volgens Staffan Meij, directeur bij ReadSpeaker: "Met name onze voortdurende groei in de Verenigde Staten zal bijgedragen hebben bij een hogere notering dit jaar!".

App Sprekend Nederland nadert lancering

Wat zegt mijn spraak over mij? En hoe oordeelt de rest van Nederland over de manier waarop ik spreek? Verdwijnen de accenten of is de diversiteit aan tongvallen nog springlevend? De NTR ontwikkelt, met NWO als een van de partners, een app om dit te onderzoeken. Taalonderzoekers werken mee aan de voorbereiding en gebruiken de data voor hun onderzoek. Zo ontstaat een unieke momentopname van de Nederlandse spraak.

Op welke manier wordt er nu in Nederland gesproken?

Welke beelden worden daaraan gekoppeld en vinden mensen de taal mooier als het lijkt op hun eigen manier van spreken of juist niet? Om daar iets zinnigs over te kunnen zeggen, zijn veel data nodig: spraakopnamen van verschillende sprekersgroepen en het oordeel van die sprekersgroepen over elkaars spraak. Wetenschappers en omroep NTR werken daarom samen in het project Sprekend Nederland om een unieke momentopname van de Nederlandse spraak te maken.

Vanaf november is de webserie 'Spreekhokken' te zien waarin mensen met verschillende tongvallen waardeoordelen over elkaar uitspreken.

In het komende jaar worden zoveel mogelijk Nederlandse accenten en de beelden die daaraan kleven met behulp van een app op een wetenschappelijk verantwoorde wijze in kaart gebracht. Door deze manier van dataverzameling kan elke Nederlander bijdragen aan het onderzoek. Sprekend Nederland biedt hiermee een unieke gelegenheid om een groot aantal proefpersonen voor taalkundig, sociolinguïstisch, sociaalgeografisch en psychologisch onderzoek in te zetten.

Sprekend Nederland-app

Begin december 2015 wordt de Sprekend Nederland-app grootschalig gelanceerd in onder andere het wetenschapsprogramma De Kennis van Nu. Als deelnemer kun je vanaf dat moment aan de slag. Door het gebruiken van de app word je verleid om actief te blijven en je eigen manier van spreken steeds beter te leren kennen via directe feedback die je krijgt van andere app-gebruikers. Tegelijkertijd gaat een team van wetenschappers aan de slag met de groeiende schat aan data. De app zal gratis beschikbaar zijn voor Android en iOS.

meer informatie op de website van de NTR.

Met spoed gezocht: postdocs voor BasiScript-project

Radboud

Project

Onder leiding van onderzoekers van de Radboud Universiteit wordt in het BasiScript-project een databank aangelegd van teksten geschreven door basisschoolleerlingen. Leerlingen uit groep 4 tot en met groep 8 van lagerescholen door heel Nederland worden gedurende drie jaar gevolgd v.w.b. de ontwikkeling van hun schrijfvaardigheid. Bij het project zijn scholen betrokken uit het regulier onderwijs, het speciaal basisonderwijs, en het speciaal onderwijs. Eenmaal compleet zal de databank zo’n 8 miljoen woorden omvatten afkomstig uit dictees, stelopdrachten, e.d.

Er wordt in dit project een corpus gebouwd met afgeleid geannoteerd lexicon van teksten die basisschoolleerlingen schrijven. Leerlingen uit heel Nederland schrijven teksten op papier (overgrote meerderheid) of op een webapplicatie (zeer beperkt aantal). We hopen uiteindelijk zo'n 8 miljoen woorden te verzamelen. Deze teksten worden gescand en getranscribeerd in twee versies (een spellinggecorrigeerde en een niet-spellinggecorrigeerde).

Gezocht

De Radboud Universiteit zoekt twee of drie postdocs voor de analyse van het BasiScript corpus (www.basiscript.nl) en het BasiLex corpus (www.basilex.nl).

  • Beschikbaar per 1 december 2015 of 1 januari 2016, tot 1 mei 2016 of langer; voor 0,7 tot 1,0 Fte
  • Bij voorkeur een achtergrond in linguïstiek, psycho-linguïstiek of computationele linguïstiek
  • Afgerond promotieonderzoek
  • Beschikbaar binnen 10 dagen voor een interview
  • Ervaring met corpusanalyse of tekstanalyse wordt als een voordeel gezien
  • Duur van de aanstelling tenminste tot 1 mei maar wellicht nog langer.

U kunt uw sollicitatie-mail sturen naar: Agnes Tellings (E-mail: )

Engels:

Urgently wanted: two or three postdocs  for corpus analysis of the BasiScript corpus (www.basiscript.nl) and the BasiLex corpus (www.basilex.nl).

  • Available per 1 december 2015 or 1 january 2016, till 1 May 2016 or after, for 0,7 to 1,0 Fte
  • Appointment within the Behavioural Science Institute, Faculty of Social Sciences
  • Background preferably in linguistics, psycholinguistics, or computational linguistics
  • Completed PhD
  • Be available for interview within the next 10 days
  • Experience with corpus analysis or text analysis will be considered an advantage
  • Duration at least till 1 May but longer is perhaps possible.

Please send your application letter a.s.a.p. to Agnes Tellings, PhD, More information will be given during the interviews.