Wensen en verlangens

Het zal geen verbazing wekken dat velen TST als een soort wondermiddel zien waarmee ze hun visuele beperkingen enigszins kunnen compenseren. Toch waren de meeste wensen niet zo esoterisch; er zaten weinig “dromen” bij die de komende decennia beslist niet vervuld zouden kunnen worden.

De genoemde onderwerpen lieten zich onderverdelen in drie categorieën:

  • Domotica
  • Internet en ICT
  • Mobiliteit

Waarbij Domotica meer dan de helft van de wensen representeerde.

Domotica

sirieneco toonIn een wereld die steeds complexere apparaten bevat en waar de gebruikers deze apparaten met een steeds “strakkere” interface willen bedienen, wordt het voor de VH lastiger om nog bij te blijven. Een telefoon met een draaischijf of druktoetsen is een relatief simpel apparaat waarmee ook op de tast kan worden omgegaan. Om echter een smartphone met tientallen apps en een touch screen te gebruiken, heb je toch echt visuele input nodig. Deze ontwikkelingen beperken zich niet tot tablets en telefoons: ook keramische kookplaten bevatten touch-knoppen die je op de glasplaat niet kunt voelen (maar wel kunt zien). Centrale verwarmingen gebruiken in toenemende mate slimme invoerapparaten zoals de Toon of slimme thermostaten en zelfs het licht wordt in toenemende mate bediend middels slimme apparaten met een touch bediening. Nu kan men denken dat het licht minder relevant is voor een blinde, maar dat geldt niet voor slechtzienden die juist enorm veel baat hebben bij het zelf goed kunnen regelen van de hoeveelheid licht.

Ten slotte werd het bedienen van AV-apparatuur (radio, CD-speler, etc.) veel genoemd: ook daar steeds minder fysieke knoppen en steeds meer “smart” bediening.

Nu begrijpt iedereen dat deze trend naar “strakke” bediening via touch screens niet te stoppen is, maar de vraag die dan rijst is: hoe kunnen VH hier mee omgaan. De meest gehoorde wens was: een bediening met spraak waarbij zowel de keuze als de terugmelding door middel van spraak gebeuren.

Als voorbeeld werd genoemd: je wilt een witte was op 30 graden draaien en dan zou je moeten kunnen zeggen: “wasmachine: doe een witte was op 30 graden” waarna de machine dit zou terug melden als “je wilt een witte was draaien op 30 graden” of je zegt “oven: onder en boven warmte op 220 graden gedurende 30 minuten” waarna de oven dit terugmeldt.

Bij deze wensen werd een tweedeling zichtbaar: een deel van de VH wilde de intelligentie in het apparaat (dus een wasmachine of oven die TST-functionaliteit heeft) en een deel wilde die functionaliteit op een apart apparaat en dan bij voorkeur op de smartphone (het viel op dat veel VH een smartphone hebben en de daarop aanwezige TST-functionaliteit intensief gebruiken). Vrij algemeen was de kritiek op de leveranciers: waarom doen zij dat niet? Er is een duidelijke behoefte aan een standaard voor dit soort interfaces.

Een ander verzoek dat velen hadden was het begrijpen van de wereld om hen heen (zeer breed), maar dan vooral van de bedieningsknopjes van de apparaten waar ze gebruik van maken. Een vrouw vertelde dat ze bij haar dochter gaat babysitten en dan koffie wil zetten, maar ze kent het apparaat niet. Ze zou graag haar smartphone voor het apparaat willen houden waarna de smartphone de te gebruiken knopjes zou voorlezen. Idealiter zou je dan je vinger boven een knopje houden waarop jouw apparaat dan zou zeggen: “latte macchiato” oid.

Internet en ICT

Bij Internet en meer algemeen ICT was de wens vooral om beter en slimmer te kunnen zoeken en veel diensten ook met spraak te kunnen gebruiken. In toenemende mate worden websites voorleesbaar gemaakt en dat werd gewaardeerd hoewel er kritiek was op de wijze van voorlezen. Het bedienen (doe dit of dat) van de computer/tablet met je stem is echter minder gebruikelijk.

Mobiliteit

Het spreekt voor zich dat VH grote moeite kunnen hebben wanneer ze zich buiten de voor hen vertrouwde omgeving moeten begeven. Veel wensen gingen dan ook over nauwkeuriger navigatiesystemen die je van deurklink tot deurklink kunnen leiden. Ook hier de wens de bediening via spraak te doen. Dit kan in veel gevallen al maar is dikwijls voor verbetering vatbaar.

Behalve het navigeren (zeg maar de TomTom-functionaliteit) wilde men ook graag auditieve terugmelding over de plek waar men was (“u bent nu op het kruispunt met X en Y of u passeerde net de Z-straat”).

Spraaktech

De huidige stand van de spraakherkenning is echter al zo goed, dat eigenlijk alles dat ter sprake kwam, al makkelijk met je stem gedaan kan worden. Zowel Apple, Google als Microsoft bouwen spraakherkenning in hun besturingssystemen in en de testjes die zowel Henk als Arjan ter voorbereiding van deze bijeenkomst hadden gedaan, lieten zien dat ASR niet de belemmerende factor is. Met apps als SIRI, GoogleVoice en Cotona kun je al heel veel zaken met je stem doen. Het probleem hierbij is dat de dialogen nu bijna allemaal nog visueel-auditief zijn. Dwz je zegt in Google “hoe laat gaat albert heijn open” en Google komt terug met de zoekopdracht “hoe laat gaat albert heijn open” en toont direct de antwoorden op die zoekopdracht (zie plaatje hieronder). Dit werkt zeer goed, maar je hebt er niets aan als de resultaten niet worden uitgesproken. Bovendien wil je in dit soort gevallen geen lijst met mogelijke websites waar een antwoord zou kunnen staan maar je wilt een (voorgelezen) antwoord. Aan de spraaksynthese zelf zal het niet liggen want die is heden ten dage goed genoeg om de opgetrommelde tekst in spraak van behoorlijke kwaliteit om te zetten.

Het zelfde geldt voor de bediening van apparaten. De gesproken opdracht (ideale omstandigheid: koptelefoon in rustige kamer zonder echo, Google Chrome op een laptop en een stem die voor dit soort zaken meestal “goed werkt”) geeft als resultaat een aantal website met kooksuggesties.

Protocollen

Wat hier gedaan moet worden is de koppeling van de herkenningsresultaten aan de besturing van de apparaten. De vraag is dan hoe je dat doet? De Enschedese startup Homey heeft een apparaat ontwikkeld waarbij de spraakherkenning van Google gebruikt wordt om verschillende apparaten in huis te bedienen (Thermostaat, radio-TV en meer). Het grootste probleem bij het bedienen van apparaten is niet de herkenning, maar het gebrek aan standaardisering van de interfaces.

Op dit moment worden er verschillende protocollen gebruikt die niet onderling uitwisselbaar zijn. Bovendien komen Microsoft, Apple en Google ook met hun eigen domotica-protocollen. Zolang er geen algemeen bruikbaar standaard komt (zoals html voor websites en xml voor gegevensuitwisseling) wordt het lastig om een generieke manier te ontwikkelen waarmee apparaten met spraak bediend kunnen worden. Er zijn wel talloze hobbyisten die zelf iets maken en die laten zien dat het kan gaan werken, maar daar hebben VH niet zo heel veel aan. Om deze ontwikkelingen bij fabrikanten in gang te zetten zal het nodig zijn hen ervan te overtuigen dat spraakinterfaces voor iedereen een toegevoegde waarde hebben en niet alleen voor VH.

Rol Taalunie

Nederlandstalige taal- en spraaktechnologie als middel voor VH om de wereld om hen heen beter en eenvoudiger te “gebruiken” en uiteindelijk ook hun kansen op de arbeidsmarkt te vergroten ligt dicht tegen de algemene doelstellingen aan van de Taalunie. Dat de TST “voldoende goed” is om te kunnen worden gebruikt is goed nieuws. Het grootste probleem ligt blijkbaar bij het op een min-of-meer generieke wijze van aansturen van apparaten.. De Taalunie kan hier een belangrijke rol spelen om de verschillende partijen (bedrijven die met Domotica werken, universiteiten en VH-organisaties) bij elkaar te brengen om geschikte oplossingen te vinden.

Conclusie

De bijeenkomst in Nijmegen was een groot succes: er kwamen met ruim 60 deelnemers meer dan 3x zo veel mensen dan op een “reguliere” bijeenkomst en veel mensen hadden hun wensen en dromen aangaande het gebruik van TST op papier gezet. Het laat zien dat het onderwerp leeft bij VH. Ook werd duidelijk dat veel VH de aanwezige TST op hun smartphones al gebruiken. Het verlangen om hun wereld te “besturen” door middel van TST is dus groot en men doet dat dan ook voor zover dat kan. Het gebruik van TST beperkt zich op dit moment echter tot verkrijgen van informatie: zoeken op internet, naambellen, algemene navigatie en dicteren. Het bedienen van apparaten door middel van je stem is, op enkele uitzonderingen na, nog niet goed mogelijk doordat er geen algemene koppeling is tussen een gesproken en goed herkend commando en een daadwerkelijke uitvoering (ASR: “zet koffie” werkt maar er komt geen koffie).

De beste stappen om nu te nemen zijn het bij elkaar brengen van bedrijven, universiteiten en VH-organisaties om te zien hoe het gebrek aan standaardisering aangepakt kan worden. Bijvoorbeeld door dit onder de aandacht brengen van leveranciers en het bevorderen van uitwisselingsprotocollen waarmee de verschillende apparaten en diensten onderling kunnen communiceren. Het grootste probleem ligt echter bij de fabrikanten van (huishoudelijke) apparaten: die moeten toestaan dat “vreemde” protocollen gebruikt worden om hun apparaat te bedienen.

Het zou mooi zijn als er een standaard komt, maar het is waarschijnlijk niet aan “ons” om dat af te dwingen.

Arjan van Hessen, Henk van den Heuvel, Catia Cucchiarini