Op de vooravond van kerstmis 2016 een leuk stuk in de krant over het samenleven met een persoonlijke (digitale) assistente. Hoe is het om al meer dan een jaar een "doosje" op tafel te hebben dat meeluistert (alles wat je zegt gaat rechtstreeks naar Amerika) en desgewenst interacteert met het gesprek?

Geen geduld

Als een ander iets niet verstaat, heb je er meestal geen moeite mee om het nog eens, nog eens (en wellicht nog eens op een andere manier) te herhalen. Zeker als je weet dat de ander uit een ander taalgebied komt, vind je er niets vreemds aan als hij/zij jou niet direct begrijpt. Maar.... met een computer/robot is dat beslist anders. Word je niet direct begrepen, dan is het al snel "hij doet het niet"!
Uit een Amerikaans onderzoek naar acceptatie van kunstmatige intelligentie blijkt dat een verkeerd advies van een computer snel leidt tot gebrek aan vertrouwen in de software. Dus ook als de herkenning ok is ("Alexa, doe het licht uit") maar om de een-of-andere reden de lampen niet uitgaan, dan is het al gauw: "die spraakherkenner doet het niet!"

 

nrc filmpjeGesprek Marc Hijink en Patrick van Hoof over digitale assistenten in huis

Compaan in huis

Nu wordt de spraakherkenning (snel) veel beter en zul je straks sneller/beter herkend worden. Een en ander leidt er toe dat we steeds vaker een "spraakherkenner in een doosje" als compaan in huis halen. Het begon met Alexa van Amazon en nu is er ook de Google Home, Apple's SIRI, Microsofts Cortana, Facebooks M en Samsungs Viv.

NRC Handelsblad techredacteur Marc Hijink schreef een erg leuk stuk over het samenleven met een digitale assistent: "Hoe intiem kun je werkelijk samenleven met een digitale huisgenoot?"

Alexa trok anderhalf jaar geleden bij de familie Hijink in en kreeg een plekje in de keuken. Vorige maand kwam daar een vriendje bij: Google Home. Ook een smart speaker maar dan eentje met gekleurde lampjes, die gaan knipperen zodra je ‘OK Google’ zegt. Het heeft wel iets weg van een hondje dat kwispelt zodra je z’n naam roept.

In dit artikel en de bijbehorende 6 min durende video wordt een mooi overzicht gegeven van de huidige staat van dit soort assistenten (wat kan wel/niet) en wat er de komende jaren gaat komen (o.a. geschikt maken voor het Nederlands en de Nederlandse context).

Zeer de moeite waard voor bij de kerstboom!

 

 

Kun jij liplezen?

Wanneer we met elkaar in gesprek zijn (en elkaar kunnen zien) doen we onbewust aan liplezen, en dit helpt bij het verstaan. Maar hoe zit dit bij computerspraak? Helpt het als een spraaksynthesizer via "visemen" een animatie van een gezicht laat zien?

Op de vijfde editie van het DRONGO talenfestival hebben we bezoekers gevraagd om deel te nemen aan een onderzoekje: het geluid stond uit, en de deelnemers moesten op basis van de animatie telkens raden welk van 4 woorden er werd uitgesproken. Het idee was: wie boven kansniveau scoort kan liplezen.

Elke deelnemer kreeg eerst een item om te oefenen met de applicatie. Daarna werden 10 items gepresenteerd die meetelden voor de score. Telkens werden 4 woorden willekeurig gekozen uit een lijst van ruim 3000 woorden van 1 of 2 lettergrepen. Het toeval bepaalde ook welk van de 4 woorden er werd uitgesproken (met het geluid uit!). Als je een keuze had gemaakt, kreeg je te horen of dat goed of fout was.


Het volledige artikel met de uitslagen per dag, is te lezen op de website van Fluency.

Op vrijdag 30 sept en zaterdag 1 okt was NOTaS met een grote eigen stand aanwezig op het DRONGO talen festival. Een druk bezochte bijeenkomst met heel veel bezoekers van allerlei pluimage.

Het verslag volgt, maar de links naar de presentaties staat alvast in de tab.

na remcoOp 20 september was NOTaS op bezoek bij het Nationaal Archief in Den Haag alwaar een interessant programma was voorbereid door onze contactpersoon en voormalig NOTaS-bestuurslid Remco van Veenendaal. Remco trad zelf op als dagvoorzitter en dat was hem prima toevertrouwd.

De opkomst was goed. Er waren zo’n 30 deelnemers waaronder veel vertegenwoordigers van het Nationaal Archief, het NIOD en de burelen van de Tweede Kamer. De Kamerleden zelf hadden iets anders te doen: het was tenslotte PrinsjesdagConfused.
De opkomst vanuit NOTaS zelf was helaas beperkt en daar was wellicht het juist op deze Prinsjesdag verstoorde treinverkeer naar Den Haag debet aan.

Taaltechnologie

na suzanDe eerste presentatie was van Suzan Verberne. Dit was een heel helder en leerzaam verhaal (misschien is college een beter woord) over de verschillende aspecten die een rol spelen bij de (automatische) classificatie van documenten, dus ook archiefstukken. Suzan ging uitgebreid in op het trainen van classificatoren en de toepassing daarvan op nieuw materiaal. Ze liet onderandere zien wat er goed en fout ging, hoeveel materiaal je gegeven de context nodig hebt en en hoe je het moet aanpakken om de technologie goed te kunnen gebruiken. Al-met-al een boeiende lezing!

Dat zulke technologie bij het NA behoefte bestaat bleek wel uit de presentatie van Remco die na de koffiepauze volgde. Daarin liet hij de raakvlakken met TST vanuit het NA zien en hoe de verschillende presentaties van vandaag daarin pasten. Meer in detail ging hij in op specifieke behoeften van uit het NA aan TST waarbij hij refereerde aan handschriftherkenning en e-Discovery voor e-mails.

 

Pitches

Hierna volgden drie kortere presentaties van NOTaS-deelnemers.
Dennis de Vries van Gridline BV vertelde over het product Woordenlijstbeheer waarin terminologie centraal staat. Dit sloot mooi aan bij Suzans presentatie. Want deze toepassing stelt documentalisten in staat om lijsten van documentlabels en thesauri te beheren.
Het volgende verhaal was van Arjan van Hessen van Telecats. Hij ging in op de ontsluiting van audiomateriaal, meer in het bijzonder van de plenaire debatten in de Tweede Kamer waarvoor het Nationaal Archief de archiveringsplicht heeft. Voor die ontsluitiing wordt het zgn "forced alignment" gebruikt: een vorm van spraakherkenning waarbij de bekende tekst (nl. de door mensen gemaakte transcripties) opgelijnd wordt met de audio van de video-opnamen van de debatten. Van ieder woord is nu bekend wanneer het door wie werd uitgesproken en dus kan daar op gezocht worden. Maar omdat goed te kunnen doen, is wel veel meer nodig dan wat er nu gebeurt. Iets waar de aanwezige ambtenaren van de "Dienst Verslaglegging en Redactie" het helemaal mee eens waren.

Joop den Uyl als stem voor het Nationaal Archief

na esther

De laatste presentatie was van Esther Judd van Readspeaker en dat was een echte uitsmijter: het beter en sneller kunnen ontwikkelen van "voorleesstemmen" met behulp van "statistische parametriche spraaksynthese" (SPSS) waarvoor Deep Learning wordt gebruikt. "

Tijdens de lunch is volop nagepraat en zijn er tussen verschillende aanwezigen afspraken gemaakt om een en ander verder uit te werken. Voor wie daarna niet verzadigd was met informatie, was er in de naastgelegen zaal de gelegenheid om een aansluitende bijeenkomst bij te wonen over Linked Open Data. 

Verslag namens het Nationaal Archief

Een vergelijkbaar verslag met de link naar de verschillende presentaties, staat op de website van het Nationaal Archief.

Deelnemersvergadering

Vanwege de lage opkomst van NOTaS-deelnemers had het weinig zin de geplande deelnemersvergadering door te laten gaan. Dat was jammer voor de penningmeester die speciaal voor deze gelegenheid zijn eigen Miljoenennota had meegenomen. Of iets bescheidener: de NOTaS-jaarrekening over 2015. Wie wil weten wat daarin staat, kan zich daarvoor alsnog bij hem melden.

 

robot

In de Volkskrant van 6-6-2016 een leuk stukje van Toine Heijmans over een experiment met autistische jongeren die gecoached zouden moeten worden door een robot (en ja, dat was onze eigen NAO). Het stuk geeft een aardig inzicht in de verwachtingen aangaande een robot en laat ook zien wat er vervolgens mis kan gaan.

Onderzoekster Bibi Huskens wordt aangehaald met:
"Haar team was weken bezig om scenario's te schrijven en die in Robia te programmeren. Met als gevolg dat drie mensen een werkdag nodig hadden om een therapiesessie van twintig minuten mogelijk te maken - aardappelen kweken in een woestijn is efficiënter."

Ongetwijfeld is dat waar, maar stel dat het wel lukt, dan is de uiteindelijke tijdwinst enorm, dus eigenlijk een beetje een kul-redenatie. Onderzoek bijna altijd zeer tijdrovend en je kunt niet verwachten dat je al tijdwinst boekt tijdens het onderzoek. Maar goed, leuk en leerzaam om te lezen.


logo volkskrant

Mensen houden van robots, letterlijk. Robots zijn dode stof, en toch is er de sensatie van een ontmoeting met leven. Twee Hampshire-hotels hebben sinds kort Hugo 'in dienst', de 'charmante en sympathieke humanoïde' (persberichtwoorden) die negentien talen spreekt, gezichten zes maanden onthoudt en weet welke tram naar het museum gaat.

Dat Hugo in de war raakt als een toerist vraagt of hij ook met de bus naar het museum kan, neemt iedereen voor lief: van een robot accepteren we meer dan van een receptionist.

De 'schattigheidswaarde', noemt Bibi Huskens dat, en ze schiet in de lach, alweer, 'sorry'. Bibi had een tijdlang een robot in dienst, Robia, en is blij dat-ie weer weg is. Toen ze met robots begon, als onderzoeker en therapeut bij autismecentrum het dr. Leo Kannerhuis, waren de journalisten niet weg te slaan: dit móést gefilmd en verteld: een robot die kinderen sociale vaardigheden leert. Maar dat het mislukte 'had geen nieuwswaarde, zeiden ze'.

Voor het volledige artikel, zie hier.