Intersteno 2017

Aanleiding

Ergens in het voorjaar van 2017 kwam het verzoek van Henk-Jan Eras namens de Dienst Verslag en Redactie (DVR) of ik het leuk zou vinden om op InterSteno 2017 in Berlijn een praatje te houden over het Telecats-Radboud project “Spreek2Schrijf” (S2S).

In het S2S-project gaan we proberen om met Moses (een soort GoogleTranslate) een software-tool te maken waarmee gesproken tekst automatisch kan worden omgezet in geschreven tekst. Dit om het werk van de medewerkers van de DVR te verlichten. Als het lukt, kunnen ze sneller een goed geschreven verslag maken.

Parallel CorpusHet bouwen van die tool gaat op een “BigData” manier waarbij we 100 uur opname van plenaire debatten gebruiken. Enerzijds hebben we de transcripties zoals die uit de spraakherkenner komen, anderzijds de officiële transcripties van de debatten zoals die door de medewerkers van de DVR werden gemaakt (de Handelingen). In feite beschouwen we de gesproken en de geschreven versie elk als een eigen taal en wordt het dus een vertaalprobleem met twee parallelle corpora.

InterSteno

InterSteno is een hybride conferentie. Enerzijds is het een echte conferentie (IPRS) met dit jaar het thema “Kwaliteit van de Verslaglegging”, anderzijds is het een wedstrijd waarin gekeken wordt wie er het snelst allerlei soorten audio mbv steno (shorthand transcription) kan transcriberen. De InterSteno bijeenkomst was van 21 tot 28 juli maar de eigenlijke IPRS-conferentie was op zondag 23 juli van 14:00 tot 18:00 en dinsdag 25 juli van 09:00 tot 18:00.

IPRS

IPRSIPRS (Intersteno Parliamentary and other professional Reporters’ Section) heeft als doel parlementaire en andere professionele verslaggevers samen te brengen en in staat te stellen kennis te nemen van voor de doelgroep relevante ontwikkelingen op het gebied van technologie, productiviteit, gezondheid en veiligheid, kwaliteitsstandaarden, rekrutering en training.

IPRS kijkt dus naar alle nieuwe ontwikkelingen op het gebied van verslaglegging en de vragen c.q. problemen die daarbij optreden. De stenografie-mensen richten zich vooral op de geschiedenis van steno en de huidige ontwikkelingen op dit gebied. Voorzichtig opmerken dat steno wellicht zijn langste tijd heeft gehad, werd dan ook niet door iedereen op prijs gesteld (?).

Naar Berlijn

treinHoewel vliegen net iets sneller gaat, is de trein toch een stuk comfortabeler (zeker het tweede deel met de ICE) en natuurlijk milieuvriendelijker. Je kunt er werken, er is WiFi, goede koffie of een biertje, veel beenruimte en een tafeltje voor de laptop. Bovendien kom je in het hartje van de stad aan zonder al dat veiligheidsgedoe. En met de eerste trein van zondag zou ik keurig op tijd komen voor de opening van de IPRS-conferentie om 14:00.
En inderdaad: om 13:45 wandelde ik uitgerust het hotel binnen, benieuwd naar hetgeen de conferentie nu precies behelsde.

Dag een: opening

De openingsbijeenkomst was in een lange, smalle zaal en de projectie op het scherm was van 1 meter boven de grond tot aan het plafond: lekker groot dus! Maar dit hield in dat de mensen achterin eigenlijk niets konden zien: onderste deel van het scherm verdween achter de ruggen van de mensen op de eerste rijen en veel presentaties gebruikte een veel te klein font zodat het vanaf rij 5 al niet meer leesbaar was.

Real-time ondertiteling

Wat wel erg gaaf was, was de aanwezigheid van het bedrijf Text-on-Top. De medewerkers schreven met een VeloType "life" mee met wat er gezegd werd (zelfs in meerdere talen) en projecteerden die text over het bovenste gedeelte van de presentatie. Bovendien werd de getypte tekst zin-voor-zin via GoogleTranslate vertaald en naar speciaal geprepareerde tablets gestreamd worden. In de praktijk werkte dit behoorlijk goed waardoor de aanwezigen die het Engels minder machtig waren toch bijna realtime een redelijk adequate transcriptie in hun eigen taal te lezen kregen. Nadeel was wel dat de tekst over de bovenste 10% van het scherm geprojecteerd werd waardoor er nog minder van de PPT te zien was. Wellicht handig om de presenatatoren daar de volgende keer vooraf op te wijzen?

Programma

Het zondagmiddagprogramma bestond uit 2 delen. Het eerste over manieren om de kwaliteit van het werk (het maken van de handelingen) te beoordelen, de tweede over de inzet van TST voor de verslaglegging: wat is het en heb je er iets aan?

Kwaliteitsmeting

Een interessant verhaal over kwaliteitsmeting kwam van de Nederlandse DVR: “Checking turns against the audio – a system of peer evaluation in the Dutch Parliamentary Reporting Office”. Het ging om een systeem waarmee de kwaliteit van het werk van de DVR-medewerkers gemeten kan worden. Dit wordt gedaan door elkaar (anoniem) de maat te nemen middels het door iedereen laten beoordelen van 40 random geselecteerde korte uitschrijffragmenten. Methodologisch wellicht niet helemaal zuiver (elk fragment werd maar door een iemand beoordeeld), maar goed om te zien dat ze op deze manier proberen de overall kwaliteit te verhogen.

Voice Recognition

Een van de twee organisatoren, Carlo Eugeni van de universiteit van Pisa, gaf een mooi overzicht van de verschillende technieken en terminologie die binnen "Speech Technology" gebruikt worden. Zo stelde hij dat de term Voice Recognition een overkoepelende term is die onder meer Speech Recognition, Speaker Identification, Speaker Diarization omvat. Ben het er niet helemaal mee eens: zou gewoon de term Speech Technology gebruiken. Maar het was nuttig dat hij zo’n overzicht schetste en geeft goed aan hoe de verschillende terminologien door elkaar kunnen lopen.

Voor deze en overige programmapunten, zie hier op de IPRS-website.

Het publiek

Het publiek van de IPRS-conferentie bestond vooral uit medewerkers van verschillende nationale (o.a. Engels, Nederlands, Canadees, Duits) en regionale parlementen (Wales, Siciliaans, Vlaams). Gegeven de verschillende sessies die over techniek gingen, had ik verwacht een meer tech-geïnteresseerd publiek te treffen, maar dat was niet echt zo.
Over het algemeen waren er weinig vragen na afloop en de vragen die kwamen, werden door steeds dezelfde mensen gesteld. Deels zal dat te maken hebben gehad met het niet altijd even vloeiend zijn in het Engels, maar je kreeg ook het idee dat technologie dikwijls meer als een bedreiging dan als een nuttig hulpmiddel werd gezien en dat is jammer.
In de wandelgangen een praatje aangeknoopt met een vertegenwoordiger van de Duitse Bundestag. Doen jullie al iets op dit gebied? Nou nee, we zijn daar totaal niet mee bezig, een beeld dat later door anderen werd bevestigd.

De sprekers

Tenslotte bleken ook veel sprekers niet heel handig te zijn met computers waardoor er bij bijna iedere sprekerswisseling behoorlijk wat tijd verloren ging met het installeren van de presentatie, converteren van bestanden, verbinden van de laptop met het scherm en meer. Wellicht kan dit een volgende keer voorkomen worden door a) iemand aan te wijzen die dit regelt en b) door de presentatoren een afstandsbediening te geven waardoor ze de presentatie vanaf het katheder kunnen bedienen.

Ook waren niet alle sprekers even vertrouwd met het presenteren in het openbaar en in het Engels. Volkomen begrijpelijk, maar het voorlezen van papier leidde bijna nooit tot een boeiende presentatie. En dat was jammer omdat veel onderwerpen wel zeer de moeite waard waren. Het enige voordeel van het voorlezen was dat de meeste praatjes qua tijd niet uitliepen.

Ondanks het schrappen van de workshop liep de bijeenkomst toch nog uit waardoor we pas om 18:30 onze eerste "Hefe Dunkel" op het nog zonnige Berlijnse terras konden gaan drinken. Daarna: op naar het hotel in het bosrijke Dahlem-Dorf.

Dag twee: bijslijpen

Op maandag gingen de wedstrijden captioning gewoon door maar was het voor de conferentiegangers een excursiedag. Ik heb die aan mij voorbij laten gaan omdat mijn presentatie voor dinsdag, na de ervaring op zondag, beslist moest worden aangepast. Minder techniek en moeilijke woorden, veel meer slides met grotere fonts want anders zag men er toch niks van. Maandag werd daarom vooral besteed aan het onder een grote parasol in de zon zittend, afmaken en bijvijlen van de presentatie.

De middag werd afgesloten met een biertje met Cord Pagenstecher: een collega Oral History onderzoek aan de Freie Universität Berlin (5 minuten van het hotel). Gezellig en goed om te horen welke nieuwe projecten zij nu allemaal weer aan het opzetten zijn en wellicht biedt dit kansen voor een nauwere samenwerking in de nabije toekomst. Na de biertjes met Cord een pizzeria gezocht in het nabije Dahlem-dorf. De pizzeria bleek eigenlijk een soort grote Biergarten te zijn waarin bijna iedereen onder de parasol bleef zitten toen het toch wel heel hard begon te regenen.
Bij het betalen bleek weer eens dat Duitsers toch heel wat beschaafder zijn dan wij. Ik had gevraagd of ik per kaart kon betalen en dat kon. Echter, bij afrekening bleek dat het om een lokale bankkaart ging en niet om een pinpas of creditkaart. "Nou", zei het kassameisje, "5 minuten verderop zit een betaalautomaat: daar kun je geld wisselen". In het vertrouwen dat ik dat zou doen en ook zou terugkomen om te betalen, ging ze verder met haar werk. Ik geheel verbaasd: kon dus gewoon weglopen en de boel de boel laten! Het was vooral het vanzelfsprekende vertrouwen dat mij zo verbaasde: geen enkel wantrouwen jegens de klant.

stenoDag drie: praatje

Het weer was definitief omgeslagen en al bij het ontbijt goot het. Uitchecken en in 20 min met de U-bahn naar het Mediahotel op de Kurfürstendamm. Deze laatste conferentiedag was er een mix van verhalen over kwaliteit, spraakherkenning en vooral erg veel over stenografie: hoe het in de verschillende landen ontstaan was en waarom steno toch zo belangrijk is dat het niet mag verdwijnen.
Vooral dat laatste riep een hoop vraagtekens op bij mij: steno is uitgevonden om snel en goed een woordelijk verslag te kunnen maken van een gesprek of discussie. Zo werd in het stenosysteem "Groote" rond 1899 uitgevonden door Arnold Willem Groote. Hij was de assistent van een Nederlandse generaal en had een methode nodig om de woorden van die generaal op te schrijven terwijl ze op een paard reden. Fascinerend en voor die tijd bijzonder inventief, maar daar heb je tegenwoordig toch echt een heleboel andere mogelijkheden voor.

Ook deze dag werden alle praatjes op een paar na weer van papier afgelezen. In sommige gevallen ging het zelfs om duo-presentaties waarbij de een de tekst van papier voorlas en de ander meelas en op vooraf aangegeven momenten (kruisjes in de uitgeschreven tekst) op het knopje “volgende slide” drukte.

Wat moet je opschrijven?

De enige die ook het verhaal gewoon vertelde was John Vice: Editor of Debates of the House of Lords. En dit was volgens mij dan ook direct het beste en ook wel fundamentele verhaal (hij kon gewoon z’n moerstaal spreken, maar toch).
John Vice vroeg zich af hoe je nu op papier verslag legt van "fysieke zaken" die gebeuren tijdens het debat.

farageDenk daarbij bijvoorbeeld aan een speech van Nigel Farage in het Europarlement. Terwijl Farage zijn bekende verhaal over criminelen en buitenlanders houdt, steekt een andere parlementariër die schuin achter hem zit, een bordje omhoog met “He’s lying to you”. Erg komisch, maar hoe geef je zoiets in het verslag weer?

John onderkende 5 officiële strategieën:

  1. Schrijf alleen op wat er gezegd wordt
  2. Pas de woorden een klein beetje aan
  3. Voeg een beschrijving toe (tussen haakjes)
  4. Zinspeel op deze niet-verbale gebeurtenis
  5. Rapporteer alles voor zover mogelijk

Hoe gaat dat nu?

Interessante vragen die geïllustreerd werden met een groot aantal filmpjes van parlementariërs uit verschillende landen die zoiets deden. Bijvoorbeeld een groot mes meenemen in de House of Lords en daarmee zwaaien om aandacht te vragen naar "al die wapens op straat". De Speaker merkte slechts op dat het tonen van een wapen in het Britse Parlement verboden was. In het verslag werd aan deze toch een paar minuten durende act slechts aan gerefereerd met: [interuption].

Niet alleen papier?

BurkeOok vroeg John zich af of het niet tijd werd om ook op een andere manier dan alleen schriftelijk, verslag te leggen van hetgeen zich in het parlement voordoet. Naast een groot aantal video’s van parlementsleden die allerlei zaken (vissen, zwaard, Rode Boekje van Mao en meer) gebruiken om hun betoog te onderstrepen, liet hij zien dat dit niet alleen iets is van tegenwoordig. Op 28 december 1792 waarschuwde Edmund Burk zijn mede parlementsleden voor het gevaar van de Franse revolutie door zijn zwaard demonstratief op de grond te gooien. Dit werd niet beschreven in de officiele papers maar 2 dagen later verscheen er wel een spotprent van James Gillray over in de kranten. Een mooi voorbeeld van een historische multimediale presentatie.

Deze vraag sprak mij wel aan: wij (=computertechneuten & DH-onderzoekers) vinden al lang dat niet alleen het parlement maar ook andere overheidsdiensten (politietie, FIOD, Rechtbank) multimediaal zouden moeten kunnen rapporteren. Nu mag dat nog niet, maar of “alleen papier” het nog 10 jaar volhoudt……...

Spreek-naar-Schrijf

Mijn praatje (na de lunch) werd direct gevolgd door een door Rian Schwarz-van Poppel (Hoofd van de DVR en een van de organisatoren van deze IPRS-conferentie) geleidde discussie over het voor- en nadeel van Taal- en Spraaktechnologie (spraakherkenning, slim zoeken en betere ontsluiting).
Met enig trekken en duwen kwamen er een paar leuke reacties van onder andere het Canadese, Schotse en Italiaanse parlement. Allemaal hadden ze al ervaring met vooral re-speaking maar alleen het Schotse Parlement gebruikte dat ook daadwerkelijk. Wel vonden anderen de nu gepresenteerde technologie "interessant genoeg" om er toch nog eens naar te kijken. We zullen zien ?.

Hoewel de conferentie pas om 18:00 zou zijn aflopen, was het voor mij tijd om te gaan: om 16:50 vertrok de laatste trein naar huis.

Conclusie

Al met al was het een interessante, zeer heterogene conferentie. Duidelijk werd dat er op het gebied van parlementaire verslaglegging veel gebeurt en ook dat niet iedereen hier op zit te wachten. Deze tweedeling is op zich niet vreemd en dit is wellicht een goede reden om de volgende keer aan de hand van cijfers en use-cases te laten zien dat de gepresenteerde oplossingen ook daadwerkelijk hun nut hebben voor de praktijk van parlementaire verslaglegging. Wij (Telecats en Radboud) hopen dat het Spreek2Schrijf project zo goed loopt dat wij volgend jaar die cijfers kunnen laten zien. 
Ik kijk er stiekem al naar uit.

 

Arjan

25 juli 2017, Utrecht