Selecteer de taal

  • English (United Kingdom)
  •  
    • Over
    • Login
    • Agenda
  • Organisatie
    • Missie
    • Bestuur
    • Deelnemers
    • Partners
    • Deelnemers van Verdienste
    • Deelnemer worden
    • Informatiepakket
    • Enquête
    • Support letters
  • Nieuws
  • DIXIT
  • Blogs
  • Activiteiten
    • Inschrijven
    • Bijeenkomsten
    • NOTaS & TST
  • Video
  • Contact
  • Downloads
  • Foto's
Spraakherkenning heeft enorme stappen gemaakt, maar...

Spraakherkenning heeft enorme stappen gemaakt, maar...

vrijdag 21 okt 2022

We weten steeds meer van taal en spraak af en maken naarstig gebruik van NLP, ASR en andere AI-technieken om ervoor te zorgen dat spraakherkenning zo goed mogelijk gaat. En het gaat ook steeds...

Duizend ai-onderzoekers doorbreken de taalbarrière

Duizend ai-onderzoekers doorbreken de taalbarrière

zaterdag 9 jul 2022

's Werelds grootste open meertalig taal-model ontwikkeld: Bloom 19 juli 2022 09:50 | Alfred Monterie | van Computable De Toren van Babel van Pieter Bruegel de Oude BigScience, een brede coalitie...

DRONGO talenfestival: Lezen verliest zijn dominantie, maar niet zijn belang.

DRONGO talenfestival: Lezen verliest zijn dominantie, maar niet zijn belang.

zaterdag 14 mei 2022

¿LEZEN! is het thema van het DRONGO talenfestival op 2 en 3 oktober. Met een uitroepteken én een vraagteken. Want wie het veld van ontlezing, laaggeletterdheid en leesonderwijs overziet, ontkomt...

Linguistische vingerafdruk

Linguistische vingerafdruk

vrijdag 22 apr 2022

Benieuwd naar wie Q is? Linguïsten hebben wel een idee. (21 april 2022) Toen de volkomen onbekende schrijver Robert Galbraith een prachtige novelle schreef, vroeg een krant zich af hoe zo'n...

Spraak technologie en video samenwerking naar de maan

Spraak technologie en video samenwerking naar de maan

donderdag 3 feb 2022

Details Gepubliceerd: 03 februari 2022 door: Witold Kepinski Lockheed Martin, Amazon en Cisco werken samen om unieke mens-machine-interfacetechnologieën te integreren in NASA's Orion -...

Liplezen levert verbetering van spraakherkenning

Liplezen levert verbetering van spraakherkenning

vrijdag 14 jan 2022

Details Gepubliceerd: 14 januari 2022 De huidige systemen om gesproken teksten om te zetten in uitgeschreven teksten, maken doorgaans alleen gebruik van audio-opnames. Eigenlijk is dat gek want...

Whatsapp gaat goed, Instagram is lastiger

Whatsapp gaat goed, Instagram is lastiger

woensdag 14 okt 2020

Details Gepubliceerd: 14 oktober 2020 Nu de wereld digitaliseert, zijn er ook steeds meer bedrijven die de technieken toegankelijk maken voor blinden en slechtzienden. Al is het nog best lastig...

NOTaS 2019

NOTaS 2019

donderdag 6 feb 2020

NOTaS beleefde in 2019 een uitstekend jaar met twee zeer goed bezochte en inhoudelijk boeiende netwerkbijeenkomsten (achtereenvolgens bij de Universiteit Tilburg en het LIACS in Leiden) en een...

META-FORUM 2019: Introducing the European Language Grid

META-FORUM 2019: Introducing the European Language Grid

woensdag 18 sep 2019

Met 24 officiële talen in de EU en nog veel meer niet-officiele talen, kan de meertaligheid en een inclusieve digitale interne markt in Europa alleen mogelijk worden gemaakt door middel van...

NOTaS bijeenkomst bij het LIACS

NOTaS bijeenkomst bij het LIACS

dinsdag 27 aug 2019

Op vrijdagochtend 13 september is er weer een NOTaS-deelnemers bijeenkomst, dit maal bij het prestigieuze LIACS Het Leiden Institute of Advanced Computer Science (LIACS) is een kenniscentrum voor...

More Articles
  • European Language Grid (ELG) gelanceerdwoensdag 5 jun 2019
  • Beweeglijk Nederlandsvrijdag 29 mrt 2019
  • Taal en spraaktechnologie voor het IJslands 2018-2022donderdag 21 mrt 2019
  • TST en Kunstmatige Intelligentiemaandag 28 jan 2019

Spraakherkenning heeft enorme stappen gemaakt, maar...

We weten steeds meer van taal en spraak af en maken naarstig gebruik van NLP, ASR en andere AI-technieken om ervoor te zorgen dat spraakherkenning zo goed mogelijk gaat. En het gaat ook steeds beter, maar hoe beter ASR loopt, hoe meer duidelijk wordt wat we nog niet kunnen. Denk aan dialect-spraak (of spraak met zware accenten), spraak van mensen met een afwijkende stem, spraak van kinderen en meer. Zal het ooit 100% correct lopen? Nee, mar ongetwijfeld zal het beter gaan dan nu. We zien dat al bij onze grote broer: het Engels dat het al veel beter doet dan het Nederlands. Over ong 3 jaar kunnen we dat ook (alleen zal het Engels dan natuurlijk ook vooruit gegaan zijn).

En welke toepassingen komen er voor ons beschikbaar als AI beter wordt met de Nederlandse taal?

BNR 

BNR heeft een boeiende podcast gemaakt die zich hiermee bezig houdt. Het gaat om gesprekken met drie mensen die ieder vanuit hun hoek het probleem belichten: Antal van de Bosch, Marlou Snelders en Peter-Paul de Leeuw. Ze geven antwoord op vragen als:kan AI de herkenning van dialecten, jargon zelfs straattaal beter maken, hoe goed is AI nu met de Nederlandse taal en wat kunnen we eraan doen om dit te verbeteren?

 

In deze aflevering zijn te gast:

  • Prof. dr. Antal van den Bosch, hoogleraar taal, communication en computatie aan de Universiteit Utrecht. Antal doet veel onderzoek naar en ontwikkelt betere AI op het gebied van taal.
  • Marlou Snelders, innovation liaison bij Security Delta en coördinator voor de werkgroep Veiligheid, Vrede en Recht bij de Nederlandse AI Coalitie. Marlou is verantwoordelijk voor het NAIN-project, waarbinnen verschillende partijen uit de industrie samengebracht worden om de Nederlandse taal in AI te verbeteren.
  • Peter-Paul de Leeuw, CEO en oprichter van Amberscript. Amberscript is een bedrijf dat het transcriberen van gesproken tekst automatiseert met behulp van kunstmatige intelligentie. De software van Amberscript ondersteunt inmiddels 39 talen, maar hoe zit het met Nederlandse dialecten en bijvoorbeeld jargon?
 
Voor de link, zie hier.
 

NOTaS 2019

logo Notas2NOTaS beleefde in 2019 een uitstekend jaar met twee zeer goed bezochte en inhoudelijk boeiende netwerkbijeenkomsten (achtereenvolgens bij de Universiteit Tilburg en het LIACS in Leiden) en een geanimeerde netwerklunch bij Karel V rond de ontwikkeling van ISO-standaarden voor TST.

Als bestuur zijn we alweer druk bezig om nieuwe bijeenkomsten op te zetten in 2020, waarbij we voortbouwen op de succesformule van de vorige bijeenkomsten: een interactieve miniconferentie i.s.m. een voor de TST-sector interessante gastorganisatie waar zowel academische sprekers als productontwikkelaars en gebruikers ingaan op een overkoepelend thema. Zoals gebruikelijk blijven nieuwe introducées van harte welkom, want NOTaS heeft nog steeds de ambitie om te groeien.

Activiteiten

Onze eerstvolgende bijeenkomst is op donderdag 19 maart in de Jaarbeurs Meetup in Utrecht, waar de Belastingdienst ons ontvangt met een veelzijdig programma rond ethische aspecten van AI-toepassingen bij overheidsdiensten, waarbij uiteraard ook de ethiek van Taal- en Spraaktechnologie aan bod zal komen. Save the date!

Twee dagen eerder organiseert de Hogeschool Leiden ook een boeiend symosium rond E-discovery. Verder bestaat de mogelijkheid om op maandag 8 juni deel te nemen aan de 1e editie van de Nederlandse Spraaktechnologiedag bij de TU Delft en hier zelf een posterpresentatie te verzorgen.

Verder wil het bestuur jullie graag informeren over drie recente besluiten:

  • - de contributie 2020 en de bijbehorende deelnemersfactuur
  • - de sponsorbijdrage aan de Stichting Open Spraaktechnologie
  • - het herstel van de onverwachts offline gehaalde NOTaS-site

Bestuur

De samenstelling van het bestuur is ongewijzigd en bestaat uit Fabrice Nauze (vz), Staffan Meij (vvz), Henk v.d. Heuvel (pm), Arjan van Hessen (webmaster) en ondergetekende (secr).

Veel leesplezier en hopelijk tot 19 maart!

Met vriendelijke groet,

Namens het bestuur,

Oele Koornwinder

Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken.

TST en Kunstmatige Intelligentie

DixitKunstmatige Intelligentie is bezig met een enorme opmars, zoals we bijna dagelijks in de kranten kunnen lezen. Behalve dat we steeds beter foto's kunnen herkennen, auto's zelfstandig kunnen laten rijden of het weer kunnen voorspellen, kunnen we ook steeds beter omgaan met het fenomeen dat ons mensen onderscheidt van andere zoogdieren: Taal!

Taal is vaag, ambigu, context-afhankelijk, dikwijls incompleet en toch een geweldig communicatiemiddel dat ons ver heeft gebracht. Kan Kunstmatige Intelligentie daar iets mee? Kunnen we de stap nemen van herkennen naar begrijpen, en zo ja hoe dan en hoe goed?

In 2017 heeft NOTaS een hele DIXIT aan TST en KI gewijd. Het resultaat beviel ons zo goed dat we de Tilburg University Language Production group (TULP, onderdeel van het TiCC) hebben gevraagd om een lezingenochtend rond dit onderwerp samen te stellen. Iedereen met interesse in dit Engelstalige programma (zie hieronder) is van harte welkom.

De bijeenkomst vindt plaats op vrijdag 15 februari 2019 en eindigt met een informele netwerklunch. Deelname is gratis. Wel verzoeken we je om je komst tevoren even door te geven via het tabblad inschrijven hieronder. Locatie: Tilburg University (TiCC), Dante-gebouw, Warandelaan2, kamer D353  


TST en Kunstmatige Intelligentie

NOTaS-meeting at Tilburg University (TiCC), Dante-gebouw, Warandelaan2, kamer D353  

Theme: HLT and Artifical Intelligence:

Program

9:30 – 10:00:  Welcome with coffee

10.00:  Brief introduction (NOTaS-board)

10:05:  Emiel Krahmer (DCC) -  Automatic text generation and its applications

10:35: Grzegorz Chrupala (CSAI) - Neural representations of form and meaning in spoken language

11:00: Coffee Break

11:30: Sander Wubben (Flow.ai) -  An overview of Flow.ai: the conversational AI toolkit

12:00: Mark Breuker & Roland Groen (Edia)  - Transforming educational publishing with language technology

12:30: Final discussion: HLT & Artifical Intelligence

12:45 – 13:30 Lunch (Esplanade)

Locatie

De bijeenkomst is in het Dante-gebouw (Warandalaan 2) op de campus van de Universiteit van Tilburg.

warandalaan

 

Duizend ai-onderzoekers doorbreken de taalbarrière

's Werelds grootste open meertalig taal-model ontwikkeld: Bloom

19 juli 2022 09:50 | Alfred Monterie | van Computable

De Toren van Babel van Pieter Bruegel de Oude

BigScience, een brede coalitie van artificial intelligence (ai)-onderzoekers, heeft ‘s werelds grootste open meertalige taal-model ontwikkeld. Met 176 miljard parameters kan het Bloom-model coherente teksten genereren in 46 natuurlijke talen en dertien programmeertalen. Die zinnetjes zijn nauwelijks te onderscheiden van wat mensen produceren

Anders dan de meeste taalmodellen richt Bloom zich niet op het Engels of Chinees. Het werkt ook vanuit het Arabisch, Spaans, Frans en Nederlands. Aan het model dat met geld van de Franse regering tot stand is gekomen, hebben meer dan duizend onderzoekers uit zeventig landen gewerkt. Nooit eerder waren zoveel ai-experts bij één enkel onderzoeksproject betrokken.

Behalve CNRS (het Franse TNO), Nvidia, Microsoft en supercomputer-exploitant Genci zijn ruim tweehonderdvijftig universiteiten, startups en ondernemingen van de partij. Het reusachtige model is elf weken lang getraind op de Jean Zay-supercomputer in een rekencentrum bij Parijs.

Onderzoekers kunnen vrijelijk toegang krijgen tot het model dat op een hub van het ai-bedrijf Hugging Face staat. Ze mogen op Bloom de prestaties en het gedrag van hun eigen taalmodellen onderzoeken. Iedereen die akkoord gaat met de voorwaarden van de ‘responsible ai license’ kan het model gebruiken. Op een lokale machine of via een cloudaanbieder is hierop voort te borduren.

Large language models

"De meeste instellingen hebben eenvoudigweg de middelen niet "

Grote taalmodellen (LLM's: large language models) hebben een aanzienlijke impact gehad op ai-onderzoek. Deze krachtige, algemene modellen kunnen een breed scala aan nieuwe taaltaken op zich nemen vanuit de instructies van een gebruiker.

De academische wereld, non-profitorganisaties en onderzoekslaboratoria van kleinere bedrijven vinden het echter moeilijk om LLM's te creëren, te bestuderen of zelfs te gebruiken. Dit komt omdat slechts een handjevol industriële laboratoria hier volledige toegang toe hebben. De meeste instellingen en ook starters missen eenvoudigweg de middelen of beschikken niet over de (vaak exclusieve) rechten.

Bloom, de eerste meertalige LLM dat is getraind in volledige transparantie, gaat deze status-quo veranderen. Het model lijkt qua structuur erg op GPT-3 (generative pre trained transformer 3), het systeem voor het genereren van hele stukken tekst waarmee OpenAI uit San Francisco twee jaar geleden de wereld verbaasde. Ook qua capaciteit, uitgedrukt in het aantal parameters, evenaren beide systemen elkaar.

Opensource

Op het gebruik en de broncode van GPT-3 heeft Microsoft een exclusieve licentie. Daarentegen is Bloom opensource. Het team achter Bloom biedt een ruime blik onder de motorkap zodat duidelijk wordt hoe alles werkt. Omdat gebruikers zich moeten houden aan de voorwaarden van de responsible ai-licentie, kan misinformatie worden voorkomen.

Bloom geeft ook de tussentijdse checkpoints en de optimalisatie-statussen van de training vrij. Beschikbaar is een inferentie-api voor grootschalig gebruik. Het project staat nog maar aan het begin, aldus een blog op HuggingFace, de startup die een ecosysteem rond Bloom heeft gebouwd. Het model wordt verder verbeterd. Een meer bruikbare versie met hetzelfde prestatieniveau ligt in het verschiet. Op den duur moet een hele familie van modellen ontstaan. Bovendien komen er nog meer talen bij.

DRONGO talenfestival: Lezen verliest zijn dominantie, maar niet zijn belang.

impact lezen¿LEZEN! is het thema van het DRONGO talenfestival op 2 en 3 oktober. Met een uitroepteken én een vraagteken. Want wie het veld van ontlezing, laaggeletterdheid en leesonderwijs overziet, ontkomt niet aan de vraag waaróm het zo slecht gaat met lezen in Nederland. Tientallen organisaties en duizenden mensen zetten zich vol passie in om dat tij te keren. Ís boeken lezen wel zo belangrijk voor nieuwe generaties, nu er zoveel andere kanalen beschikbaar zijn om verhalen en informatie te delen? Is de crisis in het boekenvak grotendeels aan de boekenwereld zelf te danken?

dc

sp

Het festival laat zien dat de oplossingen voor de leescrisis voor het oprapen liggen. In tientallen online presentaties en webinars kan de bezoeker kennis maken met recent onderzoek, nieuwe initiatieven en leermethoden. De Britse taalkundige David Crystal bespreekt met de bezoekers hoe leesontwikkeling samenhangt met de taalontwikkeling van jonge kinderen. Ook de wereldberoemde taalpsycholoog en schrijver Steven Pinker maakt zijn opwachting met een interactieve sessie over wat de cognitieve wetenschap ons leert over goed schrijven. Verder bevat het programma diverse presentaties over hoe kinderen aan het lezen te krijgen, is er aandacht voor laaggeletterdheid, technologie en taal, de breedte van het taal- en leesspectrum en biedt het een overzicht van de vele taal- en leesactiviteiten die worden ingezet door de verschillende organisaties.
hdb In vier live talkshows bespreekt Hadassah de Boer de ontwikkelingen met een reeks aansprekende gasten. Moeten we misschien de nadruk op lezen loslaten, om het lezen te laten overleven?
PC  Paulien Cornelisse vertelt over haar dagelijkse worstelingen met het Japanse schrift, waarin zij zich een laaggeletterde voelt. Laaggeletterdheidsprofessor Maurice de Greef presenteert de bevindingen van nieuw Europees onderzoek naar de beste manier om laaggeletterden te bereiken. Mohammed Benzakour belicht de kloof tussen de hoog- en de laaggeletterde.  Lidewijde Paris (De Leesambassade), Lev Avitan (Mensen Zeggen Dingen) Gerlien van Dalen (directeur van Stichting Lezen) en Ruth de Jager (Storytel) gaan met elkaar in gesprek over hoe de ontlezing tegen te gaan. Is het luisterboek een impuls voor de literatuur, voor het lezen? Over het lees- en literatuuronderwijs spreken onder andere Bas Steman (‘Lekker Boekie’), Matijs Lips (leraar Nederlands van het jaar 2019), Thoni Houtveen (leesexpert), en Maud Vanhauwaert (voormalig stadsdichter van Antwerpen).

avd

ÖA

Adriaan van Dis en Özcan Akyol bevragen elkaar in de slotsessie openhartig. Waar vroeger generaties zichzelf door boeken konden ontdekken en herkennen, is volgens van Dis die rol tegenwoordig niet meer uitsluitend het domein van de literatuur. Akyol vindt dat de literatuur en de elitaire bubbel dringend toe is aan vernieuwing. Er wordt volgens de heren over lezen net zoveel gelogen als over seks. Lezen verliest dus misschien zijn dominantie, maar niet zijn belang.

Het festival wordt dit jaar voor de 9e keer georganiseerd, en wordt vanwege Covid-19 geheel online gehouden op www.drongotalenfestival.nl. Een deel van het programma wordt op 2 en 3 oktober gelivestreamd, er worden live webinars gehouden, en verder bied het festival een keur aan van tevoren opgenomen programmaonderdelen. Deelname aan het festival is gratis, registeren kan op www.drongotalenfestval.nl

  1.  
  1. Linguistische vingerafdruk
  2. Spraak technologie en video samenwerking naar de maan
  3. Liplezen levert verbetering van spraakherkenning
  4. Whatsapp gaat goed, Instagram is lastiger

Pagina 2 van 3

  • 1
  • 2
  • 3
  • Login