Naar de content
Faces of Science
Faces of Science

Chocoladefonteinen en oude wolven

Andrea Janda via Flickr CC BY-NC-ND 2.0

De 25e editie van CLIN, de jaarlijkse conferentie voor taaltechnologen in Nederland en België, vond dit jaar plaats in Antwerpen. Deelnemers mochten dus uitzien naar Belgisch bier en chocoladefonteinen. Althans, dat werd door de organisatie beloofd.

Chocoladefontein?
Vooraf geloofde niemand dat er daadwerkelijk een chocoladefontein te vinden zou zijn. Zoiets buitensporigs valt zelden samen met het serieuze karakter van een conferentie. Daarnaast staat de leider van de organiserende groep, die de chocoladefontein lang van tevoren aankondigde, bekend om zijn droog humoristische uitspraken. Maar toch, het ging hier wel om een jubileumeditie. Wellicht…

Oude wolven
Alle chocolade daargelaten, er stond ter ere van het jubileum nog een ander leuk item op het programma: een terug- en vooruitblik op ons vakgebied. Een roedel ‘oude wolven’ was opgetrommeld om herinneringen op te halen en anekdotes te delen. Hier namen ze goed de tijd voor. De anekdotes gingen vooral over hoe langzaam en gebrekkig computers vroeger waren. Voor mij onbekende termen als ponskaarten werden meermaals gebezigd. Naast me uitte een wat oudere vrouw voortdurend kreten van herkenning. Afijn, ik voelde me tijdens de praatjes soms niet helemaal aangesproken.

Wie weet wat dit is?

Neil Hester via Flickr CC BY-NC 2.0

Rond of plat
Een interessanter onderwerp dat terugkwam, was een strijd die het vakgebied een tijd lang heeft beziggehouden. Een beetje zoals de discussie of de aarde rond of plat is. Taaltechnologie is van origine verbonden met de discipline van taalkunde. In de tijd van de oude wolven werd taaltechnologie veelal toegepast om taalkundige theorieën te bewijzen, of in ieder geval vanuit de taalkundige theorie iets zinvols te doen. In de loop der jaren, gelijktijdig met de groei van het internet, lieten steeds meer onderzoekers de theorie los, en richtte het onderzoek zich meer op het maken van systemen. De nu gangbare discipline is: teksten zonder enige opgelegde structuur aan de computer ‘voeren’, en daar dan automatisch betekenisvolle patronen in vinden. Denk bijvoorbeeld aan Google Translate, dat door grote aantallen gekoppelde zinnen in twee talen ongeëvenaarde resultaten behaalt, hoewel nog steeds voor verbetering vatbaar.

Datagedreven
Hoewel de wetenschappelijke strijd beslecht is in het voordeel van de zogenoemde `datagedreven’ methode, zijn het datagiganten als Google en Facebook die mijlenver voorliggen op wetenschappers in het toepassen van deze methode. Zij beschikken over veel meer data en computerkracht dan wetenschappers. Veel taaltechnologen maken daarom de overstap naar zulke bedrijven.

De conferentie heeft me dus veel bijgebracht over ontwikkelingen in het vakgebied, maar bracht ook de ietwat verontrustende boodschap over dat de grote projecten niet op de universiteit, maar bij bedrijven plaatsvinden. Voor de wetenschappers blijven de dingen over waar bedrijven geen brood in zien: het analyseren van menselijke communicatie, of het maken van een vertaalsysteem van het Fries naar het Nederlands.

Dit alles mocht de pret niet drukken: de chocoladefontein was daadwerkelijk aanwezig!

ReactiesReageer