Wetenschappers van de Cornell Universiteit te New York en de universiteit van Tel Aviv zijn er in geslaagd om een algoritme te schrijven dat zonder sturing van buitenaf complexe patronen in taal kan detecteren en op basis daarvan de onderliggende grammaticaregels kan construeren.
Het algoritme, Automatic Distillation of Structure (ADIOS) gedoopt, voedt zich met een regulier stuk tekst en gaat vervolgens op zoek naar bijvoorbeeld zinnen die meerdere keren op dezelfde manier achter elkaar voorkomen. Door deze herhalingen met elkaar te vergelijken kan ADIOS leren hoe de grammaticaregels van de taal in kwestie eruitzien. Op basis van deze grammaticaregels kan ADIOS ook betekenisvolle zinnen maken. De methodes van vergelijking en generalisatie die ADIOS gebruikt worden ook door kinderen toegepast tijdens de verwerving van hun moedertaal. ADIOS past daarnaast statistische modellen toe om de aannemelijkheid van de gevonden grammaticaregels te berekenen.
Naast het analyseren van taal is ADIOS ook succesvol toegepast op muzieknotatie, DNA en eiwitten. In het laatste geval kon ADIOS bijvoorbeeld op basis van de aminozuurvolgorde van een eiwit voorspellen wat de functionele eigenschappen van het eiwit zouden zijn. ADIOS zal voor veel verschillende soorten onderzoek gebruikt kunnen worden. Zo kan het algoritme losgelaten worden op het specifieke taalgebruik dat ouders hanteren wanneer zij met hun twee- en driejarige kinderen praten. De analyse van ADIOS zou in dit geval inzicht kunnen verschaffen in het complexe vraagstuk hoe peuters op basis van een beperkte talige invoer van buitenaf toch de volledige moedertaal in alle complexiteit leren begrijpen en toepassen. Een ander mogelijk gevolg van ADIOS zou zijn dat het Chomsky’s theorie van de universele grammatica verwerpt. De universele grammatica probeert het verschijnsel taal te verklaren door er vanuit te gaan dat mensen een aangeboren capaciteit voor taalverwerving en taalgebruik hebben. Deze taalcapaciteit zorgt ervoor dat kinderen niet alle grammaticaregels van een taal zelf hoeven te leren, maar deze regels alleen hoeven te specificeren voor de taal die zij tijdens hun jeugd verwerven. Mocht een algoritme in staat zijn om gelijke resultaten te boeken als mensen, dan zou deze aangeboren capaciteit niet strikt noodzakelijk zijn, met als resultaat een verwerping van de kerngedachte van de universele grammatica.
Een andere interessante toepassing van ADIOS zou zijn om een computer de befaamde Turing-test met succes te laten uitvoeren. Aan deze in 1950 ontwikkelde test doen twee mensen en een taalsprekende computer mee. De eerste proefpersoon dient door vragen te stellen te bepalen wie de computer is en wie de tweede proefpersoon is. De Britse wiskundige en logicus Turing stelde toentertijd dat door middel van deze test er een onderscheid gemaakt kan worden tussen computergegenereerde tekst en menselijke taal. In een beroemde uitspraak van Turing stelde hij dat aan het einde van de 20e eeuw een computer met tien gigabyte werkgeheugen in staat zou zijn om dertig procent van de ondervragers na vijf minuten te laten geloven dat de computer een mens is. Tot nu toe is dit nog niet gelukt: de enige computer die de test heeft gewonnen was de sprekende HAL9000 in Arthur C. Clarke’s beroemde boek ‘2001: A Space Odyssey’ .
- Nieuw algoritme voor het leren van taal
- De Turing-test
- Nieuwe modellen voor supercomputers (kennislink artikel)