Je leest:

Aardbeving of voorbijrijdende trein?

Aardbeving of voorbijrijdende trein?

Een nieuw slim algoritme herkent patronen in seismische data

Auteurs: en | 3 november 2017
Thema: Big Data

Het Koninklijk Nederlands Meteorologisch Instituut (KNMI) is vooral bekend van het weerbericht, maar het KNMI houdt ook de trillingen in de Nederlandse grond in de gaten. De hele dag door stromen grote hoeveelheden seismische data binnen uit heel Nederland. Roel Bertens, student Computer Science aan zowel de Universiteit Utrecht als de University of Florida, is in 2017 gepromoveerd op een algoritme dat het leven makkelijker maakt voor de seismologen die al die data moeten verwerken.

Duizenden springende mensen op een festival kunnen voor stevige trillingen zorgen. Het record is een beving van 1.3 op de schaal van Richter tijdens een editie van Pinkpop in de jaren negentig.

‘Ditto’ is een algoritme dat automatisch een verzameling van karakteristieke patronen vindt in een dataset en er op die manier een soort samenvatting van maakt. De samenvattingen van Ditto kunnen worden gebruikt om datasets te classificeren. “Ditto maakt samenvattingen van seismische datasets die horen bij bepaalde soorten trillingen als aardbevingen, popconcerten of voorbijrijdende treinen”, legt Bertens uit. “Wanneer er nieuwe data binnenkomen ziet het algoritme bij welke samenvatting de nieuwe data het beste past en deelt de data in bij die klasse. Zo weet de seismograaf snel waardoor een trilling kan worden veroorzaakt.”

Algoritmes als grammatica

Het maken van een goed algoritme is volgens Bertens te vergelijken met hoe taal werkt. “Je ontwikkelt een soort grammatica voor de data”, zegt hij. “Die grammatica bepaalt wat voor patronen je algoritme vindt, net zoals de grammatica van het Nederlands bepaalt wat voor woorden en zinnen wij kunnen maken. De keuzes die je maakt bij het ontwikkelen van die grammatica leiden tot andere soorten patronen. Niet beter of slechter, maar anders. En dat is gelijk het moeilijke eraan, dat er oneindig veel mogelijkheden zijn.”

Uitgelicht door de redactie

Biologie
Vietnamees dwerghert blijkt toch niet verdwenen

Klimaatwetenschappen
Je bent niet (veel) sneller thuis nu de snelheid wordt verlaagd

Kom jij nog wel uit je eigen filterbubbel?

Data zonder begin of eind

Voor Ditto leerde Bertens van technieken die worden toegepast bij verwerking van andere soorten data, bijvoorbeeld technieken voor het samenvatten van transactiedata. Bertens: “In een supermarkt bestaan transactiedata bijvoorbeeld uit de producten die klanten bij de kassa afrekenen.” De seismische data van het KNMI komen binnen in een continue stroom, zogenaamde sequentiële data. “De technieken die patronen herkennen in transactiedata heb ik proberen te vertalen naar sequentiële data”, zegt Bertens. “Dat is moeilijk omdat transactiedata een begin en einde hebben, maar sequentiële data niet.”

De zeebeving voor de kust van Japan in 2011 die een verwoestende tsunami veroorzaakte werd ook in Nederland door het KNMI waargenomen.
Roel Bertens is enthousiast over samenwerking met het bedrijfsleven via Commit: “Je ziet snel het resultaat van wat je maakt, net als bij programmeren.”
Roel Bertens

De hoeveelheid data die wereldwijd wordt verzameld en dus ook moet worden geanalyseerd blijft enorm groeien. Het algoritme van Bertens kan die analyse vergemakkelijken. Hij is dan ook blij met het resultaat. “Ik denk dat Ditto wel een stap zet in de richting van het beter aangaan van die grote hoeveelheden data in de wereld.”

Dit artikel werd eerder in een andere vorm gepubliceerd op de “website van Commit”:http://www.commit-nl.nl/news/kernproef-of-aardbeving-hoe-patronen-in-data-dat-onthullen.

Dit artikel is een publicatie van COMMIT/.
© COMMIT/, alle rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 03 november 2017

Discussieer mee

0

Vragen, opmerkingen of bijdragen over dit artikel of het onderwerp? Neem deel aan de discussie.

NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.