Je leest:

Of mice and men, en nog meer beesten

Of mice and men, en nog meer beesten

Auteur: | 1 september 2005

Door de genomen van andere organismen te vergelijken met ons eigen genoom kunnen we belangrijke plekken opsporen die in het humane genoom aanwezig zijn.

Het zal niemand zijn ontgaan, dat enkele jaren geleden (2001) met veel bombarie de volledige code van ons genetisch materiaal – het humane genoom – werd gepresenteerd. Dit werd gezien als een mijlpaal voor de mensheid, want hiermee zouden we een stuk dichter bij een beter begrip van het leven komen. Ook het opsporen en behandelen van een grote variëteit aan ziektes zou makkelijker worden.

We zijn nu 4 jaar verder, maar moeten eigenlijk tot de conclusie komen dat we nog steeds maar een beperkt begrip hebben van de inhoud van het humane genoom. Toch komen we stukje bij beetje meer te weten over ons genoom. Door de genomen van andere organismen te vergelijken met ons eigen genoom kunnen we belangrijke plekken opsporen die in het humane genoom aanwezig zijn.

De complexiteit van een genoom

Je zou kunnen denken dat, nu we de hele codering voor alle bouwstenen van de mens kennen, het niet zo moeilijk meer moet zijn om uit te zoeken hoe een organisme ontstaat uit een enkele eicel en spermacel en wat er mis gaat bij (erfelijke) ziektes. Niets is minder waar. Het komt er op neer dat we door al de nieuwe informatie die beschikbaar is gekomen met de humane genoom sequentie eigenlijk tot de conclusie moeten komen dat we veel minder weten dan we dachten.

De voorkant van Nature van deze week waarin het in kaart brengen van het genoom van de Chimpansee Pan troglodytes staat beschreven. klik op de afbeelding voor een grotere versie

Het humane genoom bestaat uit lange DNA ketens van in totaal ongeveer drie miljard letters, waarbij het genetisch alfabet uit slechts vier letters bestaat, de basen A (adenine), G (guanine), C (cytosine) en T (thymidine). Sinds de jaren ’50 van de vorige eeuw weten we ook dat eiwitten gecodeerd worden door reeksen van drie opeenvolgende letters en kennen we ook de codes die aangeven waar de codering van een eiwit start en stopt. Gewapend met deze kennis kunnen we nu redelijk goed voorspellen waar in het humane genoom de plekken zitten die coderen voor eiwitten. Dit coderende DNA noemen we de genen.

Tot verrassing van menigeen bleek de mens niet echt veel meer – schattingen lopen uiteen van 25.000 tot 40.000 – genen te bevatten dan een simpel organisme zoals een wormpje (20.000 genen) of een fruitvlieg (15.000 genen ). De complexiteit van een organisme lijkt dus niet direct gereflecteerd in de complexiteit van een genoom. Of toch wel? Het aantal genen verschilt dan misschien niet dramatisch, de grootte van het totale genoom, dus inclusief de stukken die niet lijken te coderen voor eiwitten, doet dat wel. Het genoom van de rondworm Caenorhabdites elegans is ‘slechts’ 100 miljoen letters groot, terwijl dat van de mens drie miljard letters telt. Ongeveer 30 keer zo groot dus, maar met slechts anderhalf keer zoveel genen. Slechts ongeveer 1.5% van alle letters in het humane genoom lijkt op het eerste gezicht informatief te zijn en voor eiwitten te coderen.

Wat is dan de functie van de resterende letters? Is dit allemaal ‘junk’ (ofwel ‘rotzooi’) DNA, zoals het in het verleden vaak is aangeduid? Of ligt er toch nog veel informatie in verscholen waarvan we de functie nog niet kennen, maar die mogelijk wel zou kunnen bijdragen aan de complexiteit van de mens? En hoe komen we er nu achter welke stukken van de resterende 98.5 % van het DNA een biologische betekenis hebben?

Het genoom van chimp en mens komt voor 96 procent overeen. Toch zijn wij in een heleboel opzichten best heel anders. Zouden wetenschappers al die verschillen – bijvoorbeeld schedelvorm – terug kunnen vinden in het DNA de komende tijd?

Vergelijken

Onder het motto ‘kijk en vergelijk’ valt er veel te leren. Wetenschappers hebben niet alleen het genoom van de mens in kaart gebracht. Ook die van de muis, de rat, diverse planten zoals bijvoorbeeld rijst, maar ook ‘simpelere’ organismen zoals gist, de rondworm, en de fruitvlieg zijn inmiddels ontcijferd. Momenteel lopen nog veel projecten om het genoom van diverse organismen in kaart te brengen, zoals bijvoorbeeld van een koe, varken, hond, maar ook de kangoeroe en de zebravis mogen zich in dit rijtje voegen.

Een aantal van deze organismen brengt een economisch belang met zich mee, andere organismen zijn puur voor fundamenteel onderzoek inbegrepen (bijvoorbeeld rat, muis en zebravis), of zelfs enkel en alleen uit vergelijkings-oogpunt, zoals dat van de Japanse kogelvis Fugu rubridipes. De kogelvis – in Japan een delicatesse – plant zich niet voort in laboratoria. Hij is puur gekozen omdat hij een klein genoom heeft dat dus redelijk gemakkelijk in kaart te brengen is en toch alle informatie bevat voor het ontstaan van een complex organisme.

Wat kunnen we van vergelijken leren? Als we ten eerste organismen met elkaar vergelijken, dan kunnen we concluderen dat de mens tot een bepaald niveau zeer sterk op andere organismen lijkt. Zo hebben muizen net als de mens ogen en oren om te zien, hebben ze vier ledematen, planten ze zich geslachtelijk voort, beschikken ze over de mogelijkheid om te leren, et cetera. Zebravissen hebben net als wij een hart dat bloed rondpompt. Ook beschikken ze over een zenuwstelsel dat spieren aanstuurt waardoor ze kunnen bewegen. Evolutionair zijn deze structuren verwant, hetgeen betekent dat ze waarschijnlijk slechts één keer zijn ontstaan en vervolgens in iedere afstammeling op een eigen manier verder zijn ontwikkeld. Als twee structuren evolutionair verwant zijn noemen we dat homologe structuren.

Zulke homologe structuren zijn op talloze niveaus te vinden, van orgaan tot cel tot molecuul, maar ook in het erfelijk materiaal, het genoom. Alle informatie voor het vormen van bovengenoemde structuren ligt immers gecodeerd in het genoom van een organisme. Zowel een muis als een mens heeft ogen en dus verwachten we zowel in het genoom van de muis als van de mens de codering terug te vinden voor het vormen en functioneren van een oog. De truc is dan ook om homologe stukken in het genoom van verschillende organismen te herkennen. Dit is één van de vraagstukken waar het relatief nieuwe vakgebied van de bioinformatica zich mee bezighoudt.

Voetafdruk

Met behulp van krachtige computers en slimme algorithmen (wiskundige formules) en programma’s wordt geprobeerd het complete genoom van de mens naast dat van bijvoorbeeld de muis te leggen. Hierbij wordt stukje voor stukje gekeken welk stukje humaan genoom het meest lijkt op dat van een stukje muis. Er is veel veranderd sinds de tijd dat de mens en de muis vertegenwoordigd waren in een gemeenschappelijke voorouder, ongeveer 60 miljoen jaar geleden. Stukken genoom zijn verdubbeld of juist verdwenen en grote en kleine fragmenten zijn door elkaar gehusseld.

Desalniettemin is 40% van het humane genoom nog steeds goed terug te vinden in de muis! Dit betekent echter niet automatisch dat deze 40% ook een biologische functie heeft. Door nu het genoom van de mens te vergelijken met dat van andere zoogdieren zoals de hond, koe, muis, en rat kun je gemeenschappelijke elementen terugvinden die naar alle waarschijnlijkheid een biologische functie hebben. Hierbij geldt het motto: als het belangrijk is, dan zal de evolutie er voor zorgen dat het behouden blijft. Deze benadering noemen we phylogenetic footprinting: de voetafdruk van een functioneel kenmerk blijft herkenbaar in de genomen van organismen die vele miljoenen jaren geleden uit een gemeenschappelijke voorouder zijn ontstaan en sindsdien onafhankelijk verder zijn ontwikkeld.

Er zitten echter nadelen aan deze benadering. Doordat je zo sterk filtert en nog maar een klein geconserveerd stukje genoom overhoudt kun je een hoop functionele eigenschappen missen. Zo kunnen bijvoorbeeld geen primaat- of knaagdierspecifieke elementen teruggevonden worden omdat het zoekproces gebaseerd is op overeenkomsten tussen niet verwante diersoorten. En als we alleen nauw verwante organismen met elkaar vergelijken hebben we het probleem dat er nog te weinig verschil in de genoomsequenties is opgetreden om functionele elementen te onderscheiden van nog niet geëvolueerde niet-funtionele elementen. Verder blijkt het zeer lastig om kleine elementen, korte functionele stukjes DNA, betrouwbaar terug te vinden. Korte combinaties van bijvoorbeeld 6 DNA letters kunnen al een belangrijke functie hebben, maar een dergelijke volgorde kan per toeval ook al snel voorkomen (1 maal per 4 × 4 × 4 x 4 × 4 × 4 = 4096 baseparen = meer dan 700.000 keer in het hele genoom!). En het zijn nu juist deze korte stukjes code die belangrijk blijken te zijn voor het fijnreguleren van de genomische functies, zoals het aan- en uitzetten van een gen.

Een voorbeeld van zo’n kort functioneel stukje DNA is het DNA dat codeert voor trancriptiefactoren. Transcriptiefactoren regelen bijvoorbeeld de plaats en het moment waarop specifieke delen van het genoom worden afgelezen en eiwitten worden gesynthetiseerd. Deze factoren binden specifiek aan stukjes van het genoom die vaak niet langer zijn dan 6 tot 10 basen, waarbij de stukken ernaast meestal niet van belang zijn. Het terugvinden van dit soort korte geconserveerde stukjes valt niet mee, zelfs niet met de krachtigste computers die beschikbaar zijn.

Figuur 1 Fylogenetische boom met illustraties van apensoorten. In deze boom is de relatie en afstamming (in miljoenen jaren) van verschillende primaten – die gebruikt zijn in de phylogenetic shadowing benadering – af te lezen. klik op de afbeelding voor een grotere versie

Schaduwen

Recent is er een andere techniek ontwikkeld die dit soort problemen omzeilt: phylogenetic shadowing. Bij deze benadering wordt gebruik gemaakt van genoominformatie van organismen die nauw verwant zijn, zoals bijvoorbeeld verschillende apensoorten en de mens (zie figuur 1). Aangezien deze soorten nog maar recent opgesplitst zijn, lijken de genomen nog zeer sterk op elkaar. Met andere woorden ze zijn een betrouwbare ‘schaduw’ van het origineel. Zonder veel moeite kan meer dan 95% van deze genomen naast elkaar gelegd worden.

Door middel van een paarsgewijze vergelijking is het in dit soort situaties echter niet meer mogelijk om functionele elementen te herkennen, omdat de genoom sequentie zeer sterk op elkaar lijkt en alles eigenlijk een functie lijkt te hebben. Per 100 DNA letters zijn er gemiddeld minder dan 5 veranderingen opgetreden sinds de soorten opgesplitst zijn. Worden echter meerdere soorten toegevoegd in de vergelijking, dan kunnen er posities en langere elementen in het humane genoom herkend worden, die in alle apensoorten hetzelfde zijn, terwijl er ook stukken zullen zijn, waar er in één of meerdere apensoorten een verandering in de code is opgetreden. Onder het mom van ‘wat veranderd mag worden, zal wel niet belangrijk zijn’, kunnen op deze manier alsnog functionele elementen herkend worden, inclusief de zeer korte elementen.

Figuur 2 Schematische weergave van de mate van conservering (hoogte van de blauwe curve) in tien primaten over een gebied van ongeveer 700 baseparen, welke een micoRNA gen bevat. klik op de afbeelding voor een grotere versie

MicroRNA

We hebben laatstgenoemde methode toegepast op genomische gebieden waar leden van een nieuwe categorie genen, de zogenaamde microRNA’s, liggen gecodeerd. Deze microRNA’s, zijn slechts enige jaren geleden ontdekt, maar ze blijken nu al een hele centrale rol te spelen met betrekking tot een heleboel (ontwikkelings-)biologische processen. Hoewel de precieze werking van deze moleculen nog grotendeels onbekend is, lijken ze voor een belangrijke fijnregulering te zorgen tussen het moment dat mRNA’s – de matrijs om eiwitten te maken – worden afgelezen van het genoom en voordat deze vertaald worden in eiwitten.

MicroRNA’s coderen niet voor bouwstenen, maar zijn functioneel als korte stukjes vertaald DNA, het mRNA. Het werkzame deel van de microRNA’s is slechts ongeveer 25 lettertjes lang en reguleert andere genen door speciek aan het mRNA te binden. Hierdoor wordt het mRNA afgebroken en stopt de eiwitsynthese of wordt de eiwitsynthese geremd. Hoewel er steeds meer duidelijk wordt met betrekking tot de biochemische werking van microRNA’s, blijft het nog onduidelijk hoe de expressie en stabiliteit van deze genen zelf gereguleerd wordt. Wij hebben de ‘phylogenetic shadowing’ benadering gebruikt om meer te leren over de genomische eigenschappen van microRNA genen en hun potentiele regulerende rol.

Door de DNA sequentie van meer dan 100 van deze bekende microRNA’s in kaart te brengen in tien apensoorten en deze met elkaar te vergelijken, bleek opmerkelijk genoeg dat er buiten de microRNA sequentie zelf, er eigenlijk geen elementen konden worden ontdekt die sterk geconserveerd waren en dus mogelijk een biologische functie zouden kunnen hebben, zoals bijvoorbeeld voor het aan- en uitzetten van de genen. Sterker nog, de conservering direct buiten de microRNA sequentie bleek opvallend laag. Aangezien dit een unieke eigenschap blijkt te zijn voor een genomisch element (de meeste functionele genomische elementen zijn geconserveerd over vele langere stukken) kun je dit ‘profiel’ gebruiken voor het opsporen van nieuwe microRNA’s!

En inderdaad, door complete muizen en humane genomen naast elkaar te leggen en te zoeken naar geconserveerde stukjes ter grootte van een microRNA, die direct geflankeerd werden door ongeconserveerde stukken DNA, zijn we er in geslaagd vele nieuwe microRNA’s te voorspelen. Na vele analyses en experimentele controles is het inmiddels gelukt om de code van 250 nieuwe microRNA’s te beschrijven zodat het totaal verdubbelt is van de bestaande 250 naar minimaal 500 microRNA codes*.

Figuur 3 Ook tussen de mens en muis is het karakteristieke conserverings patroon terug te vinden, in dit geval voor het gen mir-144. Opvallend genoeg lijkt er in hetzelfde gebied een tweede karakteristieke piek van sterke conservering met daarbuiten veel minder conservering voor te komen. Experimentele bevestiging van deze microRNA kandidaat (cand919) door middel van een zogeheten ‘Northern blot’ analyse (rechter deel van de figuur) bevestigt het vermoeden dat het hier om een nieuwe microRNA gaat. klik op de afbeelding voor een grotere versie

Wederom illustreert dit werk dat we nog lang niet alle geheimen van een genoom kennen en dat iedere keer dat we meer te weten lijken te komen, we toch weer moeten concluderen dat we toch minder wisten dan we dachten, want wat is de functie van al deze 500 microRNA’s? En hoe werken ze? Hoe worden ze gereguleerd? Zijn dit ze allemaal? Zijn er nog andere families van genen die we over het hoofd zien?

  • Een gedetaileerde beschrijving van dit werk is te vinden in: Berezikov, E., Guryev, V., Belt, J. v.d., Wienholds, E., Plasterk, R.H.A, and Cuppen, E. (2005). Phylogenetic Shadowing and Computational Identification of Human microRNA Genes. Cell, 120:21-24.

Zie ook:

Voor vragen of opmerkingen n.a.v. dit artikel kunt u mailen met:

Bezoek de website van het <A HREF=“http://www.nibi.nl”OnMouseOut=“window.status=”;return true"OnMouseOver=“window.status=”return true">NIBI

Dit artikel is een publicatie van Nederlands Instituut voor Biologie (NIBI).
© Nederlands Instituut voor Biologie (NIBI), sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 01 september 2005

Discussieer mee

0

Vragen, opmerkingen of bijdragen over dit artikel of het onderwerp? Neem deel aan de discussie.

NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.