Het aantal genen in verschillende organismes, Genome Biology |
We weten niet hoeveel genen de mens heeft. En ik bedoel daar niet mee dat historisch gezien de schattingen van het aantal genen dat de mens heeft nogal aan de hoge kant zaten (100.000 genen). Dat waren inderdaad schattingen, berekeningen. Toen het menselijke genoom bekend werd, daalde het aantal genen tot ongeveer 30.000 en 25.000 [5]. Maar dát bedoel ik niet.
Wat ik ook niet bedoel is dat we nu weten dat genen opgedeeld zijn in introns en exons en de exons op verschillende manieren gecombineerd kunnen worden tot een eiwit (zgn. alternative splicing) waardoor een gen meerdere eiwitten kan produceren. Ook dat bedoel ik niet.
Wat ik ook niet bedoel is dat er ook zgn 'niet-coderende' genen zijn. Dat zijn genen die niet voor eiwitten coderen, maar voor functioneel RNA. Er zijn nu honderden van dat soort genen gevonden. Maar dat bedoel ik ook niet.
Ik bedoel ook niet de controverse over het zgn. 'junk'-dna. We weten inderdaad nog lang niet alles over de functie van heel veel DNA dat buiten de bekende genen ligt. En er zijn ontzettend veel pseudo-genen. En er is veel DNA waarvan we zeggen dat het zelfs potentieel geen genen kunnen zijn. Maar, dat bedoel ik ook niet.
Ik bedoel: zélfs als we ons beperken tot eiwitproducerende genen, dan nóg weten we niet precies hoeveel dat er zijn. Maar, eiwitproducerende genen zijn toch makkelijk vast te stellen? Een gen produceert een eiwit of niet. Dat is toch al lang tot op het laatste gen en eiwit vastgesteld? Dat staat toch allemaal in de genomics en proteomics databases? Nee, dat zijn kandidaat genen, of voorspelde genen waarvan een deel nog geverifieerd moet worden. Het aantal gecatalogiseerde genen is uitsluitend gebaseerd op DNA kenmerken zoals start code, en stop code [1]. Dus je weet niet zeker of een gen, een stuk DNA, ook daadwerkelijk een eiwit produceert, ook al ziet het eruit als eiwitproducerend DNA. Het zijn mogelijke genen (putative genes in het Engels). Als je het zeker wilt weten moet je eiwitten rechtstreeks detecteren in cellen en weefsels (eiwitten zijn te herleiden tot eiwitproducerend DNA). En dat heb ik me eigenlijk nooit eerder gerealiseerd. En omdat er vele verschillende celtypes zijn (plm 200 - 400) moeten we in principe alle celtypes testen. In verschillende ontwikkelingsfasen. Een gigantische, zo niet onmogelijke opgave. Bijvoorbeeld: een menselijk orgaan dat de meeste mensen niet hebben: de placenta. Zelfs vrouwen hebben dat orgaan maar tijdelijk in bezit. De placenta produceert eiwitten die een normaal (niet zwanger) mens niet produceert [2].
Het is gecompliceerder dan dat: eiwitten kunnen in lage concentraties voorkomen zodat ze moeilijk detecteerbaar zijn. Of slechts in één of een paar celtypes voorkomen. Of snel afgebroken worden (kortlevend zijn), of alleen op bepaalde tijdstippen geproduceerd worden. Geen wonder dat er tot nu toe maar van 11.838 genen bewezen is dat ze eiwitten produceren. We hebben er ongeveer 20.000, dus dat is ongeveer de helft bewezen! Ander bronnen zeggen dat we 22.500 genen hebben met een onzekerheidsmarge van 2000!
Zolang je het eiwit niet hebt aangetoond weet je gewoon niet zeker hoeveel eiwitproducerende genen 'de mens' heeft. Zo simpel ligt dat! En: zo moeilijk ligt dat!
Ik schreef 'de mens'. De mens is geen gestandaardiseerd wezen. We komen niet uit een fabriek. Er bestaat genetische variatie. Ook in genen. En dan heb ik het over gezonde mensen. Genen hebben variaties (deleties en inserties) in het gedeelte dat voor eiwitten codeert (exons). Het probleem is: wanneer spreek je over een gen-variant en wanneer is het een nieuw gen? Het kan dus dat sommige mensen genen hebben die andere mensen niet hebben. Tot zover het aantal genen van 'de mens'.
Wat is het belang van dit alles? Ten eerste: het wetenschappelijk belang, o.a. evolutie (daar komt ik vast nog wel eens op terug!), en het medische aspect. Als iemand een erfelijke ziekte heeft wil men graag weten of het stuk DNA dat de patient mist de oorzaak is van de ziekte, of dat het een gen is dat bij gezonde mensen géén eiwit produceert. Met andere woorden: je wilt graag weten hoeveel genen een 'normaal mens' heeft. Nog een ander medisch aspect is dat mensen verschillend kunnen reageren op geneesmiddelen afhankelijk van het bezitten van enzym varianten die op hun beurt berusten op afwijkende genen [4]. En voor religieuze mensen geldt (neem ik aan) dat ze graag exact willen weten welke bona fide genen God de mens gegeven heeft toen Hij de mens schiep. En Intelligent Design aanhangers willen graag weten welke en hoeveel genen 'intelligent designed' zijn [3].
Literatuur
- 'The shrinking human protein coding complement: are there now fewer than 20,000 genes?' pdf downloaded from biorxiv.org on January 31, 2014: "Fifteen of these new genes had evidence for expression in placenta, suggesting that large-scale proteomics experiments performed on specific tissues may detect gene products with restricted expression."
- Differentiating Protein-Coding and Noncoding RNA: Challenges and Ambiguities PLoS Comput Biol 4(11): 2008
- Distinguishing protein-coding and noncoding genes in the human genome, PNAS 2007 Dit artikel beklemtoond dat het misschien wel onmogelijk is om te bewijzen dat een potentieel eiwitproducerend gen het niet is.
- Between a chicken and a grape: estimating the number of human genes Genome Biology, 2010.
22,619 human protein-coding genes
22,333 protein-coding genes.
Currently, the average number of genes listed in the human gene catalogs appears to be somewhere around 22,500, with an uncertainty of around 2,000 genes (!). Different humans have different gene count.
Noten
- De definitie van een eiwitproducerend gen: An open reading frame (ORF) is a potentially translatable sequence that consists of a string of in-frame sense codons beginning with a start codon and ending with a stop codon.
- De man heeft ook het gen voor unieke placenta eiwitten (waarschijnlijk), het komt natuurlijk nooit tot expressie.
- Intelligent Design: Michael Behe, maar vooral in dit verband William Dembski die meende te kunnen vast stellen of een gen 'intelligent designed' was en wat het informatiegehalte van het menselijke genoom is. Dan moet je in de eerste plaats exact weten hoeveel genen 'de mens' heeft. Zie mijn review.
- Het vakgebied heet: Farmacogenetica of Pharmacogenetics.Toegevoegd 26 maart 2014.
- Leuk weetje: de Loblolly den die in Amerika voorkomt heeft minstens 50.000 genen! 'Loblolly takes genome size prize', Nature 27 March 2014 Toegevoegd 27 maart 2014.
Vorige blogs
ENCODE project is een mijlpaal, maar 80% functioneel dna roept vragen op 18 september 2012. Hierin bereken ik hoeveel menselijk DNA functioneel is.
Postscript
[5 nov 2015]"Then there are the missing proteins. Roughly 15% of human genes that should encode proteins have had no associated protein identified — that means there are nearly 3,000 missing proteins. In some cases, this may be because they occur in small amounts or in only tiny areas of tissue. Without a complete catalogue of proteins, the overall picture of human proteomics remains fuzzy."
bron: Neil Savage: " Proteomics: High-protein research" , Nature 05 November 2015.
" The reduction of the proportion of missing proteins in the human proteome from 33 to 18% (or 15%) over the last 3 years shows the clear progress "
bron: " Quest for Missing Proteins: Update 2015 on Chromosome-Centric Human Proteome Project" , Journal of Proteome Res., 2015.
Dus: in 2015 missen er nog steeds 15% eiwitten. Misschien zijn ze belangrijk, misschien niet.
Ik vind de term "eiwitproducerend" strikt genomen onjuist. Het DNA, het 'gen' is geen ACTIEF principe. Het DNA codeert voor een bepaalde sequentie maar is zelf niet actief in de eiwitPRODUCTIE. Dat doet de cel en heeft daarbij de mallen van het genoom nodig. Met andere woorden: het DNA is (onmisbaar) voorwaardelijk voor de eiwitproductie maar niet causaal!
ReplyDeleteTen tweede. Moeders 'bezitten' geen placenta. De placenta behoort ook genetisch het kind toe en is voor de moeder lichaamsvreemd. Het is dus geen 'moederkoek' maar een 'kinderkoek'.
Jaap van der Wal MD PhD, embryolooog. www.embryo.nl, jaapvanderwal@embryo.nl
Jaap van der Wal, je hebt gelijk dat "eiwitproducerend" strikt genomen onjuist is. DNA is inderdaad geen actief principe in die zin. 'Eiwitproducerend' is een losse vertaling van het Engelse 'protein coding DNA'. In noot 1 geef ik De definitie van een eiwitproducerend gen. Dat zou misverstanden moeten uitsluiten.
ReplyDeleteJe zegt "het DNA is (onmisbaar) voorwaardelijk voor de eiwitproductie maar niet causaal!"
Ik zou zeggen dat er een 1 op 1 oorzakelijk verband is tussen de basevolgorde in het DNA en de aminozuurvolgorde in het eiwit.
Je schrijft: "De placenta behoort ook genetisch het kind toe".
Maar ik lees hier:
Morphology: the placenta is the most important accessory fetal structure and brings the fetal and maternal circulations into close relationship. Morphologically, it is partly of fetal origin (the trophoblast) and partly of maternal origin (arising from the transformation of the uterine mucosa)
bron:
http://discovery.lifemapsc.com/library/review-of-medical-embryology/chapter-38-the-placenta-general-discussion
Placenta is dus ten dele van de moeder en ten dele van het embryo afkomstig.
En het genoom van het embryo is natuurlijk 50% genetisch van de moeder afkomstig.
Ik zie dat je eigenaar bent van het unieke domein www.embryo.nl ! daar was je vroeg bij, want ik neem aan het een domeinnaam is die wel meer mensen zouden willen bezitten!
Ik ga nog eens verder rondkijken op je website!
hartelijke groet, Gert