22 June 2018

Hoeveel genen heeft de mens? (2)

We weten niet precies hoeveel genen de mens heeft blogde ik in 2014. Het ging mij toen niet om het exacte aantal genen, maar hoe moeilijk het is om vast te stellen of een stuk DNA ook daadwerkelijk 'een eiwit produceert'. Dan pas kun je het een gen noemen.
Schattingen over de laatste 30 jaar
van het aantal menselijke eiwit-producerende genen
©Nature
In Nature 19 juni 2018 verscheen een artikel New human gene tally reignites debate [1] dat de stand van zaken anno 2018 opmaakt. Dat is 17 jaar na de eerste bekendmaking van het menselijk genoom in 2001.

protein-coding non-coding total genessource
19.90115.77935.680GENCODE/EBI
20.20317.87138.074RefSeq/NCBI
21.30621.85643.162GTEx, CHESS 2018 [2]

 

De nieuwste data (GTEx, CHESS 2018) zijn gebaseerd op messenger RNA (mRNA). Zo selecteer je genen die daadwerkelijk afgelezen worden. Zo filter je 'genen' uit die wat betreft DNA kenmerken op genen lijken, maar toch niet afgelezen worden. Maar dan ben je er nog niet. Ze controleerden of kandidaat genen ook voorkomen bij andere soorten. Dat telde als tweede criteriumof het echte genen zijn [3].

De aantallen geven een behoorlijke toename te zien ten opzichte van de twee andere onderzoeken. Maar ze zijn gebaseerd op computer berekeningen, terwijl de vorige twee handmatig beoordeeld zijn. Daartegenover staat dat het nieuwste onderzoek op een veel groter aantal individuen berust [4]. Wat dat betreft zou het nieuwste onderzoek betrouwbaarder en vollediger moeten zijn. De onderzoekers claimen 5000 nieuwe genen gevonden te hebben.

Wat me opvalt is dat in de pers meestal uitsluitend het aantal eiwit-producerende genen gerapporteerd wordt. Ook in de grafiek van Nature staan alleen eiwit-producerende genen. Waarom? De zgn. niet-coderende genen, die dus alleen RNA produceren zijn net zo belangrijk. Omdat dat RNA belangrijke functies in de cel vervuld. Je komt dan op een totaal van ruim 43.000 genen. Het dubbele!

Dit is een interessant getal, want volgens berekeningen is het maximaal aantal genen dat natuurlijke selectie kan onderhouden ongeveer 40.000 ! [5]. Als deze schatting uit 1972 nog iets waard is, zitten we dus dicht bij ons maximum. Als je daar nog bij optelt dat er ook nog gen regulators zijn (die bijdragen aan het aflezen van genen), dan wordt het helemaal spannend. Een recente schatting van evolutiebioloog Michael Lynch is dat de 'kwaliteit van ons genoom' door schadelijke mutaties iedere generatie met 1% daalt [6]. Dat zou er op kunnen wijzen dat we ons maximum aantal genen al overschreden hebben. Maar er is een tweede factor. Dat is dat we natuurlijke selectie verhinderen haar werk te doen door de steeds verdergaande medische en sociale zorg. De oorspronkelijke publicaties [1,2] houden zich daar echter niet mee bezig. Die houden zich met fundamenteel onderzoek bezig.

Voor de liefhebbers nog een interessant gegeven: de onderzoekers vonden ruim 97.000 nieuwe zgn. splice variants in eiwit-producerende genen. Dat zijn verschillende manieren (alternative splicing) waarop introns [7] uit genen geknipt kunnen worden. Die worden niet als aparte genen geteld want ze zijn van hetzelfde stuk DNA afkomstig. Er bestaat dus tussen mensen een grote variatie hoe er geknipt wordt. Geen mens doet dat op precies dezelfde manier. Het gevolg: we hebben ook niet precies dezelfde eiwitten in ons lichaam. Wat is het effect van al die varianten? Zijn ze nuttig of schadelijk? Als je wilt uitzoeken of een ziekte wordt veroorzaakt door splice varianten dan ben je voorlopig nog niet klaar.

Alsof dat nog niet genoeg is: niet minder dan 30 miljoen stukken DNA worden afgelezen tot RNA moleculen, die waarschijnlijk van geen enkele nut zijn voor ons functioneren. 'Transcriptional noise' noemen de onderzoekers dat. Het moet wel noise zijn, want zoveel genetische informatie kan natuurlijke selectie helemaal niet onderhouden.

Een gek idee dat je miljoenen stukken DNA voor niets afleest. Dat vonden de auteurs ook: the cell is a relatively inefficient machine, transcribing more DNA into RNA than it needs.

Tot slot nog een cliffhanger (creationisten: opgelet!): ze vonden een gen dat de grootste overeenkomst vertoonde met de Chinese hamster en andere knaagdieren en veel minder met alle andere primaten. De mens heeft dus een knaagdier gen. Een evolutionair raadsel [8].

Postscript

25 jun 2018

De uiteindelijke conclusie die de auteurs trekken is dat het mysterieuze gen 102723822 een verontreiniging is [9]. Het is mij niet duidelijk in welk opzicht dit een verontreiniging is: van het biologisch materiaal, bij de verwerking in het lab, bij de verwerking in de computer? En waarom zou dit het enige gen van de 43.162 genen zijn in de verontreiniging? Zou je dan niet méér genen moeten verwachten? 
Ten tweede, en misschien nog belangrijker, als het een verontreiniging is, zou je dan niet 100% (in plaats van 98%) identiteit moeten verwachten met een bestaand gen in het genoom van een of andere soort? Uit hun conclusie blijkt dat het gen kennelijk in geen enkel mens voorkomt, anders noem je het geen verontreiniging. Voor mij is en blijft het een raadsel.



Postscript

20 dec 2018

De traditionele definitie van eiwitproducerende genen is:
  1. ATG methionine start codon
  2.  een Open Reading Frame (ORF) van minimaal 300 nucleotides lang
Maar als je de minimum lengte op 30 nucleotides (komt overeen met 10 amino zuren) en start codons ATG, CTG, TTG or GTG (non-canonical ORFs), dan vind je 224 nieuwe eiwitten. Deze resultaten zijn gevonden in muizen macrophagen, maar het is waarschijnlijk dat ze ook in de mens voorkomen. Het is dus wenselijk dat het menselijk genoom opnieuw onderzocht wordt op 'non-canonical' kleine eiwitten. Des te belangrijker omdat ze een rol spelen in de immuun respons.

Bron: Ruaidhrí Jackson et al (2018) The translation of non-canonical open reading frames controls mucosal immunity, Nature 12 dec 2018


Vorig blog over dit onderwerp


Noten

  1. Cassandra Willyard (2018) New human gene tally reignites debate, Nature News (gratis). Het artikel is ook in de Scientific American verschenen onder dezelfde titel maar zonder de bovenstaande illustratie. Het betekent zo ongeveer: nieuwe score van aantal menselijke genen ontketent discussie. Het Nature artikel is gebaseerd op [2].
  2. Salzberg et al (2018) Thousands of large-scale RNA sequencing experiments yield a comprehensive new human gene list and reveal extensive transcriptional noise (preprint). (Full pdf).
  3. Nog een criterium: het ORF (Open Reading Frame) moest tenminste 180 baseparen of 60 aminozuren lang zijn. Dat betekent dat peptides niet meetellen. Waarom?
  4. "30 different tissues taken from several hundred cadavers". (!) dat zijn menselijke overledenen.
  5. "several researchers pointed out in the early 1970s that the estimated mutational load from deleterious mutations placed an upper limit of approximately 40,000 for the total number of functional loci" (wikipedia)
  6. Michael Lynch (2016) 'Mutation and Human Exceptionalism: Our Future Genetic Load', Genetics, 2016 Mar; 202(3): 869–875 (gratis full text). Citaat: "load of mutations imposed on the human population drags fitness down by  ∼ 100 × 0.01 × 1% = 1% per generation".
  7. Introns: stukken niet coderend DNA in een gen. Ik heb er verschillende blogs over gemaakt: Het intron-mysterie voor gevorderden (2) Evolutie van introns
  8. Kom ik later op terug. 
  9. "It is 98% identical to the closest rodent protein, but only 95% identical to the most similar human protein, ... It would be extraordinary for a human protein to have multiple hits to rodents that are all closer than any match to primates. Thus from evolutionary evidence, this protein is clearly a rodent protein, not a human one." "we concluded that this unplaced scaffold represents contamination in the current human assembly."

17 comments:

  1. Gert

    hartelijk dank

    sluit - wat mij betreft - mooi aan bij die gambit discussie

    leuk dat ze wij meer op chinese hamsters lijken dan andere primaten. Benieuwd wat de schepper, pardon Schepper, daar mee voor had!

    ReplyDelete
  2. Harry, zie postscript. De auteurs noemen het gen een verontreiniging! Omdat het niet zo kan zijn dat een menselijk gen méér verwantschap heeft met knaagdieren dan met primaten! Dat is evolutionair verboden!!!

    ReplyDelete
  3. ja gert,
    had het gezien, maar die vervuiling sluit dus niet uit dat de allerhoogste er geen bedoeling mee had(dat had hij per slot ook met het kwaad in de wereld) geintje.

    serieuzer: missen de onderzoekers met hun tweede criterium voor wat als een gen telt, niet juist mogelijke zeg, unieke, menselijke genen?

    ReplyDelete
  4. Nieuw boek van Theunis Piersma: De ontsnapping van de natuur. Een nieuwe kijk op kennis. 2018.
    Hij gaat hier tekeer tegen 'genetisch determinisme'. Het Y chromosoom bepaalt niet of je man wordt want er zijn uitzonderingen, "Bij zeepaardjes worden mannetjes zwanger". Stel je een vraag aan een DNA lab dan krijg je een DNA antwoord. enz. Misschien nuttig voor een bepaalde groep lezers, maar voor ingewijden is het of fout, of misleidend, of ouwe koek. Interview in Trouw 23 juni 2018.

    ReplyDelete
  5. ook de VK had een interview https://www.volkskrant.nl/wetenschap/-op-dna-gerichte-biologen-hebben-oogkleppen-op-~b1136765/

    het is dat je er zelf over begint, maar daar lees ik dat
    Piersma en Oudman kanoetenkenners zijn:

    ‘Kanoeten verschillen enorm als het gaat om de grootte van hun maag.Die kan bij de een vier keer zo groot zijn als bij de ander. Als ze een grote maag hebben kunnen ze andere schelpensoorten eten dan met een kleine maag. Uit ons onderzoek bleek dat hun voorkeuren voor bepaalde schelpen consistent was en dat hun maagomvang razendsnel kan veranderen. "

    Is dit een van die kenmerkvariaties waar de genotypische gambit van Grafen (en van Gerdien) over gaat!?

    ReplyDelete
  6. Harry, dat laatste weet ik niet. Ik vraag me af: heeft Piersma veel kanoeten moeten killen om die maagomvang te meten? En hoe weet hij dat die maagomvang 'razendsnel' kan veranderen zonder het dier dood te maken? mobile röntgen apparaat in het veld? Maagomvang: en dan bedoelt hij niet een volle maag? maar echt de maag zelf meer massa?
    Misschien is hij interessante dingen op het spoor, maar ik neem aan dat hij een man is door het bezit van een Y-chromosoom en niet door omgevingsfactoren. Anders zou hij geen zonen kunnen krijgen... Anders zou de verhouding man-vrouw bij geboorte nooit 50-50 kunnen zijn...

    ReplyDelete
  7. gert

    het blijft een lastig vak dat van jullie!
    of het nou over kanoeten gaat of over fenotypische gambits!

    misschien interessant voor je, al gaat dit over onze evolutie: https://doi.org/10.1016/j.tree.2018.05.005

    veel over te doen de laatste tijd, over onze evolutie. zie bijv ook: doi: 10.1073/pnas.1721538115. Epub 2018 Apr 23.

    ReplyDelete
  8. Harry, OK, het gaat dus om deze publicaties:

    Did Our Species Evolve in Subdivided Populations across Africa, and Why Does It Matter? July 11, 2018

    Sporadic sampling, not climatic forcing, drives observed early hominin diversity, March 22, 2018.

    eigenlijk zijn beide een kwestie van meer data! en open staan voor nieuwe data! en een tunnelvisie vermijden! als ik het goed zie.

    ReplyDelete
  9. Harry, Monday, July 9, 2018 at 3:36:00 PM GMT+2
    "Is dit een van die kenmerkvariaties waar de genotypische gambit van Grafen (en van Gerdien) over gaat!?"
    Nee, dit heet fenotypische plasticiteit.

    De lezingen van de KNAW-bijeenkomst 'Van Oerknal tot leven' van 7 juni 2018 zijn terug te luisteren via www.knaw.nl/ontstaan-van-leven

    Ik had bij de eerdere comment lijn ook nog iets bijgeschreven. Zal het het er weer bijzetten als ik terug kan vinden wat het was.

    ReplyDelete
  10. Harry, Monday, July 9, 2018 at 3:36:00 PM GMT+2
    "Is dit een van die kenmerkvariaties waar de genotypische gambit van Grafen (en van Gerdien) over gaat!?"
    Grafen heeft het over 'Phenotypic Gambit', niet 'genotypic gambit'. Fenotype en genotype zijn niet hetzelfde; hopelijk weet Harry dat.

    ReplyDelete
  11. Zie http://sandwalk.blogspot.com/2018/07/how-many-protein-coding-genes-in-human.html#more

    ReplyDelete
  12. Gerdien, dank voor de link naar Sandwalk post. Sandwalk verwijst naar een ander artikel dan waar ik in mijn blog naar verwijs. Er blijkt nog een artikel op bioRXiv gepubliceerd te zijn, dat de hierboven behandelde publicatie compleet onderuit haalt. En Sandwalk gooit nog wat olie op het vuur. Spektakel. Verder zijn wel kritische kanttekeningen te maken bij zijn blog (2). Hij weigert om preprint artikelen van commentaar te voorzien voordat ze aan peerreview onderworpen zijn, behalve een prepint die hem goed uitkomt. Waarvan akte. Het Venn diagram is interessant. Hij heeft weinig belangstelling voor non-coding genes (niet belangrijk????)

    Sandwalk blogs:
    1. Nature falls (again) for gene hype
    2. How many protein-coding genes in the human genome?
    3. Disappearing genes: a paper is refuted before it is even published

    ReplyDelete
  13. Gerdien


    ik was even een paar weken weg
    net terug en het is meteen weer raak:


    `Fenotype en genotype zijn niet hetzelfde; hopelijk weet Harry dat.`

    Ik weet dat biologen het verschil maken, en dat Grafen cs het helemaal zonder genen denken te kunnen doen. Maar fenotypische plasticiteit, is weer wat anders. Goed om te weten.

    ReplyDelete
  14. Heeft het lab wellicht een goede reden om het betreffende gen als contaminatie op te vatten? Hebben ze misschien zelf een PCR-product waarmee ze de boel hebben gecontamineerd? KnaagdierDNA is niet zeldzaam in biologische laboratoria. Zou zo maar kunnen. Dat genen zich wel eens niet aan door ons gecreerde stambomen houden, daar weten we wel mee om te gaan. Horizontal gene transfer. Maar kennelijk is dat voor de auteurs in dit geval geen oplossing.

    ReplyDelete
  15. Eppie, bedankt voor het wachten.

    OK, maar blijft de vraag: waarom zou dit het enige gen van de 43.162 genen zijn in de verontreiniging? Zou je dan niet méér genen moeten verwachten?
    Ten tweede, en misschien nog belangrijker, als het een verontreiniging is, zou je dan niet 100% (in plaats van 98%) identiteit moeten verwachten met een bestaand gen in het genoom van een of andere soort?
    Ze schrijven:
    Thus from evolutionary evidence, this protein is clearly a rodent protein, not a human one.
    Maar:
    It is 98% identical to the closest rodent protein, but only 95% identical to the most similar human protein.
    Maar waarom 98% identiek met een rodent protein? Als het een verontreiniging is dan moet het 100% identiek zijn met een rodent. Een verontreiniging evolueert toch niet? Hoe dan?
    Of is hun foutenmarge zo groot???
    Of: een tot nu toe onbekend knaagdiertje waarvan het DNA nog niet in de database zit?

    ReplyDelete
  16. Herziening van de definitie van eiwit-producerende genen. Met als gevolg: nog meer genen! Zie: Postscript 20 dec 2018.

    ReplyDelete

Comments to posts >30 days old are being moderated.
Safari causes problems, please use Firefox or Chrome for adding comments.