18 september 2012

ENCODE project is een mijlpaal, maar 80% functioneel dna roept vragen op

Op 20 september 1952 werd door Alfred Hershey en Martha Chase aangetoond dat DNA en niet eiwit de drager van de erfelijke informatie is: dat is exact 60 jaar geleden! Nog maar 60 jaar!

2012
Het ENCODE project (Encyclopedia of DNA Elements) is een mijlpaal in het genetisch onderzoek van de mens. Genetica begon met Mendel en met name met de herontdekking van Mendel in 1900. Ongeveer 50 jaar later werd de chemische structuurformule van DNA 'ontdekt' (of beredeneerd? of voorspeld?) door James Watson en Francis Crick (1953), en nog eens 50 jaar later (2001) werd de complete basevolgorde van het menselijke dna vastgesteld (Human Genome Project). In 2012, dat is maar 11 jaar later werd vastgesteld welke delen van het menselijk dna 'actief' zijn (ENCODE). 'Actief' is iets anders dan het aantal genen dat de mens heeft.

Hoeveel genen heeft de mens?
2001
In 1999 dus 2 jaar voor de afronding van het HGP, schatte de bekende evolutie-bioloog John Maynard Smith het aantal genen van de mens op 60.000 tot 80.000 [1]. Als het om eiwit-coderende genen gaat is dit in onze ogen belachelijk hoog, maar het was toen de gangbare opvatting [2]. 'Genen' waren toen vrijwel synoniem met 'eiwit coderend dna'. Er waren zelfs nog hogere schattingen. Eén jaar vóór de afronding van het Human Genome Project werd het aantal genen teruggebracht van 120.000 naar 81.000. Midden jaren 80 stond in verscheidene handboeken het berekend aantal van 100.000 genen [3]. In het boek dat Nature ter gelegenheid van de afronding van het Human Genome Project in 2001 publiceerde wordt er gesproken over 30.000 - 40.000 genen [3]. Enigzins teleurgesteld werd er bij gezegd: only about twice as many as in worm or fly! Let op de grote spreiding! Het waren schattingen (predictions). Dit is toch best opvallend als je bedenkt dat de dna sequence bekend was. Uit die tijd dateert ook het beroemde percentage van 1,5% van het menselijke dna dat codeert voor eiwitten.

'Niet-coderend' dna
In 2001 was er niet veel aandacht voor niet-coderende genen, d.w.z. genen die alleen RNA produceren en geen eiwit. De schatting was dat er 'duizenden' niet-coderende RNAs zouden bestaan, maar met zekerheid slechts enkele honderden [3:p.105).

ENCODE: hoeveel genen heeft de mens?
Volgens ENCODE [4]:

20.687 protein-coderende genen
18.441 RNA-genen
_____________________
39.128 genen totaal

Grappig dat we met dit aantal weer terug zijn op het peil van 2001! En dan heb ik nog niet meegerekend dat eiwit-coderende genen gemiddeld ongeveer 4 verschillende eiwitten produceren (tgv alternative splicing) waardoor er plm. 80.000 eiwitten worden geproduceerd, waardoor we terug zijn bij de schattingen van eind jaren 90. Zou je kunnen zeggen. Wat zeker opvalt is dat het aantal RNA-genen enorm omhooggeschoten is ten opzichte van 10 jaar geleden. Bijna net zoveel als 'gewone' genen. En dan heb ik nog niet genoemd 11.224 pseudogenen: 'dode' genen waarvan een deel soms in sommige celtypen in sommige individuen afgelezen wordt. Die tel ik even niet mee.

Hoeveel dna is functioneel?
De controversiële claim van ENCODE is dat 80% van het menselijk dna 'biochemisch functioneel' is. Maar hun definitie van 'functioneel' is heel ruim:
"Operationally, we define a functional element as a discrete genome segment that encodes a defined product (for example, protein or non-coding RNA) or displays a reproducible biochemical signature (for example, protein binding, or a specific chromatin structure)." [4]
Vrij vertaald: 80% van het menselijk dna 'doet iets'. Dit is een veel ruimere defintie dan gebruikelijk in de (evolutie)biologie. In de evolutie betekent 'functioneel' dat iets survival value heeft (fitness). Maar de taak die ENCODE zichzelf gesteld heeft is alle activiteit van alle dna vast te stellen in dat is inclusief modificaties van histonen die aan dna vastzitten. En ook als het dna maar in één celtype actief is. Zo heeft ENCODE de activiteit in 147 verschillende celtypes getest. Dat is nieuw. Het gaat om de totaliteit. Wil je een compleet overzicht dan moet je alles meenemen. Zo is die 80% ontstaan.

Nog maar een paar jaar geleden stond in een standaardwerk [5] dat van een typisch genome één derde (33%) wordt afgelezen (dat heet: transcriptome omdat het op transcriptie gebaseerd is, dat is de productie van RNA). Volgens ENCODE is dat nu 62%. De rest is betrokken bij histonen, en andere eiwitten die aan dna binden. Van die 62% is de meerderheid intronen, want die worden ook afgelezen, maar daarna er uit geknipt (splicing).

Maximum aantal genen?
Zou het menselijk genoom echt 100.000 'genen' kunnen hebben? [10] Of een miljoen??? Volgens Manfred Eigen [6] kan een organisme niet onbeperkt veel genen hebben omdat die informatie iedere generatie betrouwbaar gecopieerd moet worden en mutaties zullen zich op den duur ophopen zodat de originele informatie verloren zal gegaan. Anders gezegd: het aantal informatie dragende bases heeft een maximum. Dat wordt bepaald door de mutatiefrequentie. De maximale mutatiefrequentie is het omgekeerde (reciprocal) van het aantal informatie dragende bases. Dus heb je een mutatiefrequentie van 1 op de miljoen dan zal het maximum aantal informatieve bases 1 miljoen zijn.

We moeten dus genen omrekenen in bases. Schattingen in de literatuur voor het totaal aantal relevante bases (exons) van de mens is 30 miljoen bases (30 Mb) verdeeld over 180.000 exons [7]. Als je het aantal RNA genen erbij optelt zou je grofweg op 60 miljoen bases komen (schatting!). Verder hebben we nog dna dat betrokken is in gen regulatie. Volgens ENCODE [8] zou dat tenminste zo veel bases in beslag nemen als eiwit-coderende genen, dus tenminste nog eens 30 miljoen. Totaal: tenminste 90 miljoen bases. Uit de literatuur [9] blijkt dat de mutatiefrequentie in de orde van 1 op de 100 miljoen is. De menselijke soort zou dus net zoveel significant dna hebben dat hij kan onderhouden. Te mooi om waar te zijn? Gezien het feit dat het berekeningen op de achterkant van een bierviltje gemaakt zijn, lijkt dat inderdaad te mooi om waar te zijn!

Postscript  
(19 – 23 sept):

Als we die 80% functioneel dna omrekenen naar bases: 80% van 3,2 miljard bases =  2,56 miljard bases, dan is niet in te zien hoe die bases onderhouden kunnen worden als er een mutatiefrequentie is van 1 : 100 miljoen (1 : 10-8) per generatie! Het menselijke genome zou maximaal 100 miljoen bases functioneel dna kunnen bevatten. Dat is 3,1% van het totale dna. ENCODE komt neer op ruim 25x hoger! Daar kom ik zeker nog een keer op terug!

Populatiegeneticus en evolutiebioloog Joe Felsenstein heeft bevestigd dat de error threshold een onafhankelijk argument tegen 80% functioneel dna in het menselijk genome is (hier).

Een onafhankelijke (ruwe) berekening gebaseerd op "very roughly, maybe on the order of about 1000-6000 bases of noncoding regulatory information per 1500 coding bases in a gene" (Sean Eddy):

aantal bases in genen:        20.687 x 1500 = 31.030.500 bases
aantal bases in regulators: 20.687 x 3500 = 72.404.500 bases
totaal:                                                           103.435.000 bases
in het menselijk genome die er toe doen.

Dus 103 miljoen komt heel aardig overeen met mijn berekening gebaseerd op het idee van Manfred Eigen [6] (nl 100 miljoen)!

Postscript 3 Okt 2012
"Mammalian conservation suggests that ~5% of the human genome is conserved due to noncoding and regulatory roles " [11]. Dit is dus méér dan alleen eiwit-coderende genen ("Short noncoding RNAs are as strongly constrained as protein-coding regions") en méér dan de schatting 3,1% hierboven.
Een onafhankelijk manier om het percentage functioneel dna te bepalen is misschien het perc. dna dat in zoogdieren geconserveerd (constrainted, conserved) is?

Noten
  1. John Maynard Smith (1999) The Origins of Life  (p.16).
  2. Mark Ridley (2000) Mendel's Demon meldt 60.000 genen, tabel op p. 82.
  3. Carina Dennis, Richard Gallagher (2001) The Human Genome. Palgrave. p. 19; p.67; p.72; p.110; p.112.
  4. The ENCODE Project Consortium: 'An integrated encyclopedia of DNA elements in the human genome', Nature 57-74 6 sep 2012 (Open Access). "we annotated 8,801 small RNAs and 9,640 long non-coding RNA (lncRNA) loci" dus totaal 18.441 RNA genen.
  5. James Watson et al (2008) Molecular Biology of the Gene (sixth ed.), p.705.
  6. Manfred Eigen (1996) Steps Towards Life, p.20:  "the longer a sequence is, the more accurate its reproduction must be, otherwise errors accumulate in successive generations and the original information is lost".
  7. Targeted Capture and Massively Parallel Sequencing of Twelve Human Exomes.
  8. "raising the possibility that more information in the human genome may be important for gene regulation than for biochemical function." zie: [4].
  9. Joris A. Veltman & Han G. Brunner (2012) De novo mutations in human genetic disease Nature Reviews Genetics 13, 565-575 (August 2012). 
  10. In: Peter Sudbery (1998) Human Molecular Genetics, p. 36 wordt genoemd dat het theoretisch maximum bij de mens 100.000 genen zou zijn gebasserd op o.a. het aantal gemuteerde genen dat tolerabel zou zijn (maar is schatting!).
  11. Lucas D. Ward (2012) Evidence of Abundant Purifying Selection in Humans for Recently Acquired Regulatory Functions, Science 28 September 2012

44 opmerkingen:

nand braam zei

@ Gert

Komt ENCODE als volgt aan 80% biochemisch functioneel DNA??:

20.687 eiwit-coderende genen + 18.441 RNA-genen + 11.224 pseudogenen = 50.352. 20.687 + 18.441= 39.119.

39.119 op een totaal van 50.352 is ca 80% van het totaal.

Je zegt: “Vrij vertaald: 80% van het menselijk dna 'doet iets'. Dit is een veel ruimere defintie dan gebruikelijk in de (evolutie)biologie. In de evolutie betekent 'functioneel' dat iets survival value heeft (fitness). Maar de taak die ENCODE zichzelf gesteld heeft is alle activiteit van alle dna vast te stellen in dat is inclusief modificaties van histonen die aan dna vastzitten. “

Ik ben geen bioloog maar de gebruikelijke definitie in de evolutiebiologie lijkt me typisch een geval van “ tunnelvisie”.

gert korthof zei

Nand, wat ik niet gemeld had was dat het totaal aantal bases in het menselijk genoom 3,2 miljard bases is. Daarom neem ik aan dat die 80% van 3,2 miljard is, dus 2,56 miljard. Dit is vele malen meer dan de 90 miljoen bases waar ik op uit kom.
Als die 2,56 miljard van belang zijn voor de fitness van het individu dan zou een dergelijke hoeveelheid informatie moeilijk of niet intact gehouden kunnen worden in de loop van de menselijke evolutie gezien de mutatiefrequentie. Het probleem dat ik beschreef in mijn blog wordt dus vele malen groter. In feite is 2,56 miljard significante bases niet intact te houden. Dat is het probleem.

"Ik ben geen bioloog maar de gebruikelijke definitie in de evolutiebiologie lijkt me typisch een geval van “ tunnelvisie”."
Dit is een zware beschuldiging van een niet-bioloog aan het adres van alle biologen. Het getuigt van weinig respect!!! (respect: weet je nog?) Je zou op zijn minst je bewering kunnen onderbouwen!

nand braam zei

@ Gert

Laat ik het dan zo zeggen dat ik de benadering van ENCODE, als niet-bioloog nadenkende over dit probleem, realistischer vindt:

De controversiële claim van ENCODE is dat 80% van het menselijk dna 'biochemisch functioneel' is. Maar hun definitie van 'functioneel' is heel ruim:

"Operationally, we define a functional element as a discrete genome segment that encodes a defined product (for example, protein or non-coding RNA) or displays a reproducible biochemical signature (for example, protein binding, or a specific chromatin structure)." [4]

gert korthof zei

Nand, maar wat nu als die biochemische modificaties van dna en histonen die ENOCDE gevonden heeft, geen enkel effect hebben op het fenotype van de drager? op zijn gezondheid? op de evolutionaire fitness (aantal nakomelingen)? dwz evolutionair neutraal zijn?

nand braam zei

@ Gert

Ik heb, denk ik, een heel ander denkkader dan jij als (evolutie)bioloog.

Waarom mag iets niet evolutionair neutraal zijn?. Als iets “displays a reproducible biochemical signature (for example, protein binding, or a specific chromatin structure)”, is het dan niet gewoon ook belangrijk, onafhankelijk of het iets doet met het fenotype etc?

gert korthof zei

Vandaag: woensdag 19 sept:
Ned 2 20:55
Evolutiebioloog Robert Trivers in Labyrint.
Gaat dat zien!

gert korthof zei

Nand:
"... is het dan niet gewoon ook belangrijk, ..."
Het gaat er niet om of het belangrijk is, maar dat de auteurs duidelijk moeten zijn: iets 'functioneel' noemen terwijl je in de verste verte de functie niet kent, is misleidend of tenminste uitermate verwarrend.

gert korthof zei

Interessante conclusie in de ENCODE pilot (2007):

"To our surprise, many functional elements are seemingly unconstrained across mammalian evolution. This suggests the possibility of a large pool of neutral elements that are biologically active but provide no specific benefit to the organism. This pool may serve as a ‘warehouse’ for natural selection, potentially acting as the source of lineage-specific elements and functionally conserved but non-orthologous elements between species."

dat betekent oa dat wat ENOCDE 'biologisch actieve' (dus functionele!) elementen noemt, in feite evolutionair neutraal kunnen zijn!

nand braam zei

@ Gert

Je zegt:” Het menselijke genome zou maximaal 100 miljoen bases functioneel dna kunnen bevatten. Dat is 3,1% van het totale dna. ENCODE komt neer op ruim 25x hoger! Daar kom ik zeker nog een keer op terug!”’

Hoe kan het nu toch zijn dat er zo’n groot verschil zit in de (voorlopige) uitkomst over functioneel DNA?
Ik mag toch aannemen dat ENCODE (ingesteld door de Amerikaanse regering naar ik begrepen heb) bestaat uit gekwalificeerde wetenschappers uit de van belang zijnde wetenschapsgebieden. Zitten er dan geen evolutiebiologen bij ENCODE?

Ik vind het maar vreemd. Als je uit een andere discipline komt, zoals ik, verwacht je toch niet zulke grote discrepanties binnen een ander vakgebied.

Is je laatste post (zie ik net) een begin van een antwoord in deze kwestie?

gert korthof zei

Ja, ENCODE doet goed onderzoek maar hun taalgebruik is ontzettend verwarrend. gedeetelijk komt dit ook omdat het genoom op biochemisch niveau zelf zeer verwarrend is. Maar je hoeft het daarom nog niet verwarrend te omschrijven!!!

In de evolutiebiologie zijn we al gewend aan split genes: introns middenin genen die wel afgelezen worden maar daarna uitgeplitst en afgebroken. en we zijn gewend aan neutrale variatie in base verschillen (Kimura). Maar er worden kennelijk ook vele stukken dna afgelezen (=transcriptie) ver buiten plekken waar een gen ligt. Daarvan zegt ENCODE dus dat ze evolutionair neutraal zijn: ze hebben geen aantoonnare functie (geen eiwit of regulator functie):
"no specific benefit to the organism" = dragen niet bij aan de evolutionaire fitness. Daarom is het zeer verwarrend omdat 'biologically active' te noemen.
ENCODE suggereert dat die stukken dna 'probeersels' zijn van evolutie: doet het iets waar het organisme achteraf baat bij heeft (fitness verhogend) en dan gaat selectie dat bevorderen. Zoiets is aangetoond voor bijv. transposons die heel soms per ongeluk een gunstig effect hadden op het organisme.
Maar we blijven voorlopig met een genoom zitten dat een heleboel activiteiten vertoond waarvan we geen flauw idee hebben waar het goed voor is.

harry pinxteren zei

gert
niet schelden. Alle mensen hebben last van tunnelvisie. Psychologen noemen dat confirmation bias. Geldt ook voor wetenschappers. Dan noemen ze het paradigma. Die zijn zeer hardnekkig zoals je weet. Maar toch bleek er wel degelijk geen ether te bestaan (hoewel..!) en ook bleek ze echt te bewegen..

Trivers is ook een zeer paradigmatische wetenschapper, om zo te zeggen. Dus opletten wat die allemaal zegt: wat voor reden zouden we hebben we eigenlijk om zijn boek wel te geloven, wel te vertrouwen? Legt ie dat uit?

(ik heb hebt dus niet gelezen, en voorlopig zal ik het ook niet lezen, want ik ga eerst het nieuwe boek van G. Church lezen)

gert korthof zei

Harry, hou me op de hoogte over je Church boek, ik lees al een ander boek op dit moment. Over Nand: je moet de voorgeschiedenis weten: hoe vroeg, nee hij eistte, respect, dus vraag ik het ook aan hem. Ik vind tunnelvisie een heel erge beschuldiging en associeer het met rechters die een onschuldige in de gevangenis doen belanden (Lucia de B. etc). Ik vond het erg leuk om Trivers 'life' te zien praten over zaken die hij in zijn boek beschreef: hij is intelligent en weet veel, hij is een bioloog met diepte. Het was een genoegen ook al was het interview maar 10 min. Je hebt iets gezien hoe hij leeft etc. leuk.

gert korthof zei

Op 20 september 1952 werd door Alfred Hershey en Martha Chase aangetoond dat DNA en niet eiwit de drager van de erfelijke informatie is: dat is exqact 60 jaar geleden! Nog maar 60 jaar geleden en nu zitten we te discussieren over de functie van 3,2 miljard bases!!!

Anoniem zei

@Gert : Ben je bekend met Bruce Lipton?
Bruce Lipton: ‘Niet genen, maar onze perceptie creëert ziekte en gezondheid’: http://www.scientias.nl/niet-genen-maar-onze-perceptie-creeert-ziekte-en-gezondheid/70892

Rita

gert korthof zei

Rita, bedankt voor de tip. kende ik niet.

Anoniem zei

@Gert: nou dan kun je met 'm kennismaken op 10 oktober 2012 in het Planetarium in Amsterdam. Hij zegt dat de tijd van het genetisch determinisme voorbij is...
Rita

harry pinxteren zei

ok gert,

dank je voor je samenvatting en toelichting:
biochemische activiteit vs biologische functionaliteit, c.q. fitness (dan wel meer nakomelingen). Dat is toch ueberhaupt de discussie, zou ik zeggen!

Dat boek van Church is onderweg. Ik hoop nu maar dat hij het niet te technisch heeft gemaakt (zoals Koonin, want die kan ik soms niet volgen, maar zijn conclusies des te beter!).

Mijn confirmation bias is dat de titel van Church' boek terecht 'regenesis' is -
neem alleen nog maar dat gebruik van DNA voor data-opslag Niet te geloven: 1 petabyte in 1.5 mg DNA. Dan val je toch van je stoel? Meer dan 1.024 terabytes in 1 mm^3.
Wat een vak! Je merkt wel, ik lijd hier zwaar aan tunnelvisie
:-)

Nou we het daar toch over hebbeb: wat ik me van dat boek van Trivers (er is pas nog zo'n boek verschenen, van Kurzban) afvraag is: hoe redt hij zich uit die naturalistische val? Wat voor goede reden zouden we hebben hem nu wel te geloven, namelijk dat hij ons nu niet misleidt, terwijl misleiding en bedrog zo'n beetje de natuurlijke (hersen)toestand is. Waarom houdt Trivers zichzelf - en ons dus ook- nu niet voor de gek, waarom is zijn boek zelf niet een folly van een fool?

Alvast bedankt voor je wijze weerwoord!

gert korthof zei

Beste Rita,
Het stuk ocver Bruce Lipton die zegt dat genen niets doen is van Caroline Kraaijvanger. Dezelfde Caroline Kraaijvanger heeft ook dit artikel geschreven: "Groot deel van ons junk-DNA heeft belangrijke functie: "Ze ontdekten dat het grootste deel van ons DNA een functie heeft: het bepaalt wanneer en waar genen actief moeten worden."

Die twee standpunten zijn niet met elkaar te rijmen, ze zijn strijdig.

Anoniem zei

Ja en? Des te meer reden om Bruce Lipton zelf aan te horen toch?
Rita

Marleen zei

Gert, heel duidelijk hoe ze via een optelsom van de verschillende celtypen aan de 80% komen. Ewan Birney suggereerde dat als men meer celtypen zou meenemen in het onderzoek, men zelfs tot 100% 'functioneel' DNA zou kunnen komen.

Je hebt het over niet-coderende genen en omdat de terminologie in ENCODE toch al zo lastig is, is het misschien beter alles vanaf het begin van de discussie duidelijk te maken. Ik dacht dat per definitie genen eiwit-coderend waren. RNA dat niet afgelezen wordt is geen gen. Dat wordt niet zo genoemd, ook in het artikel van ENCODE niet. Ze hebben het over RNA-elementen. Neemt niet weg, zoals ENCODE ook laat zien, dat dit niet een functie kan hebben.

De berekening op het bierviltje zou best eens kunnen kloppen.

Het is interessant dat ENCODE 2007 het heeft over' biologically active' en ENCODE 2012 over 'biochemically active' (jouw referentie n°4.) Zouden ze dat 'verbeterd' hebben ?

gert korthof zei

Rita, ga jij naar dat seminar?

Marleen zei

Nog even een linkje naar dit blog van 'the finch and pea' van Mike White. Een mooie nabeschouwing over het junk DNA en een kritiek op het ijverig uitrekenen van de percentages. Vooral de laatste alinea is prachtig.

http://thefinchandpea.com/2012/09/20/the-non-functional-concept-of-genome-function/#more-6686

gert korthof zei

Marleen, dank voor je link.
Ik ben het niet eens met de stelling in het blog:

"We have to face the fact that, like much else in biology, boundaries between categories are fluid. It makes no sense to try to cleanly divide the genome into functional and non-functional elements. "

het feit dat categorieën vloeiend zijn is geen reden om classificatie op te geven! of om er percentages aan toe te kennen. Zou ik een heel blog over kunnen schrijven.

gert korthof zei

harry, "Wat voor goede reden zouden we hebben hem nu wel te geloven" (Trivers)
hoewel hij heel openhartig over zijn eigen zwakheden vertelt, gaat het natuurlijk voor een groot deel over deceit in de natuur: hij geeft feiten, argumenten, hypotheses, theorieen die in principe allemaal controleerbaar (moeten) zijn zoals alles in de wetenschap dat moet zijn!

gert korthof zei

marleen: "Ik dacht dat per definitie genen eiwit-coderend waren. "
het begrip 'RNA genes' is geen interne contradictie. Je vindt het begrip bv hier: Non-coding RNA genes and the modern RNA world
Als genen stukken dna zijn met een begin en eind, die gereguleerd worden, net als coderende genen op bepaalde tijdstippen in bepaalde celtypen worden afgelezen, evt introns kunnen bezitten, wat is er fout aan het begrip rna genen?

harry pinxteren zei

gert
ik heb het over de de valstrik van het naturalisme.

laat ik het zo proberen: er bestaat deceit in de natuur, ok, prima, het is daar zelfs zowat de norm. Maar kennelijk bestaat die deceit niet in de wetenschap (in onze hersens dus: en die Trivers). Ook prima, maar hoe kan dat dan? Er bestaan kennelijk uitzonderingen op die deceit. Dat kinkt als bovennatuurlijks, transcendentaals, ofwel als (zelf)weerlegging van naturalisme: op zijn minst moet dat zijn eigen uitgangpunt kennelijk met een korreltje zout nemen.

Gerdien de Jong zei

"Operationally, we define a functional element as a discrete genome segment that encodes a defined product (for example, protein or non-coding RNA) or displays a reproducible biochemical signature (for example, protein binding, or a specific chromatin structure)." [4]
Vrij vertaald: 80% van het menselijk dna 'doet iets'.


Dat is een heel vrije vertaling, maar het geeft wel aan waar het probleem met 'functional' hier ligt. 'A reproducible biochemical structure' kun je niet zonder meer vertalen in 'iets doen'.

http://selab.janelia.org/people/eddys/blog/?p=683
“Thought experiment: if you made a piece of junk for yourself — a completely random DNA sequence! — and dropped it into the middle of a human gene, what would happen to it? It would be transcribed, because the transcription apparatus for that gene would rip right through your junk DNA. ENCODE would call the RNA transcript of your random DNA junk “functional”, by their technical definition.”

Om te concluderen dat DNA 'iets doet' moet je laten zien wat het doet: dat is niet gebeurd.

gert korthof zei

Nee. Hij is geen uitzondering, hij vertelt daar ook over in zijn boek en in de uitzending. Je kunt self-deceit achteraf vaststellen bij jezelf, maar dan is het al gebeurd. Je kunt het herkennen maar het is moeilijk te voorkomen.

Anoniem zei

Nee, dat lukt me niet helaas. Ik heb wel zijn boek gelezen "de biologie van de overtuiging"
Rita

harry pinxteren zei

ik heb wel eens gelezen dat A Varki cs een enkel zuurstof atoompje hebben gevonden dat groot verschil maakt in de neurale stofwisseling bij apen en mensen. Dus een 'reproducibble biochemical structure' zeg maar.

Als leek vond ik het wel een spectaculair verhaal, want ja, zeg nou zelf: wat is nou een enkel zuurstof atoompje. Een klein verschil kan kennelijk grote gevolgen hebben (niet alleen als het om reproduceerbare biochemische structuren gaat trouwens, maar dit terzijde)

gert korthof zei

Gerdien, bedankt voor je link. Inderdaad de definitie van functioneel is het probleem. Testen wat het fenotypisch effect is van duizenden rna transcripts en duizenden dna-eiwit complexen is werk voor duizenden biologen van deze en de komende generaties.

Nog interessanter dan een stukje random dna in een gen laten integreren is het 'The random genome project: Synthesize a hundred million base chromosome of entirely random DNA, and do an ENCODE project on that DNA'. Dat is niet zomaar interessant, het is het verplichte CONTROLE experiment! Zonder dat kun je de data van ENOCDE niet interpreteren. Maw je moet weten wat een groot stuk random dna voor activiteiten vertoond met de ENCODE testen. Ik heb geleerd dat controles de essentie zijn van een wetenschappelijk experiment. Zo'n controle heeft ENCODE niet gedaan. Wel reproduceerbaarheid, maar dat is niet genoeg.

nand braam zei

@ Gert

Kun jij je licht eens laten schijnen op onderstaande twee visies? Zijn beide visies strijdig? of zijn ze op een bepaalde manier tot overeenstemming te brengen?

Eerst uit jouw blog:

“Als we die 80% functioneel dna omrekenen naar bases: 80% van 3,2 miljard bases = 2,56 miljard bases, dan is niet in te zien hoe die bases onderhouden kunnen worden als er een mutatiefrequentie is van 1 : 100 miljoen (1 : 10-8) per generatie! Het menselijke genome zou maximaal 100 miljoen bases functioneel dna kunnen bevatten. Dat is 3,1% van het totale dna. ENCODE komt neer op ruim 25x hoger! Daar kom ik zeker nog een keer op terug!
Populatiegeneticus en evolutiebioloog Joe Felsenstein heeft bevestigd dat de error threshold een onafhankelijk argument tegen 80% functioneel dna in het menselijk genome is (hier).”

Vervolgens het antwoord op deze vraag:

http://www.ikhebeenvraag.be/vraag/20051

gert korthof zei

Nand, mutatie frequenties waren altijd lastig te meten totdat volledige genomes van het trio vader+moeder+kind gemeten kon worden. Dat is de meest ideale situatie. Maar dat is pas zeer recent mogelijk geworden. Prof Luc Bouwens geeft zoals je ziet een berekend aantal, wat natuurlijk niet ideaal is. Toch komt hij aardig in de buurt.
Een andere complicerende factor is dat soms wordt wegelaten om wat voor soort mutaties het gaat: meestal single base mutaties (synonieme en niet-synonieme), maar er zijn meerdere soorten zoals inserties, deleties, translocaties, inversies, duplicaties, trisomie, monosomie. Die komen in verschillende frequenties voor.
De meest recente en solide meting is van Kong et al augustus 2012 hij heeft van 78 IJslandse 'trios' het totale genome gesequenced en komt op gemiddeld 1,2 punt mutaties per 100 miljoen bases (wat omgerekend tot 56 muaties per individu in totaal zou neerkomen).
Hij heeft gevonden dat de frequentie sterk afhangt van de leeftijd van de vader. Dat is dus nog een factor die variatie kan opleveren.
Niet alle mutaties zijn schadelijk. Als bijvoorbeeld inactieve transposons muteren (zo'n 50% van het genoom) dan heeft dat geen effect.

gert korthof zei

Nand,
ik zag net in Mendels Demon van Mark Ridley (2000) een mutatiefreq van 3 op de 100 miljoen (mens). Dat valt me nog mee gezien het 12 jaar geleden is. Het zit in de buurt dus.

harry pinxteren zei

om het verschil te kunnen zien tussen biochemisch actief en biologisch functioneel moet je niet alleen kijken naar een enkel atoompje, want soms is het alleen maar te zien tijdens de slaap:
Steven L. Coon, et al Circadian changes in long noncoding RNAs in the pineal gland PNAS 2012 109 (33) 13319-13324; published ahead of print August 3, 2012, doi:10.1073/pnas.1207748109

nand braam zei

@ Gert

Bedankt voor je antwoord. Maar betekent je antwoord nu dat de opvatting over mutatiefrequentie van Luc Bouwens (ca. 1 op 1 miljard basen) niet strijdig is met die van jou , Felsenstein, Kong, Ridley ( zeg maar 1-3 per 100 miljoen basen)?

gert korthof zei

Mutatie frequenties kunnen alleen strijdig zijn als je dezelfde soort mutaties met dezelfde methode meet in dezelfde diersoort. maw als ze vergelijkbaar zijn. Berekeningen zijn niet echt vergelijkbaar met metingen (Brouwers), de methodes en technieken verbeteren in de loop van de tijd (Ridley). Ook is belangrijk hoeveel proefpersonen gebruik je (Kong), als je aan het extrapoleren gaat naar de algemene bevolking.

gert korthof zei

Harry, hoe kom je toch aan dat soort publicaties? Ik moet uitpluizen wat daar aan de hand is.

nand braam zei

@ Gert

Ik hoop niet dat ik te lastig ben,maar graag ook nog een keer je commentaar op dit artikel van Shapiro “Further thoughts on the ENCODE/Junk DNA debates”:

http://www.huffingtonpost.com/james-a-shapiro/further-thoughts-on-the-e_b_1893984.html

Als buitenstaander fascineert het mij hoe verschillend er over dit ENCODE-project gedacht wordt in kringen van deskundigen. Verwarring is niet slecht. Daar komen later meestal mooie dingen uit.

harry pinxteren zei

gert, er is heel erg veel aan de hand!

En: uiterst relevant ivm de hele ENCODE discussie, die eigenlijk maar over een ding gaat. Tenminste, zo zie ik het als volkomen buitenstaander: gedoe over 'biochemisch actief' vs 'biologisch functioneel'.

Ik heb hier twee spectaculaire voorbeelden gegeven (het andere, eerder, was dat van piRNA, zo nodig nog spectaculairder).

Hoe ik aan dit soort dingen kom? Ach, het is een hobby! Ik verzamel dit soort 'postzegels', zeg maar, want over mutatiefrequenties en zo heb ik verder toch niks te melden! ;-)

harry pinxteren zei

gert, het gaat ook hard met die postzegels van mij. Moet je zien wat ik net tegenkwam:

Testori A, Caizzi L, Cutrupi S, Friard O, De Bortoli M, Cora' D, Caselle M.
The role of transposable elements in shaping the combinatorial interaction of transcription factors. BMC Genomics. 2012 Aug 16;13(1):400. [Epub ahead of print]

Zullen we binnenkort Fodor maar niet eens gaan herlezen? ;-)

gert korthof zei

Nand, "Verwarring is niet slecht. Daar komen later meestal mooie dingen uit." Helemaal mee eens als de verwarring opgehelderd wordt en daarna in de geschiedenisboeken bijgeschreven kan worden!

James A. Shapiro draaft wat door op het einde (Newton, Kuhn, etc) (ik heb zijn boek niet gekocht), maar ik ben het niet eens met:
"that a sufficient explanation for the presence of mobile repeats is their ability to replicate and amplify in the genome"
tenminste als je het letterlijk neemt. De oorzaak van het ontstaan en vermenigvuldiging van mobiele elementen is duidelijk, maar niet waarom ze zich kunnen handhaven, dus: waarom natuurlijke selectie ze niet heeft ge-elimineerd (zoals bij de puffervis) of naar een lager niveau heeftr gebracht. Misschien weet hij dat ook wel, maar slordig uitgedrukt.

Dit is een goede opmerking:
"That is why they speak of "DNA Elements" rather than genes or any other artificial categories."
Inderdaad: zo moet je het noemen omdat je nog niet weet wat ze zijn en wat ze doen.

Maar verder vraagt Shapiro zich niet af hoeveel dna in de mens functioneel kan zijn gezien 'the load of mutations'. die relatie legt hij niet.

gert korthof zei

Alsof professor Fodor daar iets van begrijpt! Het is maar een filosoof :-)

harry pinxteren zei

klopt niet wat je over Shapiro zegt gert

zie dat onderzoek van die italianen, boven. Hij bespreekt het uitgebreid: waarom bepaalde 'mobiele elementen' zich handhaven. Niet waarom of hoe ze zijn onstaan!

Draaft Shapiro weer door? (Zelfs niet al probeer ik hem nog uit te dagen!)http://www.huffingtonpost.com/james-a-shapiro/mobile-dna-repeats-and-tr_b_1906135.html