15 October 2018

Hoe komt evolutie van de ene naar de andere fitness piek?

De vraag Hoe komt evolutie van de ene naar de andere fitness piek? ontstond naar aanleiding van mijn vorige blog Nobel prijs voor evolutie. Frances Arnold.
Hier onderzoek ik wat de fitness landscapes van Frances Arnold eigenlijk precies betekenen.

bron: Eric M Brustad, Frances H Arnold (2011)

Om wegwijs te vinden in deze complexe materie stel ik me zelf 4 vragen:
  1. hoe wordt het 'fitness landscape' (plaatjes) gedefinieerd? dat moet duidelijk zijn voordat je gaat discussieren
  2. hoe vindt je fitness optima in directed evolution (in het lab)?
  3. hoe vindt evolutie fitness optima? (is geheel andere vraag)
  4. zijn de 3-D fitness landschappen toepasbaar op de werkelijkheid of zijn ze daarvoor veel te abstract?
1. Hoe wordt het 'fitness landscape' (de plaatjes) gedefinieerd?

In het bovenstaande plaatje zijn er 3 fitness pieken in een grijs vlak. De fitness is gedefinieerd als: Fitness is a measure of how well protein sequences perform the target function. De fitness is dus een zelf gekozen biochemische doel reactie. Dat is dus niet een organisme als geheel. Hoe hoger de piek hoe beter de activiteit van het enzym. Dat grijze vlak is: eiwitten zonder meetbare activiteit voor de beoogde functie (Most proteins possess no activity). De 3 gekleurde rondjes (rood, blauw, groen) stellen verschillende start posities voor. De rode bereikt na een paar mutatie rondes een optimum en is op geen enkele manier te verbeteren, want het zit al aan een lage top. Dit is een slecht resultaat. De blauwe startpositie vertoont enige verbetering, maar zit vast op een vrij kleine lokale top. De groene geeft een grote verbetering. Dat ligt aan de vorm van de berg.

Merk op dat je veel nutteloze mutaties in alle richtingen nodig hebt om van 1 piek naar de ander te komen. Dit is blind zoeken. Frances Arnold: not every bad enzyme is near a good enzyme. Je zou grotere stappen moeten maken door niet 1 puntmutatie te maken, maar meerdere tegelijk, inserties, deleties, duplicaties, etc.

Vragen

Maar er blijven vragen: wat betekent de horizontale X- en Y-as? Eén as met de volledige base volgorde van 1 enzym is duidelijk. Maar de tweede? Zijn ze hetzelfde eiwit- of base volgorde tegen elkaar uitgezet? Uit het vorige blog weten we dat er vrijwel oneindig veel eiwitten en dus basevolgordes mogelijk zijn met een lengte van bijvoorbeeld 100. Dus het afgebeelde fitness landscape is maar een extreem klein deel van het geheel.

Andere vraag: is het toeval dat de pieken in de figuur heel scherp zijn? en geen plateau? Een punt betekent immers dat er maar 1 optimaal eiwit is, en dus iedere punt-mutatie is een verslechtering. Een plateau heeft meerdere gelijkwaardige eiwitvarianten en is dus robuuster. En makkelijker te vinden door blind zoeken.

2. hoe vind je fitness optima in directed evolution (in het lab)? 

In principe is iedere vorm van mutatie toegestaan. De fitness wordt getest aan de hand van de efficiëntie waarmee het beoogde eindproduct wordt geproduceerd.

3. hoe vindt evolutie fitness optima?

Dit hangt geheel af van de volgende vraag:

4. Zijn de 3-D fitness landschappen toepasbaar op de werkelijkheid?

In de natuur wordt er nooit geselecteerd op 1 enzym en zeker niet met een gelijkblijvende genetische achtergrond. Op de twee horizontale assen kun je dus niet de DNA of aminozuur volgorde van 1 enkel eiwit plaatsen, maar wat dan wel? het hele genome van één individu?

Zonder goede definitie van een fitness landscape kunnen we niet zeggen of het toepasbaar is op de werkelijkheid. Dus voorlopig is de vraag hoe evolutie van de ene naar de andere fitness piek komt een schijnvraag is. Als dat zo is, dan is het fitness landscape ook geen probleem voor de neo-Darwinistsiche evolutie zoals anti-evolutie critici (ID-ers zoals William Dembski) hebben beweerd.

Postscript


Toen ik bovenstaande geschreven had, zocht ik nog eventjes in wat evolutiehandboeken naar fitness landscape. Tot mijn verrassing vond ik in Nicholas Barton (2007) Evolution de paragraaf "The Metaphor of an Adaptive Landscape Can Be Misleading" (p.473-474). Ze geven 3 redenen. En maken onderscheid tussen twee typen landscape: de gemiddelde fitness van een populatie, en de fitness van een individu. Frances Arnold heeft dus kennelijk een derde type: het fitness landscape van 1 enzym (genotype of fenotype). Goed om te beseffen. Een interessante reden waarom het misleidend kan zijn: het fitness landschap is dynamisch, dus niet statisch zoals de plaatjes van Arnold zouden kunnen suggereren. Het oppervlak, de bergen en de dalen, kan veranderen door interactie's tussen genotype, fenotype en milieu.

Conclusie:

Voordat je kritiek hebt op het neo-Darwinistische evolutietheorie, definieer eerst de term fitness landscape en de toepasbaarheid op de werkelijkheid. Het fitness landscape van Nobelprijs winnares Frances Arnold (met pieken en een 'death valley' [mijn term]) kun je niet zondermeer toepassen op organismes en soorten in de natuur.
Er kunnen wel degelijk problemen zijn: evolutie kan nooit alle mogelijke enzymen testen en vele heel goede enzymen zullen nooit ontdekt worden. De vraag 'Hoe komt evolutie van de ene naar de andere fitness piek?' kan een legitieme vraag zijn. Maar baseer je kritiek op een correcte metafoor en een juist begrip van zaken.

05 October 2018

Nobel prijs voor evolutie. Frances Arnold.

Frances Arnold: New enzymes by evolution
(mei 2017) dus nog voor ze de Nobelprijs ontving.
Frances Arnold (62) kreeg 3 oktober 2018 de Nobelprijs in de Chemie "for the directed evolution of enzymes"  (de gerichte evolutie van enzymen). Bij mijn weten is het niet eerder voorgekomen dat in het bekroonde werk van een wetenschapper evolutie zo centraal stond. Ik heb gezocht op het internet naar wat ze precies gedaan heeft. Ik vond een erg goede video op youtube (38 min) waarin ze zelf uitlegt voor een algemeen publiek wat haar onderzoek inhoudt [5]. Kort: ze gebruikt evolutionaire principes in het lab om nieuwe enzymen en producten te maken. Daarvoor kijkt ze eerst naar hoe evolutie enzymen maakt.

Evolutie heeft een verbazingwekkende hoeveelheid enzymen geproduceerd
Ze maakt op een fantastische manier inzichtelijk hoe evolutie werkt, en hoe je Darwinistische evolutie kunt gebruiken om enzymen aan te passen voor nieuwe taken. Zij kan het uitleggen als geen ander. Het is haar levenswerk.

in het lab kunnen we iets creëeren wat niet in de natuur voorkomt
Haar doel doel is: enzymen en biochemische reacties produceren die nog niet in de natuur bestaan, en deze genetisch vastleggen in het DNA van bacterieën.

Een probleem daarbij is dat de vorm en functie van een enzym nog niet goed te voorspellen is aan de hand van de genetische code of de aminozuurvolgorde van een eiwit. Je weet niet aan welke knoppen je moet draaien om een eiwit een gewenste biochemische reactie te laten uitvoeren. Men kan een enzym niet van de grond af aan (from scratch) ontwerpen [7].

De mogelijke variaties op een enzym zijn zo groot ('protein space' of 'protein universe') dat je ze niet allemaal stuk voor stuk kunt uitproberen. Er zijn bijna oneindig veel mogelijke eiwitten [6]. Een bijkomend probleem is dat het eiwit universum vrijwel geheel 'leeg' is (zie plaatje). D.w.z. er zijn maar een paar kleine fitness eilandjes die evolutie heeft gevonden. Dus, hoe vind je die speld in een hooiberg? [1]


Fitness landscape met zeldzame fitness heuveltjes

Volgens Frances Arnold werkt evolutie omdat in voldoende gevallen iets nieuws ontdekt kan worden in een continue cyclus van mutatie en selectie. Dat heeft zij nagebootst in het lab. Het verschil met natuurlijke selectie is dat zij als selectie criterium niet de algemene fitness van het organisme kiest, maar een doel dat voor de mens nuttig is. En een tweede verschil dat het hele proces van mutatie en selectie versneld en grotendeels geautomatiseerd wordt [9]. In het begin wordt er lichte selectiedruk uitgevoerd, en die druk wordt afhankelijk van de resultaten opgevoerd.

Hoe kun je eigenlijk bestaande enzymen geheel nieuwe eigenschappen geven? Het antwoord is verbazingwekkend en elegant:

Enzymen met verschillende functies hebben een functieoverlap
en dat kun je zodanig versterken dat het een hoofdfunctie wordt.

Ieder enzym heeft al onopvallende nevenfuncties, zeg maar verborgen talenten. Enzymen vertonen een lage enzymatische activiteit voor andere reacties dan waarvoor evolutie ze 'ontworpen' heeft. Vergelijk dat met een schilder die ook een beetje timmerwerk kan verrichten en door oefenen daar beter in kan worden todat hij een echte timmerman wordt en zelden nog schildert.

Die nevenfuncties van enzymen kunnen we dus uitbuiten en versterken.

Door deze manier van werken vindt je nuttige mutaties die van te voren niet te voorspellen waren. Je begrijpt niet waarom bepaalde mutaties werken. Je bent blind bezig mutaties in genen aan te brengen. Je kunt de enzym activiteit niet voorspellen aan de hand van de mutaties. Je kijkt alleen naar het resultaat op enzym niveau. En dat probeer je door een eenvoudige screening vast te stellen. Door evolutie in het lab ontstaan oplossingen, d.w.z. totaal nieuwe structuren van eiwitten. Directed evolution in the lab does not just optimize, it innovates. Evolutie is creatief en innovatief. 
Dit lijkt allemaal eenvoudig, maar er gaat veel werk zitten in de keuze van het enzym dat je wilt verbeteren, hoe je mutaties aan brengt en hoe je selecteert.

Intermezzo
Een tot de verbeelding sprekend voorbeeld van Frances Arnold is de vraag: waarom heeft evolutie nooit het tweede meest algemene chemische element, Silicium, gebruikt? Er zijn geen Koolstof-Silicium (C-Si) verbindingen in de natuur. Maar gerichte evolutie in het lab kan menselijke chemici vele malen overtreffen in efficiëntie en selectiviteit. Die verbindingen heten organo-silicon compounds. New forms of life! Extraterrestrial life forms! [2],[3]. Idem voor: Koolstof-Boron verbindingen [4].

Haar methode van gerichte evolutie heeft overal ter wereld navolging gevonden in de chemische en farmaceutische industrie. Behalve praktische toepassingen heeft haar werk ook inzicht gegeven in de mogelijkheden en onmogelijkheden van de evolutie van enzymen in de natuur. Ze heeft dus ook een bijdrage geleverd aan de evolutiebiologie.

Dit Nobelprijs waardig onderzoek is zo diepgaand op evolutionaire principes gebaseerd, dat ik het niet overdreven vind om te claimen dat dit de eerste Nobelprijs voor evolutie is! [8]
 
Haar idealisme om haar onderzoek in te zetten voor een duurzamere wereld en haar weigering om voor de olieindustrie te werken, maakt haar ook nog eens een bijzondere en inspirerende vrouw die de Nobelprijs dubbel en dwars heeft verdiend. Of zoals het Nobel committee het zegt:
"The 2018 Nobel Laureates in Chemistry have taken control of evolution and used it for purposes that bring the greatest benefit to humankind. Enzymes produced through directed evolution are used to manufacture everything from biofuels to pharmaceuticals."
en dat op een milieuvriendelijke manier. Zie verder de wetenschappelijke toelichting van het Nobel comittee zelf (bevat een uitgebreide literatuurlijst):

Literatuur


Noten

  1. Haar plaatje met twee van elkaar geisoleerde fitness pieken roept bij mij de vraag op: hoe komt evolutie van A naar B als daartussen een grote zwarte 'death valley' (most mutations are deleterious) ligt? Waarschijnlijk moet je denken aan andere selectiedrukken die het fitness landschap verandert...
  2. Vergelijk met de mislukte claim dat er bacterië bestaan die Arseen in hun DNA geïncoporeerd zouden hebben. Dat is nooit op aarde aangetoond. Zie serie blogs beginnend met: Bacterie ontdekt die arsenicum in plaats van fosfor gebruikt (2 dec 2010) t/m Arsenicum bacterie: Felisa Wolfe-Simon antwoordt haar critici 3 juni 2011. 
  3. Bringing Silicon to Life, Caltech.
  4. Teaching Life a New Trick: Bacteria Make Boron-Carbon Bonds, Caltech 
  5. Philip A. Romero, Frances H. Arnold (2009) Exploring protein fitness landscapes by directed evolution is een overzichtsartikel in het Darwinjaar 2009 waarin ze directed evolution uitlegt met alle bronvermeldingen erbij; en ook met het plaatje van fitness landscape hierboven. (met dank aan Harry, 10-10-18)
  6. Belangrijk gegeven: nature has explored only an infinitesimal fraction of the possible proteins: omdat er oneindig veel mogelijke eiwitten van een gegeven lengte zijn, heeft evolutie maar een oneindig klein percentage van al die mogelijkheden ontdekt. Dit betekent dat There are so many proteins waiting to be discovered: er ook oneindig veel nieuwe enzymen te ontdekken zijn met o.a. directed evolution, maar ook door evolutie zelf. (10-10-18)
  7. In de tijd dat Frances Arnold begon met haar experimenten: "At the time, researchers thought that they would be able to sit down at a computer and rationally design proteins to carry out specific functions." bron: Nature, 11 okt 2018, 'Test-tube’ evolution wins Chemistry Nobel Prize'.
  8. “Our laureates have applied principles of Darwin in the test tubes, and used this approach to develop new types of chemicals for the greatest benefit of humankind.” citaat uit Nature artikel [7]. 
  9. Derde verschil: The ability to disconnect a protein from its in vivo function. Vierde verschil: natural evolution works on a different fitness landscape, etc. [11 okt 18]

01 October 2018

Waarom reproduceerbaarheid in de wetenschap zo belangrijk is

KNAW (2018) rapport: Replication Studies

In een recent rapport Replication Studies van de Koninklijke Nederlandse Akademie van Wetenschappen, de KNAW, komen de auteurs tot de conclusie dat het slecht gesteld is met de reproduceerbaarheid van onderzoek in de exacte wetenschappen. Dit houdt in dat als een gepubliceerd onderzoek herhaald wordt door andere onderzoekers met dezelfde methode, technieken en materialen, er niet dezelfde resultaten uitkomen. 

Dat is erg! Hoe erg is dat?

In de vakgebieden waar de reproduceerbaarheid laag is, kan het wel eens slecht gesteld zijn met de kwaliteit van onderzoek in het hele vakgebied. Bovendien, zo schrijven de auteurs
"Studies with non-reproducible results can jeopardise scientific progress, waste resources, harm individuals and society, and erode public trust in science."
Wetenschappelijke vooruitgang kan in gevaar komen, wordt er geld verspild, kan het schadelijk zijn voor individu en samenleving, en wordt het vertrouwen van het publiek in de wetenschap ondermijnd.

Ik zocht naar vakgebieden waar proefdieren gebruikt werden. Ik vond twee vakgebieden: Preklinsiche studies / Algemene biologie en Preklinisch studies / neurologie. Dit gaat dus over geneesmiddelen onderzoek. In het eerste geval was de conclusie:
"Researchers from Bayer HealthCare attempted to validate data on potential drug targets  obtained in 67 projects by copying models exactly or by adapting them to internal needs.  In 20% to 25% of cases, published data were completely in line with the results  of the validation studies. "
Dat betekent dus dat 75 - 80% van de studies niet of slecht reproduceerbaar waren!  In het tweede geval:
"Retesting of nine potential drugs in rigorous animal tests that had been reported to slow down  disease in a mouse model for ALS . None (0%) of the drugs was found to slow down ALS. "
Dus in deze studies was het nog erger: geen enkele reproduceerbaarheid! Deze studies zijn dus waardeloos. Nog erger: honderden of duizenden proefdieren zijn voor niets opgeofferd. 
Wat mij opvalt is dat het KNAW rapport niets over verspilde dieren schrijft. Alleen: "waste resources". Dieren zijn slechts 'resources'. Wel staat dat er onnodig risico ontstaat voor menselijke proefpersonen.

Behalve de reproduceerbaarheid is er dus meer mis met onderzoek in de biomedische wetenschappen. Of in ieder geval bij de auteurs van het rapport. Hopelijk zullen er minder proefdieren voor niets opgeofferd worden als de aanbevelingen van de KNAW om reproduceerbaarheid te verhogen in de praktijk worden toegepast. Nog beter: proefdiervrij onderzoek. Daar over een volgende keer.