Researchers Julius Fredens et al have succeed to eliminate 2 codons for the amino acid Serine and 1 stopcodon from the genetic code of the bacterium Escherichia coli by creating a fully synthetic genome.
In this blog I suggest that on an evolutionary time scale mutation pressure in this bacterium will re-create the deleted codons elsewhere in the genome by point mutation. But because they cannot be translated, those blank codons will function as stop codons and will terminate protein synthesis. This would be harmful. Consequently, there will be a negative selection for blank codons and a positive selection for meaningful codons (as long as those codons can be translated). I suggest a general rule: natural genetic codes will not have empty codons. All 64 codons will have a meaning. There will be no holes.
Continuing in Dutch
U en ik zijn hier op aarde omdat twee mensen seks hebben gehad. De oorzaak dat U en ik op onze ouders lijken is DNA. Maar, het rare is dat er in het DNA helemaal geen bouwplan voor het menselijk lichaam opgesloten ligt. Het DNA 'codeert' [1] uitsluitend voor eiwitten. Preciezer gezegd: DNA codeert voor losse aminozuren, de bestanddelen van eiwitten. Het
DNA codeert voor maar 20 verschillende aminozuren. Dat is alles! Dat is
de hele erfelijkheid! Dat is alles wat
DNA doet! Hoe uit losse aminozuren een menselijk lichaam ontstaat is een ander verhaal. Over die genetische codering, de universele vertaalsleutel om de informatie in DNA te vertalen naar eiwitten, gaat dit blog.
Hoe zit die code in elkaar? De natuur heeft gekozen voor een nogal merkwaardige manier van coderen. Hoe er voor die 20 aminozuren wordt gecodeerd heeft niemand kunnen voorspellen. Dat volgt uit geen enkele theorie. Er is geen formule waar je het uit af kunt leiden. Het lijkt een arbitraire afspraak [4]. De natuur heeft gekozen om 61 codes te gebruiken voor 20 aminozuren. Dat is gemiddeld 3 codes per aminozuur. Voeg daarbij nog 3 stop codes. Dat zijn in totaal 64 codes. Die 64 codes vind je traditioneel in een tabel van 64 vakjes (zie figuur).
Ik schreef gemiddeld 3 codes per aminozuur. Maar bijvoorbeeld het aminozuur Serine heeft 6 verschillende codes. Anders gezegd: Serine heeft 6 synonieme codes. 'Synoniem' impliceert dat die codes onderling inwisselbaar zouden zijn. In de tabel met alle 64 codes zie je daarom Serine 6 keer verschijnen. Ieder vakje is een andere code.
Maar omdat er duizenden eiwitten zijn met Serine komen de Serine codes ook duizenden keren voor in het DNA. De onderzoekers hebben dit toegepast op de bacterie Escherichia coli. Heb je het goed gedaan dan is de bacterie levensvatbaar en blijft het precies dezelfde eiwitten produceren als de ongemodificeerde bacterie. Het fenotype is hetzelfde.
Tevens hebben ze ook nog 1 stopcode van de 3 vervangen door een van de andere twee zodat er maar 2 stop codes overblijven (figuur 2). Een stopcode markeert het einde van het eiwit waarvoor het gen codeert. Ook hier is de functionaliteit hetzelfde gebleven. Als het goed is worden nog steeds dezelfde eiwitten geproduceerd.
Figuur 2. Drie codes zijn verdwenen (blanco): 1 stopcode en 2 Serine codes. Blijft over: 61 codes: 59 voor 20 aminozuren en 2 stopcodes |
Om dit te bereiken moesten de onderzoekers op 18.214 plaatsen in het genoom van de bacterie de codes vervangen. De totale lengte van het DNA van de bacterie E. coli is 4 miljoen basenparen. Ze hebben zodoende ongeveer 1% van het DNA veranderd. Dit lijkt niet veel maar dit is zelfs ondoenlijk met moderne CRISPR-cas technieken. Hoe hebben ze dat opgelost? Gewoon de wijzigingen in de computer gedaan en daarna het hele genoom van 4 miljoen basenparen laten synthetiseren door een robot. De techniek is veel en veel gecompliceerder, en er kwamen ook interessante complicaties boven water, maar dat laat ik nu even zitten.
Vergelijk: Wat de onderzoekers gedaan hebben is te vergelijken met het vervangen van het woord 'boos' door het synoniem 'kwaad'; 'zoenen' door kussen'; en 'expositie' door 'tentoonstelling' in een boek. Er zijn 3 woorden geëlimineerd. Het boek wordt er niet korter door, maar je gebruikt minder verschillende woorden om hetzelfde te zeggen. Je hebt synoniemen geëlimineerd.
Het eindresultaat is een genetisch gemodificeerde bacterie met een synthetisch genoom van 61 codes: 59 voor aminozuren en 2 voor stop codes. En de bacterie blijft leven. Dat is het bewijs dat je codes kunt vervangen door synonieme. Het lijkt simpel maar is een grote technische prestatie.
In theorie zou je verder kunnen gaan door 4 overblijvende codes voor Serine te reduceren tot één. En het zelfde doen voor alle 20 aminozuren. Ieder aminozuur heeft dan één code. En de stop codes vervangen door 1 stop code. Zo houd je 21 codes in plaats van 64 codes over. Het absolute minimum. [2]
Waarom?
Dit zet je aan het denken over de vraag: waarom heeft evolutie dit niet gedaan? Waarom zoveel synoniemen? Gaat evolutie niet voor eenvoud? Na een nachtje slapen kreeg ik het idee dat organismes met ongebruikte codes (de witte vakjes in figuur 2) evolutionair instabiel zijn. Waarom?
Als je nog even naar de tabel figuur 1 kijkt dan zie je dat 4 Serine coderingen in hetzelfde blok alleen in de derde letter verschillen. De eerste en tweede letter zijn hetzelfde. Daarom staan ze natuurlijk in hetzelfde blok van 4. Als er nu een mutatie in de 3e letter optreedt, dan heeft dat geen effect. Het blijft Serine. Dat geeft een zekere evolutionaire robuustheid.
Maar wat als er door een spontane puntmutatie een niet bestaande code ontstaat? (blanco vakje in de figuur). Je kunt die code wel verwijderd hebben uit het genoom, maar die kan spontaan terugkeren! Dan heb je een dode code die nergens voor codeert [3]. Die code hebben de onderzoekers immers verwijderd. Dat kan (en zal?) tot gevolg hebben dat de synthese van het eiwit afbreekt en er geen intact eiwit geproduceerd kan worden. Het zal hetzelfde effect hebben als een stopcode denk ik [6]. Dat is vervelend als het eiwit belangrijk is. En het hele verhaal wordt fataal als je de genetische code hebt gereduceerd tot het theoretisch minimum van 21 codes.
Op korte termijn in het laboratorium zal dat niet ernstig zijn. Het effect is te vergelijken met gewone spontane mutaties. Die heb je altijd. Maar op langere evolutionaire termijn zullen er vele eiwitten (met Serine) niet gesynthetiseerd kunnen worden. Dat kan schadelijk of zelfs fataal zijn voor het organisme.
Afgezien van deze zeer specifieke laboratorium omstandigheden, geldt in het algemeen: de genetische code is niet voor niets behoorlijk redundant. Organismen zijn daardoor beter bestand tegen puntmutaties vooral van de derde letter.
Figuur 3. Door 8 buren wordt er mutatiedruk uitgeoefend op de lege codes. (eigen figuur) toegevoegd: 21 mei. |
Heb je eenmaal een 3-letter genetische code, dan heb je automatisch 4x4x4 = 64 codes en alle 64 codes zullen opgevuld worden. Er komen geen gaten voor.
Dat zou wel eens een reden kunnen zijn waarom de genetisch code is zoals hij is. Als ik me niet vergis.
Update 22 mei: inleiding verbeterd en Engelse samenvatting toegevoegd.
27 mei: Titel gewijzigd in: Waarom er geen gaten zitten in de genetische code.
Dankwoord
Met dank aan de vaste blogbezoeker Harry die mij wees op de publicatie.Opdracht
Dit blog is opgedragen aan Mei Li Vos: wat is de genetische code toch mooi ontworpen!Noten
- De woorden 'code', 'coderen' , 'vertaalsleutel', 'informatie', 'synoniem' en dergelijke zijn hier figuurlijk gebruikt. Dat is gangbaar taalgebruik en dat volg ik voor het gemak. Maar er is niemand die letterlijk iets gecodeerd heeft. Daar heb ik eerder over geblogd (hier).
- In de praktijk kan niet ieder synoniem zonder nadelige gevolgen vervangen worden door een willekeurig ander. Dus die zijn niet 100% synoniem. Daar ga ik nu even niet op in.
- De onderzoekers hebben het betreffende tRNA verwijderd, of in ieder geval overbodig gemaakt.
- Een arbitraire afspraak: wij hebben de huismus, de Engelsen noemen dat 'house sparrow' en de Duitsers 'Haussperling', terwijl onze spreeuw in Engeland 'starling' en in Duitsland 'Star' heet. Het Engelse 'star' is weer heel wat anders. Het zijn arbitraire afspraken om dingen aan te duiden. Het doet er niet toe welke codes je gebruikt, als iedereen het consistent gebruikt, werkt het. [ 22 mei ]
- De blanko codes worden niet opgevuld door mutatie op dezelfde plaats in het genoom omdat de onderzoekers maximaal verschillende Serine codes gebruikt hebben om ze te vervangen (zie pijlen in figuur 1). Ze ontstaan op plaatsen waar buren in de genetisch code tabel liggen. Het is enigzins verbazend dat er 3 stopcodons zijn omdat ze 5 buren hebben die door puntmutatie kunnen muteren naar een stopcodon: dat zijn 5 kansen dat een codon dat voor een aminozuur codeert in een stopcodon verandert. Waarom zou 1 stop code niet voldoende zijn? Dan hou je nog 2 codes over die nuttig gebruikt kunnen worden voor aminozuren zoals Tryptofaan die maar 1 code hebben. [ 23 mei 2019 ]
- Een punt mutatie die een code voor een aminozuur verandert in een stopcode heet: non-sense code. (wikipedia: https://en.wikipedia.org/wiki/Nonsense_mutation ). De vraag is of de kunstmatige situatie van blanco codes die de onderzoekers hebben gecreëerd vergelijkbaar is met een stopcode. Een stopcode wordt niet door een tRNA gelezen, maar door een Release factor (eiwit). Maar die zijn er natuurlijk niet voor de blanco codes die de onderzoekers hebben gecreëerd. Het effect zou kunnen zijn dat de synthese niet netjes wordt gestopt, maar het proces bevriest en dus een ribosoom bezet blijft. Dat zou wel eens erger kunnen zijn dan een normale stopcode! [ 29 mei 2019 ]
Bronnen
- Construction of an Escherichia coli genome with fewer codons sets records (gratis Nature News and Views artikel van de redactie). (te vinden op de website)
- Total synthesis of Escherichia coli with a recoded genome, Published: 15 May 2019. Dit is het research artikel. (ook te vinden op de website). De samenvatting is gratis, de rest zit achter een betaalmuur.
Vorige blogs over dit onderwerp
- Volendammer mutatie tast de kern van de genetische codering van de mens aan, blog 16 maart 2016.
- De volgende stap: het synthetiseren van het complete menselijke DNA, blog 22 March 2017