13 January 2023

Non-Watson-Crick base pairs that you won't find in the textbooks and Wikipedia

(Continued from previous blog). Yesterday, I found 'officially forbidden' non-Watson-Crick CA and TG base pairs on the website of Nature Scitable. The standard Watson-Crick base pairs are AT and CG. They are in all the textbooks. But, you won't find the non-Watson-Crick base-pairs in the textbooks. Certainly not in this detail. The first figure (a) gives the 4 bases and their rare (tautomeric) forms. They are not in the textbooks. They are apparently in a chemical equilibrium (see arrows). The rare forms are indeed rare, but apparently they do exist. So, we should know about them.

Left: common, Right: rare tautomeric forms of the 4 bases
©Nature Scitable

Standard Watson-Crick base pairs
©Nature Scitable

All 4 bases A, T, C, G have rare forms. But only rare-C and rare-G participate in base pairs, see figure (c). The pairs consists of a common and a rare base. Note that rare-A and rare-T do not participate in rare base pairs:

Rare matching base pairs CA and TG
©Nature Scitable [1]

If this is not confusing enough, on the same webpage Nature shows aberrant base pairing of the bases in their 'normal' form:

Non-Watson-Crick base pairs TG and CA.
©Nature Scitable

My conclusion is that Evolution textbooks and Wikipedia [6] give an incomplete picture of which base pairs are possible in DNA. They do tell about mutation and base pair mismatch, but never show non-Watson-Crick base pairs. I think they should do so. This is an extremely important point: how can you explain mutation to students, if rare base forms and rare base pairs do not exist? Then, show them! If DNA would replicate exclusively on the basis of the standard Watson-Crick base pair rule, then DNA would be copied with 100% reliability eternally. I think, one cannot blame polymerase for copying errors, because polymerase can't enforce chemically impossible base pairing.

Secondly, students get the wrong impression that DNA is a perfect molecule, that bases always follow the Watson-Crick rule, and that DNA is fine-tuned for life. It is an intrinsic property of the bases that they have rare (tautomeric) forms and that they can pair in a non-standard way. 

Hubert Yockey 1992

The question remains: How often do non-Watson-Crick base pairs occur in DNA?  Surprisingly, I found in an aside on page 300 of Hubert Yockey [2] that "the probability that adenine will mispair to cytosine is about 10-4 x 10-4 = 10-8." (AC pair). That is very small. About the CG pair he writes: "...the base selected has a probability of about 10-4 of being in the imino or enol tautometirc form that leads to mispairing." 

He doesn't do anything with these calculations. However, if I understand him correctly, this means that there is a 1 in 10,000 probability that the C or G base is in the wrong form. This would mean that at every replication round of our genome of 3.2 billion bases, 320,000 C or G bases would mispair. Considering that the human body starting from a zygote experiences about 10 quadrillion (1015) cell divisions in a lifetime [3] then the unimaginable number of 3,2 x 1020 C or G base mismatches would occur [4]. The proofreading and repair system has the task to repair these mutations...

Anyhow, it is clear by now that DNA as a carrier of hereditary information is far from perfect [5]. A perfectly intelligently designed DNA would be stable, have bases without tautomers, 100% replication fidelity, didn't need proofreading and repair and didn't have accumulation of DNA damage during aging. No cancer and no genetic diseases as a result! Mutations would only be positive and introduced deliberately as an adaptation to changing environmental conditions.

In the next blog I will return to Kondrashov!


I was informed that on the Dutch wikipedia page Kwantumbiologie tautomerism is mentioned and illustrated with AT base pair mutating in to an AC base pair. On that page one finds interesting references to the English literature! [24 Jan 2023]


  1. This illustration is also present in H F Judson The Eighth Day of Creation, page 434 (not a textbook!)
  2. Hubert Yockey (1992) Information theory and molecular biology, hardback Cambridge University Press, page 300. (not an evolution textbook). I have a review of the book on my WDW website.
  3. Wikipedia article cell division (13 Jan 23), but the meaning of quadrillion differs!
  4. In fact 3,2 billion base pairs is the haploid number, but our body cells are diploid so the number should be 6,4 billion! That is the amount of DNA that has to be replicated! And both C and G could be in the wrong tautomeric form, so multiply the number by two.
  5. Fazale Rana (2022) DNA’s Fine-Tuned Structure Minimizes Harmful TautomersReasons to Believe. This is a perfect example of a christian/Intelligent designer who claims that DNA’s optimized structure is evidence for the intelligent design of DNA. He does not show any mismatch base pairs such as the Nature Scitable page does. He does not  deny that base tautomers exist, and that tautomeric forms are harmful and trigger mutations, but claims that it could be worse! Read the article, and draw your own conclusion!
  6. The Wikipedia article Base pair doesn't mention tautomerism, let alone showing illustrations of base mispairs. The Wikipedia article DNA doesn't mention tautomerism. On the page Tautomer DNA is not mentioned at all, although "nucleobases guanine, thymine, and cytosine" are present, but strangely adenine is absent on that page! Wikipedia is really incomplete in this respect. Later I found the Wikipedia article Non-canonical base pairing, ... but the DNA article does not contain a link to this article. The DNA article however, does contain a paragraph 'Non-canonical bases', but that is not the same as non-canonical base pairing! Wikipedia is like loose sand:  a badly-integrated, disjointed system. There is no supervisor who takes care of the coherence of the whole system. This can be expected from a multi-author encyclopedia. [15 Jan 2023] [23 Jan 2023]


  1. Gert, what an interesting blog about DNA mispairs. Even when the occurence frequency is low, the resulting number for a complete human DNA is very high. I need to read more about this.

    One thing is clear: nature does not produce perfect building blocks. Not DNA nor atoms. During high temperature nuclear reactions in stars all kind of atoms are produced but many of them don't survive because there nucleus is unstabe (too little or too many neutrons compared to the number of protons).
    At even higher temperatures protons and neutrons were formed from quarks, but of all hadrons only protons are stable. Half of the free neutrons decay after about 15 minutes, but in cooperation with a proton its lifetime is nearly infinite.
    Both in the case of neutrons and the nulcei of atoms the life saving principle is: cooperation! That means: combine neutrons with protons and they live nearly for ever and these combinations often result in stable atoms.
    So may be, something like that is operational in the biological world?

  2. Rolie, thanks for your comment. Your excursion to nuclear physics is instructive. The atoms involved in life are relatively stable because they survived -as I understand- nuclear instability, etc.
    Rolie: "So may be, something like that is operational in the biological world?":
    biological systems cannot improve chemical instability directly, but indirectly by counteracting certain chemical instability or imperfections by producing repair enzymes, etc.

  3. Gert, clear what you write.
    But still I think that physical and chemical mechanisms might play an important role in keeping DNA-structure and information stable, because DNA storage functioned before repair systems were operational. Logically the latter evolved using functioning genes, isn't it?

  4. Beste Gert, het is niet helemaal waar dat Wikipedia niets over tautomeren zegt. Het is daarentegen ook heel waar dat zelfs Watson & Crick er al van op de hoogte waren.

    Het artikel 'Kwantumbiologie', besteedt er uitgebreid aandacht aan:
    Er wordt ook duidelijk in vermeld dat Watson en Crick al van de tautomeren wisten, zoals je in de referenties kunt nalezen. En dat is niet voor niets want dat heb ik zelf geschreven!
    Maar het is waar dat dit ontbreekt in de andere artikelen over DNA. Misschien kan ik of kun jij daar wat aan doen.

    Nu kun je wel altijd afgeven op Wikipedia, maar het zou nu juist leuk zijn als je er zelf ook aan bijdroeg met alles dat je weet en weet terug te vinden in de literatuur. Het is een enorm bouwwerk wat onderhouden wordt door informatici en schrijvers die uit allerlei disciplines komen. Ik vind het een heel interessante omgeving.

    Mooi blogs weer!

  5. Hoi Marleen, leuk dat je weer op mijn blog te zien! En leuk dat je aan de Ned wikipedia werkt. Mijn opmerkingen over wikipedia gaan over de Engelse wikipedia, en ik heb niet gezegd dat wikipedia niets over tautomeren zegt en ik heb al helemaal niet gezegd dat Watson&Crick niet op de hoogte waren van tautomeren. Goed lezen hoor :-)
    Ik zou zelf wel iets kunnen toevoegen aan wikipedia maar ik vind tautomerie zelf nog te ingewikkeld om er over in de wikipedia te schrijven.
    Ik heb vroeger aan wikipedia bijgedragen, maar ik heb daar negatieve ervaringen mee en ben er mee gestopt. Ik zou zeggen hou vol zolang het leuk is!
    Ik ben niet de enige die problemeen heeft met wikipedia:
    zie o.a. deze 2 Sandwalk blogs:
    Blocked by Wikipedia!
    The trouble with Wikipedia

    Kun je in de figuur op:
    aangeven waar A^i en T^e voor staan?
    Dat staat volgens mij niet in de tekst.
    groetjes, Gert

  6. Gert,

    Met dit zinnetje in je blog was ik het niet helemaal eens.

    “My conclusion is that Evolution textbooks and Wikipedia [6] give an incomplete picture of which base pairs are possible in DNA. They do tell about mutation and base pair mismatch, but never show non-Watson-Crick base pairs.”

    en dacht dat dat niet helemaal klopte met de werkelijkheid.

    In je volgende blog vond ik dit:

    “In 1953 Watson and Crick had absolutely no idea of the insufficiency of the base-pairing for DNA-replication. Their double-helix DNA structure, base pairing and replication were prime examples of beauty and simplicity. "The idea of errors and repair didn’t occur to them, because it wasn’t thought to be necessary”

    klopt dan ook niet met wat zij wisten over de tautomeren. Maar ik denk dat dit betrekking heeft met de tijd waarin men toen leefde en waarin mutatie als een ‘fout’ werd gezien in plaats van als een nodig ‘kwaad’.

    Bij de tautomeren in de begeleidende figuur op het artikel Kwantumbiologie betekent i - imino en e - enol wat te maken heeft met het verplaatsen van het proton

    Nu wil ik Wikipedia niet per se verdedigen, want ik sta er soms ook versteld van hoe slecht je er door sommigen ontvangen wordt. Ik heb een bijzonder slechte ervaring gehad op de Engelse Wikipedia. Er stond en staat daar waarschijnlijk nog steeds in de inleiding van het artikel over Chlorophyll dat dit pigment het groene licht niet reflecteert, maar dat het licht door bladstructuren wordt weerkaatst. Als je goed leest (want dat kan ik wel, ook al moet ik toegeven dat ik jouw blog te vluchtig gelezen heb) dan zie je dat toen ik daar een opmerking over maakte, ze met vijf man over me heen vielen op de overlegpagina. Het artikel dat die bewering staaft en dat als eerste referentie in de lijst staat, heeft aan het eind een bedankje aan Wikipedia. Hier is iets fout dacht ik en ben gestopt met protest indienen.

    Laatst werd ik ook als een sufferd behandeld door een ‘collega’ op Wikipedia. Maar dat risico loop je als je je in virtuele ruimtes begeeft.

    Verder beschouw ik Wikipedia als een editor waar je werkstukken kunt opstellen met de referenties allemaal mooi bij elkaar. Wel degelijk de moeite waard om te gebruiken. Het is jammer dat je niet meer aan Wikipedia meedoet, want het project wat inmiddels alweer 21 jaar bestaat lijkt wel te werken.

  7. Marleen, ik heb aan bovenstaande post een correctie toegevoegd. Ik heb op je wiki pagina Kwantumbiologie gezien dat er verschillende interessante referenties over DNA staan, die ik ga lezen. Dank voor al je werk! Je hebt er veel tijd in gestopt!
    En ik heb gezien dat je i en e hebt toegelicht. Dank!
    Nog een vraag: op de pagina Kwantumbiologie staat die figuur met A:T en Ai:Te Ai:C. Moet ik dat begrijpen dat het paar Ai:C in DNA voorkomt? Is dat de normale vorm van C? En is dat Ai:C paar ontstaan NA replicatie? Of wordt met pijltjes een chemisch evenwicht aangegeven, maar dan lijkt het alsof Te overgaat in een C? dat kan toch niet de bedoeling zijn? dus hoe moet ik die figuur lezen?
    Tenslotte zou het voor de lezer ook leerzaam zijn om in die figuur in het eerste A:T paar aan te geven om welke tautomere vormen het gaat?

    PS: Pas in 1960, dus 7 jaar na 1953, heeft Arthur Kornberg DNA polymerase aangetoond. Wisten Watson en Crick dat er überhaupt enzymen nodig waren voor DNA replicatie???

  8. Hartelijk dank ook aan jou dat je veel tijd gestopt hebt in het bekijken van de pagina kwantumbiologie op Wikipedia. Je suggesties zijn zeer welkom en ik ga daar zeker wat mee doen.

    Ik zal daar ook wat duidelijker schrijven hoe ik de aanwezigheid van de tautomeren begrepen heb. De tautomeren ontstaan in de basenparen dus in het dubbelstrengs DNA omdat er sprake van protontunneling zou zijn tussen de twee basen. Er vindt dan een uitwisseling plaats tussen de twee basen weliswaar op twee verschillende ‘knopen’. Dit gebeurt dus niet in het losse of enkelstrengse Adenine of Thymine. In de figuur is het pijltje dat wijst naar de tautomere vorm van het basenpaar AT kleiner dan het pijltje dat in tegenovergestelde richting wijst, ‘terug’ naar het canonieke basenpaar. Dit betekent dat het evenwicht naar het canonieke basenpaar overhelt zodat het grootste deel van de tijd dit paar in zijn klassiek vorm te vinden is. Het kan echter gebeuren dat wanneer het DNA als sjabloon dient tijdens replicatie deze basen in hun tautomere vorm gelezen worden, waarbij Adenine-i met Cytosine een paar aangaat, waarop de puntmutatie volgt. Het Ai:C paar ontstaat tijdens de replicatie en het chemisch evenwicht verwijst uitsluitend naar het paar A:T en Ai:Te, dat voorafgaat aan de replicatie. Te 'gaat dus niet over in C' maar Ai en Te worden gescheiden (de twee strengen worden gescheiden) waarbij op de plaats van Te een C komt tegenover Ai.
    Overigens dit hele verhaal gaat ook op voor Guanine en Cytosine.
    Je vragen zijn heel goed en ik kan alleen antwoorden met wat ik erover gelezen en ervan onthouden heb. Ik denk ook dat inderdaad dat teruggaande pijltje van Ai:C naar Ai:Te niet klopt. Dat moet ik weghalen. Je hebt ook gelijk voor wat betreft het aangeven van de tautomeren, dat maakt de informatie compleet. Nog veel te doen dus.

    Of Watson en Crick wisten dat er enzymen nodig zijn voor DNA replicatie, is ook een goede (retorische?) vraag. Ik heb daar natuurlijk geen antwoord op, maar misschien kom ik wat tegen en laat het je weten. Misschien staat het wel in Wikipedia ;-)? (Ik denk van niet).

  9. Marleen, ik ben blij dat ik nuttige vragen heb gesteld!
    Dat terwijl zaken als 'protontunneling' volkomen boven mijn pet gaan :-)
    Ik wacht af...
    Ik denk overigens dat Watson & Crick niet gauw op het idee kwamen dat er voor replicatie enzymen nodig zouden kunnen zijn. Crick was een fysicus, and Watson??? Baseparing was de oplossing!!! What else??? De jaren na 1953 hield Crick zich bezig met het ontrafelen van de genetische code, en daar had hij de handen aan vol!

  10. Marleen, goed om te lezen dat je nog steeds bezig bent met kwantumbiologie.
    N.a.v. de blog van Gert heb ik wat gelezen over non-canonical DNA en daarbij ook iets over proton tunneling gevonden. Heel boeiend dat protonen kunnen oversteken van het ene molecuul naar het andere, waarbij minder energie nodig is dan je op chemische kenmerken zou verwachten.
    Ik las het artikel 2013 - Randomness and Multi-level Interactions in Biology.
    En daarin staat o.a. dit m.b.t. proton tunneling:
    As far as DNA is concerned, Perez et al. (2010) showed that nuclear quantum effects such as tunnelling and zero point motion destabilize rare tautomeric enol forms through the transfer of two hydrogen-bonded protons between adenine and thymine and between cytosine and guanine, thus confirming the suggestion by Watson and Crick in their 1953 paper of a role of prototropic tautomerism of bases in the induction of spontaneous point mutations.

    Deze auteurs stellen dat Watson en Crick al in hun 1953 paper over tautomeren van DNA schreven!
    Bedoeld zal zijn hun tweede paper van 1953, die moet nog verder doornemen.

  11. Rolie, kwantumbiologie blijft op de achtergrond doorklinken. Er is weer een vrij nieuw artikel van Al-Khalili waarin aangegeven wordt dat de tunneling via de tautomeren Ai-Te statistisch erg onwaarschijnlijk is. Dat van de tautomeren van G en C daarentegen weer wel. Ik zal het artikel zo gauw mogelijk in Wikipedia zetten, dan kun je de link ernaar daar eventueel lezen. Dit omdat Gerts reactieruimte niet al teveel linkjes verdraagt. De titel is: Quantum and classical effects in DNA point mutations: Watson–Crick tautomerism in AT and GC base pairs van Slocombe et al. 2021

    Zowel het eerste paper als het tweede van Watson en Crick uit 1953 spreken van tautomeren. In het eerste worden ze genoemd en in het tweede hebben ze het over de kans waarmee ze zich kunnen vormen.

    Ik heb er wat citaten uitgehaald

    Uit het eerste (25 april 1953): Molecular structuur of nucleic acids

    “If it is assumed that the bases only occur in the structure in the most plausible tautomeric forms (that is, with the keto rather than the enol configurations) it is found that only specific pairs of bases can bond together. These pairs are: adenine (purine) with thymine (pyrimidine), and guanine (purine) with cytosine (pyrimidine)”

    Uit het tweede (30 Mei 1953): Genetical implications of the structure of deoxyribonucleic acid

    “Our model suggests possible explanations for a number of other phenomena. For example, spontaneous mutation may be due to a base occasionally occurring in one of its less likely tautomeric forms. Again, the pairing between homologous chromosomes specific at meiosis may depend on pairing between i bases. We shall discuss these ideas in detail elsewhere,

    We believe that the bases will be present almost entirely in their most probable tautomeric forms. If this is true, the conditions for forming hydrogen bonds are more restrictive, and the only pairs of bases possible are: 
    adenine with thymine; guanine with cytosine. 

    Wederom geen linkjes, maar ook die zullen te vinden zijn in Wikipedia. Bedankt Rolie en Gert, dankzij jullie suggesties ben ik wat verder gekomen met de tautomeren.

    Proton-tunneling is inderdaad een boeiend fenomeen. Daarover valt nog te zeggen, ook voor Gert, dat het erom gaat dat protonen, net als fotonen, qauntums zijn (pakketjes energie) die zich ofwel als deeltjes kunnen gedragen ofwel zich als golven kunnen ‘verplaatsen’. In het laatste geval kunnen ze kennelijk barrières overwinnen die met ‘gewone’ chemie niet haalbaar zijn. Ik hoor graag een (kwantum)fysicus die dit kan bevestigen of beter kan uitleggen.

  12. Gert,
    hier vond ik in het tweede artikel van Watson & Crick uit 1953 hun ‘kennis’ of verwachtingen omtrent het bestaan van een specifieke polymerase.

    “Whether a special enzyme is required to carry out the polymerization, or whether the single helical chain already formed acts effectively as an enzyme, remains to be 

  13. Marleen, wat Watson&Crick over most probable en less probable tautomeric forms van de bases in 1953 hebben gezegd kan niet op degelijk onderzoek gebaseerd zijn, gezien dat er anno 2021 (L. Slocombe) nog steeds actief onderzoek naar gedaan wordt en men er kennelijk nog steeds niets definitief over kan zeggen! Verbazingwekkend!

    Watson&Crick: "“Whether a special enzyme is required to carry out the polymerization, or whether the single helical chain already formed acts effectively as an enzyme, remains to be seen.”"

    Ik concludeer: Watson&Crick hielden het toen voor mogelijk dat DNA replicatie mogelijk was puur op basis van AT en CG base paring, zonder gespecialiseerde enzymen.
    Nu dus ondenkbaar.
    Bedankt voor je bijdrage aan de discussie op dit blog.

  14. Bedankt Marleen voor de citaten uit Watson & Crick, van de tweede heb geen goede pdf.
    Je beschrijving van het tunneleffect is prima.
    Er is een prachtig experiment gedaan om de golfdeeltje dualiteit zichtbaar te maken met behulp van walking droplets.
    Zie: https://www.youtube.com/watch?v=WIyTZDHuarQ
    Hier zie je behalve interferentieverschijnselen (van deeltjes dus!) ook een illustratie van het tunneleffect.
    Voor 't geval dat je denkt dat het alleen spielerei is, lees dan:
    2014 - Why bouncing droplets are a pretty good model of quantum mechanics

  15. Dank ook aan Gert en Rolie, ik ga de YouTube bekijken. Ondertussen stuur ik een link naar deze PDF (het tweede artikel van Watson en Crick uit 1953). Ik ben bezig daar een Word document van te maken. Mocht iemand interesse hebben laat het dan weten.


  16. Dank Marleen voor de pdf. Het is leesbaar. Ik vond hem ook in The Eighth Day of Creation. De 2e publicatie van W&C zou natuurijk gratis beschikbaar moeten zijn!!!

    Rolie: dank voor de link. Ik kende Veritasium van andere videos. Hij is erg goed! De goede man heeft bijna 2 miljard ! hits in totaal!


Comments to posts >30 days old are being moderated.
Safari causes problems, please use Firefox or Chrome for adding comments.