18 October 2025

Genes from random DNA? Is it really possible?

random DNA (source)

Can a random DNA sequence contain a gene by pure chance? If a 'gene' is defined as a sequence consisting of a number of bases that is divisible by three, starts with a START codon and ends with a STOP codon, then simple statistics show that genes can be found in random DNA. But, do random genes exist in reality?

ORF = Open Reading Frame.
ORF length distribution of random DNA in base pairs
found in random DNA of 50 million bases.
Vertical: number of ORFs with a specific length using a logarithmic scale
Horizontal axis: ORF length in base pairs [bp]
ORF: sequence of triplets between START (ATG) and STOP (TAA)
© Rolie Barth

Yes, short 'genes' can easily be found in random DNA by pure chance if the random sequence is long enough. The presence of START and STOP codons determines the length of the gene. START and STOP codons are triplets and consist of three bases (nucleotides). Everything between the START and STOP must consist of triplet codons. A STOP codon terminates the synthesis of each protein. The distance between a START and a STOP codon equals the length of a potential protein-coding gene. If that length is short, the corresponding protein will be too short to be useful. The START and STOP codons occur by chance in a random sequence. Therefore, the gene length is distributed according to statistical laws. The length of a gene is important. The statistics show that the maximum gene length found in a string of random DNA of 50 million bases is 354 base pairs = 118 triplet codons. See figure above. If transcribed and translated, those sequences would produce a protein of 118 amino acids in length. In the above simulation, most of the hypothetical genes are less than 150 base pairs or 50 amino acids in length. Proteins smaller than 50 amino acids are called peptides. A number of peptides are useful, but most functional proteins in animals and plants are much longer: on average 486 amino acids. 

In the above computer simulation, only one STOP codon is used for simplicity. That's why mainly peptides are found. If all 3 STOP codons are used in the simulation, ORFs are almost twice as short [2]. On the other hand, if a random sequence would have the length of the human genome, that is 3.5 billion base pairs or 60 times bigger than in the above simulation, than the maximum length of the hypothetical genes would 470 bp. That is 1.35x longer [2]. 

In hindsight, it is not surprising that 'genes' can be found in random DNA. The beauty of the genetic code is that any 3-letter combination of A, T, C, G is a valid codon, including START and STOP codons. That means, that any such a sequence is potentially a protein-coding gene. The similarity between real and random genes is that they consist of a sequence of the same 4 letters A, T, C, G. On that level they cannot be discriminated. The differences lie elsewhere (see below). 

Interestingly, from the above computer simulation, several mathematical laws emerge. 

  1. The first law: there is a maximum length of genes when a 'gene' is defined as a sequence between START and STOP, and it consists exclusively of triplets of bases (total length is divisible by 3). 
  2. The second law is: the maximum length of a 'gene' depends on the length of the random sequence. The larger the random sequence, the larger the genes. 
  3. The third law is:  gene length is bigger when only 1 STOP codon is used instead of standard 3 STOP codons (results not shown here). 

Mathematicians call the graph a Power Law. Please keep in mind that all this is purely mathematics. It depends on the underlying assumptions whether the results apply to living organisms. For now, it seems that genes of useful length could be found in random DNA with the length of the human genome (3.5 billion base pairs).

But does this sort of mathematics apply to the real world? Does random DNA exist in the real world? Yes, it could be. Our genome consists of 90% 'junk'. Junk DNA is not pure random DNA, it has an evolutionary history. It is subject to random mutation and decay. Therefore, it approaches random DNA. So, there are ample opportunities to find genes in junk DNA. Curious genome researchers have searched for functional random genes in real genomes. But first: how do you detect those random genes? How do you discriminate between 'normal' genes and 'random' genes? Again, both are a series of 4 letters in a sequence. Random sequence genes must be novel genes or de novo genes. They are also called orphan genes for obvious reasons. Since they are created from scratch, they do not have identical or similar genes in the genomes of closely related  species. Furthermore, the sequence of the putative gene must be present in non-coding DNA of closely related species in the same location on the chromosome. A researcher concluded:

"Although considered an extremely unlikely event, many genes emerge from previously noncoding genomic regions. (..) De novo genes arise from previously noncoding DNA, are short, and are expressed at low levels. (...) While most of the de novo genes are lost, a fraction of them becomes essential. [3]

Intriguingly, the ORFs of de novo genes are shorter than those of evolutionary old genes, but longer than expected by chance according to this researcher. We have seen in the above computer simulation that random genes tend to be smaller than real genes. Even more surprising, de novo genes can become essential.

In humans, at least three human protein-coding genes have emerged since the divergence with chimps some 7 million years ago. These loci are noncoding DNA in other primates (that is part of the definition of random genes). Other studies  estimate that 18 such cases are present in a genome of 24,000 protein-coding genes [4]. That's interesting, but the problem with this method is that the noncoding sequences could be the modified descendants of ancient genes or pseudo-genes. So, we cannot be 100% sure that they are truly random.

In 2013 genome researcher Sean R. Eddy proposed the Random Genome Project

"Suppose we put a few million bases of entirely random synthetic DNA into a human cell. (...). Will it be reproducibly transcribed into mRNA-like transcripts, reproducibly bound by DNA-binding proteins, and reproducibly wrapped around histones marked by specific chromatin modifications? I think yes." [1] 

Exactly this experiment has been done recently [5]. Investigators inserted a synthetic DNA sequence in yeast and in mouse cells. In yeast cells, the DNA was being read (transcriptional activity), but the mouse cells did nothing. The researchers concluded that regulatory DNA elements are required in order for the gene to be read. But reading a gene is only the first step. The product (mRNA) must be transported to the cytoplasm and translated by ribosomal machinery and transfer-RNA (tRNA) to a protein. Furthermore, the resulting protein must be able to fold in to a functional 3D form. A further requirement is that the new protein must fit into the existing network of biochemical reactions of the cell and the organism. Of course it does matter whether the gene is active in every cell of the organism, or just in specific tissues or organs. Also, in what quantities it is produced. And whether it is produced in the embryo or in the adult, in males or in females. A lot of requirements indeed. No wonder that there aren't a lot of genes that originate from random DNA.

The discussion so far is about the origin of new genes from random DNA in real genomes of real organisms belonging to real species. But ultimately, the very first genes on Earth must have a random origin. How else could they originate? They have no ancestors. One genome researcher, Senapathy [6], did computer simulations like the simulations discussed here and has put forward a theory that long ago animals and plants originated in primordial ponds from random DNA genomes. For a few thousand reasons, genomes cannot be created from random DNA fragments ('genes'), and organisms cannot be created from random genomes. The ultimate reason is DNA- or genome centrism: the idea that a genome can create an organism. My next blog will be about 'DNA-centrism'.


 

Notes

  1. Sean R. Eddy (2013) The ENCODE project: Missteps overshadowing a success,   
  2. Personal communication Rolie Barth, author of De kosmos en het leven - een Meesterwerk. (see also: korthof58.htm Note 507)
  3. Christian Schlötterer (2015) Genes from scratch—the evolutionary fate of de novo genes. 2015. Open Access.
  4. David G Knowles, Aoife McLysaght  (2009) Recent de novo origin of human protein-coding genes.
  5. Brendan R. Camellato, et al (2024)  Synthetic reversed sequences reveal default genomic states Open Access. Published: 06 March 2024. "The locus was designed by reversing but not complementing human HPRT1".
  6. Periannan Senapathy (1994) 'Independent Birth of Organisms. A New Theory That Distinct Organisms Arose Independently From The Primordial Pond Showing That Evolutionary Theories Are Fundamentally Incorrect'. (review).

29 September 2025

Op heterdaad betrapt midden in de nacht: Segrijn slakken eten kitlaag van de ramen (+updates)

De schilder die ons huis aan het schilderen was, merkte op dat de kitlaag van de ramen aangetast was. Eerlijk gezegd was het mij nog niet opgevallen. Het kwam door slakken zei hij. Hij raadde dubbelzijdig plakband aan. Maar ik vond het nogal bizar dat slakken een (giftige?) kunststof zouden eten. Er is toch voedsel genoeg in de tuin?

Ik wilde eerst weten of het hele verhaal klopte. Ik had nooit slakken op de kitrand gezien. Dat zou dan 's nachts moeten gebeuren? Er was maar één manier om het raadsel op te lossen: die slakken op heterdaad betrappen. Ik wilde 's nachts de Seissiger wildcamera opstellen. Toen ik in het donker de tuin in liep, hoorde ik gekraak onder mijn voeten. En ja hoor: ik trapte op een slak. LED-lampje er bij gehaald: het wemelde van de slakken op het pad. Gefotografeerd en ingevoerd in waarneming: bijna allemaal Segrijnslakken. Ze hebben een grotere schelp dan de bekende huisjesslakken en de schelp heeft allerlei patronen en is fraai gekleurd. De soort komt van oorsprong uit Zuid-Europa. Volgens waarneming.nl heeft de soort inmiddels de status 'algemeen' en 'inheems' en dus niet 'exoot'. Ze eten vooral tuinplanten en zouden zelf ook goed te consumeren zijn! Dat laatste was ik niet van plan.

Dit zijn de slakken die ik 's avonds tegen tienen aantrof op het tuinpad:

Segrijnslak 17 sep 21:36 FP5 ©GK

Segrijnslak 17 sep 21:37 FP5 ©GK

Segrijnslak 17 sep 21:38 FP5 ©GK

Segrijnslak 17 sep 21:39 FP5 ©GK

Zwartgerande tuinslak 17 sep 21:40 FP5 ©GK

Maar goed: 's avonds slakken op het tuinpad is nog geen bewijs dat ze ook van de kitlaag eten. Ik heb de wildcamera op timelapse gezet: iedere 5 min een opname. Op de sensor zetten werkt niet voor deze kleine en langzame dieren. En inderdaad, van 00:35 tot 03:30 u., was er een slak actief op de kitrand. Op heterdaad betrapt! Zo'n 3 uur op dezelfde plek!  

Seissiger wildcamera 19 sep 2025 00:30
Rode pijl: slak op de crime scene.
Groene pijlen: 2 aangetaste plekken.

Uit de opnames blijkt dat de slak naar een nieuwe plek is gekropen:

Seissiger wildcamera 19 sep 2025 00:35  
Op heterdaad betrapt. Rode pijl: slak.
Groene pijlen: 2 aangetaste plekken
 

Nadat hij zijn buikje vol gegeten had met de overheerlijke kit, verdween hij weer. De volgende ochtend was er een derde aantastingsplek te zien op de plek waar de slak bezig was geweest. Ik acht het voor 100% bewezen dat slakken de kit opeten. En voor 99% zeker dat het de Segrijnslak was. Omdat het donker was en de opnames in zwart-wit zijn, kan ik niet met 100% zeker concluderen dat het om deze soort gaat. Als je het 100% zeker wilt weten, zou je het DNA in de uitwerpselen moeten analyseren.  

De vraatsporen zijn vaak geribbeld en ongeveer 1 cm lang. Vaak vind je een langwerpig uitwerpsel in de buurt. Dat is een hint.  

Zo herken je de slak:
schade beeld in de kit met uitwerpsel
 

Segrijnslak in zijn natuurlijke milieu:

Segrijnslak op klimhortensia (SONY A6700 +macro)

detail van de kop

Gebeld met het schildersbedrijf. Ze stuurden vrij snel een glaszetter die de kitlaag begane grond verving door een ander product die de slakken niet zouden lusten. Ieder zijn vak. De kit is nu een week oud zonder schade.

Jika Sikaflex beglazingskit.

Update 7 Okt 25

Aan de voorkant van het huis was de kit nog niet vervangen en ik betrapte een 100% Segrijnslak op heterdaad op klaarlichte dag! 

100% Segrijnslak Cornu aspersum 7 Okt 2025 13:40u

Hij was op dat moment 'in rust', maar hij zat op een aangetaste plek op de kit. Het is nu 100% bewezen dat het Segrijnslakken de kit aantasten. Ik heb hem voorzichtig los gemaakt en in het bos gezet. Ik heb nog geen gewone huisjesslakken dit zien doen.

Segrijnslak (juveniel) 14 Okt 25. Zat op de oude kitlaag
's ochtends vroeg aangetroffen en meegenomen voor de foto.

Hij was actief aan het kruipen toen ik hem naar binnen haalde voor de foto. Bij wijze van experiment heb ik hem op de nieuwe slakken-bestendige kit gezet. Hij had geen belangstelling, hij kroop gewoon weg. Het kan zijn dat al zijn buikje vol had... 
 


Bronnen

Segrijnslak (wikipedia):  

  • "De segrijnslak is een nachtdier." (klopt!). 
  • "In Nederland en België is deze slakkensoort niet inheems, maar toch wijd verspreid". Waarneming.nl noemt de soort "algemeen, inheems".
  • Exoot: "In andere werelddelen is de segrijnslak een succesvolle exoot, die na de introductie tot plagen kan leiden."
  • "Segrijnslak als plaagdier": maar er staat niets over het eten van kit. Misschien kan hij bestanddelen van de kit (kalk?) gebruiken voor de opbouw van zijn huisje?
  • Gastronomie: "De segrijnslak is zeer gewaardeerd als escargot."


14 September 2025

Vrouwelijk topmodel gezocht en gevonden. Dit vrouwtje Wespspin blijkt het ideale fotomodel!

Wespspin ♀ 27 aug 2025 Sony A6700 + 90mm macro ©GK

Het gebeurt zelden dat een vrouwelijk fotomodel zich vrijwillig aanbiedt. Zeker niet om vervolgens 2 dagen en nachten stil te blijven zitten. En al helemaal niet dat ze toestaat om haar heel dicht te benaderen. 

Dit vrouwtje Wespspin bleek een ideaal fotomodel. Ze is exotisch mooi. Ze had zelf voor de ideale witte achtergrond gezorgd. Op ooghoogte. Perfecte keuze. Normaal bouwen wespspinnen hun web dicht bij de grond tussen het gras. Dan zijn ze moeilijk te fotograferen. Vandaar dat ik zo blij was met dit vrouwtje. Het is uitzonderlijk dat je macrofoto's kunt maken van een levende spin. Ik had nooit eerder een wespspin gezien. Dit was mijn eerste.

De Wespspin Argiope bruennichi (Wasp Spider) is een spin afkomstig uit Zuid-Europa. De soort wordt aangetroffen in graslanden die zelden gemaaid worden maar ook in heidevelden. Vandaar dat het belangrijk is voor natuurbeheerders om dit soort graslanden niet te maaien!

Wespspin 28 aug 2025 Sony A6700 90 mm macro f/14,0 1/125 ISO400 ©GK

Wespspin 28 aug 2025 Sony A6700 90 mm macro f/8,0 1/125 ISO100  ©GK

De spin heeft 2 primaire ogen en 4 extra secundaire ogen. De primaire ogen zijn naar voren gericht. Van de extra ogen is de linker naar links, en de rechter naar rechts gericht. Zij moet mij en de camera dus uitstekend gezien hebben! En toch blijft ze stil zitten. Wonderlijk! Hoewel, als je er over nadenkt, als er iemand een geduldig karakter zou moeten hebben, dan is het wel een spin. Hartelijk dank voor je geduld! Je bent het beste fotomodel dat ik ooit gehad heb!

De wespspin richt zich vooral op springende en laagvliegende prooien zoals sprinkhanen, libellen en kevers, die tussen de grassen leven. Ik heb inderdaad in het hoge gras rondom het huisje een Grote groene sabelsprinkhaan, een Bruinrode heidelibel en een Hennepnetelgoudhaan (is een kever) gezien. Dat zou dus allemaal kunnen kloppen. We hebben hier te maken met een klein deel van een ecosysteem!

 

Grote groene sabelsprinkhaan ©GK
Bruinrode heidelibel ©GK

Hennepnetelgoudhaan  ©GK


 

Bronnen

  • Waarneming.nl: Wespspin. Opmerkelijk: de soort wordt niet (meer?) aangemerkt als 'exoot'.
  • Jan van Duinen heeft een diepgaande studie gemaakt van de levenscyclus van wespspinnen in zijn tuin met ontzettend veel mooie foto's. 
  • Wespspin (wikipedia). 

 

Postscript

Rolie Barth maakte mij erop attent dat deze wespspin maar 5 poten heeft! Laat ik dat nu totaal 100% over het hoofd gezien hebben! Ik was zo gefocust op een goede foto maken dat ik niet gezien heb dat er 3 poten ontbraken. Een blunder. We hebben hier dus te maken met een beschadigd vrouwtje Wespspin. Ik weet niet of dat iets te maken heeft met haar lethargisch gedrag.