L’ADN est le principal constituant des chromosomes présents dans nos noyaux cellulaires. L’information génétique est contenue dans notre ADN, on peut donc dire que notre ADN est le “support de l’information génétique”. Cette information génétique permet la fabrication des protéines qui gèrent la quasi totalité de nos fonctions biologiques.
Composition de la molécule ADN
La molécule ADN est constituée d’un grand nombre de nucléotides (environ 3,3 milliards de paires de nucléotides) qui vont permettre la création d’acides aminés, composants des protéines. On compte 4 sortes de nucléotides (appelés aussi bases) symbolisés par les lettres A, C, G et T respectivement nommés Adénine, Cytosine, Guanine et Thymine. Un nucléotide est une structure chimique composée d’une base azotée, d’un phosphate et d’un sucre.
Ces quatre nucléotides suffisent pour coder la fabrication de 20 acides aminés présents dans notre corps. Des chaines de 100 à 1000 acides aminés vont constituer les protéines qui sont les “hommes à tout faire” de notre corps. Les protéines vont en effet permettre le bon fonctionnement de nos organes, de nos yeux, nos muscles et de toutes les fonctions vitales de notre organisme.
Les milliers de protéines présentes dans notre corps gèrent toute notre activité biologique en passant par la création de molécules ou par la transmission d’informations. Les protéines qui ont une activité de catalyseur sont appelées des enzymes. Ainsi la protéine qui permet de copier une molécule ADN en deux molécules ADN identiques est une enzyme appelée ADN polymérase.
Notre ADN est composé de deux brins, plus exactement de deux chaines complémentaires de nucléotides. Les deux chaines sont complémentaires car il existe une complémentarité chimique qui fait que la Guanine fait toujours face à la Cytosine et l’Adénine toujours face à la Thymine à l’aide de liaisons moléculaires appelées “liaisons hydrogènes” (3 pour le couple G-C et 2 pour le couple A-T). On peut représenter ces deux brins de manière schématique :
Les gènes – notre information génétique
Les zones d’ADN qui codent pour la création de protéines sont appelées les gènes. On compte ainsi près de 32000 zones codantes pour la fabrication de protéines, soit 32000 gènes (ce qu’on appelle aussi le génome = L’ensemble des gènes constitue le génome). Les autres zones sont non codantes, car elles ne codent pas pour la fabrication de protéines… Cependant, ces régions non codantes ne sont pas inutiles pour autant.
De récentes études ont montré qu’elles pouvaient avoir un rôle de régulation des protéines. Ces zones non codantes ont tout de même un rôle important dans nos fonctions biologiques et elles sont surtout très utiles pour les analyses de la police scientifique. On considère que les zones non codantes couvrent environ 98% de notre ADN.
L’héritage de notre père et notre mère nous donne 23 paires de chromosomes, ce qui fait que nous avons deux exemplaires de chaque gène, un premier hérité de notre mère et un second de notre père. Ces gènes sont bien ordonnés et ainsi chaque gène aura sa position géographique bien précise sur un chromosome en particulier. La position exacte d’un gène particulier sera la même pour tous les êtres humains.
Le locus et les polymorphismes de l’ADN
La position d’un gène ou d’une séquence d’ADN non codant est appelée “locus”. Pour une zone d’ADN codant, le locus est identifié avec le nom de la protéine codée. Pour les zones d’ADN non codant, chaque locus est nomenclaturé selon un code bien précis :
• La lettre D
• La numérotation du chromosome (1, 2, 3 ….., 21, 22, X, Y)
• Le type de séquence ADN que l’on trouve sur le locus: S séquence unique, Z séquence se répétant sur un même chromosome à plusieurs emplacements, F séquence se répétant sur différents chromosomes
• Nombre qui confère un caractère unique et qui correspond à l’ordre de découverte de la région considérée
Ainsi le locus D18S51, région d’ADN utilisée par la police scientifique, est situé sur le chromosome 18, il supporte une séquence de nucléotide que l’on ne retrouve pas ailleurs (S) et il porte le numéro 51 soit D18S51. La police scientifique utilise cette nomenclature pour donner des résultats d’analyse génétique :
Les êtres humains font partie de la même espèce et on note beaucoup de similitudes dans l’enchaînement des nucléotides. En prenant deux personnes au hasard, on trouve environ 1 nucléotide différent tous les 1200 nucléotides. Toutefois, l’extraordinaire diversité de notre espèce prend sa source dans les variations de nos séquences d’ADN.
Ces variations inter-individus sont appelées des polymorphismes. L’analyse d’une trace ADN nous permet d’observer ces variations et de les comparer avec celles du profil génétique d’un individu. Lorsque toutes les variations sont identiques, on peut alors réaliser une identification de la trace.
La Police Technique et Scientifique utilise des polymorphismes présents dans les zones non codantes de notre ADN qui sont des polymorphismes de longueur. Dans ces zones non codantes, on trouve des séquences répétitives, comme par exemple le groupe de nucléotides AAGTA qui va se répéter plusieurs fois d’affilé. Le nombre de répétitions de ce groupe de nucléotides peut varier d’un individu à l’autre. Cette séquence AAGTA peut se répéter 12 fois chez un individu, 13 fois chez un deuxième individu ou 15 fois chez un troisième individu. La taille du fragment sera proportionnelle au nombre de répétitions de la séquence et c’est pour cela que l’on parle de polymorphisme de longueur.
Le terme employé pour évoquer ces variantes entre individus est le terme d’allèle. Ce terme d’allèle est utilisé pour tous les caractères génétiques polymorphes. Si on prend l’exemple des groupes sanguins, ABO il existe trois allèles, A, B et O. Si on prend l’exemple d’une zone d’ADN non codant, les allèles vont être le nombre de répétitions d’une séquence de nucléotides.
Un individu va posséder à chaque fois deux allèles pour chaque caractère génétique, un allèle présent sur le chromosome paternel et un allèle présent sur le chromosome maternel. Pour les groupes sanguins, un individu peut donc posséder les allèles A et B (groupe sanguin AB), les allèles A et A (groupe A) ou encore les allèles A et O (groupe sanguin A). Pour les répétions de séquence, dans le cas de la séquence AAGTA un individu pourra posséder les allèles 12 et 13 qui correspondent à 12 et 13 répétitions de AAGTA et un autre les allèles 9 et 13 (cf ci-contre)
Les séquences répétitives de nucléotides : les STR et les VNTR
Si la séquence qui se répète est composée d’au moins sept nucléotides, on parle de VNTR (Variable Number Tandem Repeats) ou minisatellite, mais si la séquence qui se répète est plus petite, on parle de STR (Short Tandem Repeat) ou microsatellite.
Les séquences courtes de type STR ont fini par s’imposer en police scientifique du fait de leurs nombreux avantages : elles sont nombreuses (environ 50 000 séquences de ce type dans l’ADN humain) et peuvent être analysées de manière simultanée (analyse en multiplex). En revanche, elles souffrent parfois d’un polymorphisme limité.
Les zones d’ADN dans lesquelles sont présentes des variations sont souvent appelées des “marqueurs génétiques” (synonyme de locus marqueur). Lorsque les marqueurs génétiques sont des zones non codantes, la variation est visible par le nombre de répétitions d’une séquence.
Lorsque les marqueurs sont des zones codantes, la variation est visible sur le gène et se traduit sur la protéine correspondante. Ainsi, pour les groupes sanguins A, B et O l’analyse du marqueur génétique peut se faire sur le gène, mais aussi sur la protéine codée par le gène.