Qu'est-ce qu'un code génétique en définition biologique. Code génétique : description, caractéristiques, historique de la recherche

Le code génétique est un cryptage spécial informations héréditairesà l'aide de molécules Sur cette base, les gènes contrôlent de manière appropriée la synthèse des protéines et des enzymes dans le corps, déterminant ainsi le métabolisme. À leur tour, la structure des protéines individuelles et leurs fonctions sont déterminées par l'emplacement et la composition des acides aminés - les unités structurelles de la molécule protéique.

Au milieu du siècle dernier, des gènes ont été identifiés qui constituent des sections distinctes (en abrégé ADN). Les unités nucléotidiques forment une double chaîne caractéristique, assemblée en forme d'hélice.

Les scientifiques ont découvert un lien entre les gènes et la structure chimique des protéines individuelles, dont l'essence est que l'ordre structurel des acides aminés dans les molécules protéiques correspond pleinement à l'ordre des nucléotides dans le gène. Après avoir établi ce lien, les scientifiques ont décidé de déchiffrer le code génétique, c'est-à-dire établir des lois de correspondance entre les ordres structurels des nucléotides de l'ADN et des acides aminés des protéines.

Il n'existe que quatre types de nucléotides :

1) A - adényle;

2) G - guanyle;

3) T - thymidyle ;

4) C - cytidyle.

Les protéines contiennent vingt types d’acides aminés basiques. Des difficultés sont apparues pour déchiffrer le code génétique, car il contient beaucoup moins de nucléotides que d'acides aminés. Pour résoudre ce problème, il a été proposé que les acides aminés soient codés par diverses combinaisons de trois nucléotides (le soi-disant codon ou triplet).

De plus, il était nécessaire d’expliquer exactement comment se situent les triplets le long du gène. Ainsi, trois grands groupes de théories sont apparus :

1) les triplés se succèdent continuellement, c'est-à-dire former un code continu ;

2) les triolets sont disposés avec des sections alternées « dénuées de sens », c'est-à-dire des « virgules » et des « paragraphes » sont formés dans le code ;

3) les triplets peuvent se chevaucher, c'est-à-dire la fin du premier triolet peut former le début du suivant.

Actuellement, la théorie de la continuité du code est principalement utilisée.

Le code génétique et ses propriétés

1) Le code est triplet - il consiste en des combinaisons arbitraires de trois nucléotides qui forment des codons.

2) Le code génétique est redondant – ses triplets. Un acide aminé peut être codé par plusieurs codons, car, selon les calculs mathématiques, il y a trois fois plus de codons que d'acides aminés. Certains codons remplissent des fonctions de terminaison spécifiques : certains peuvent être des « signaux d'arrêt » qui programment la fin de la production d'une chaîne d'acides aminés, tandis que d'autres peuvent indiquer le début de la lecture du code.

3) Le code génétique est sans ambiguïté : chaque codon ne peut correspondre qu'à un seul acide aminé.

4) Le code génétique est colinéaire, c'est-à-dire la séquence de nucléotides et la séquence d'acides aminés se correspondent clairement.

5) Le code est écrit de manière continue et compacte ; il ne contient pas de nucléotides « dénués de sens ». Il commence par un triplet spécifique, qui est remplacé par le suivant sans interruption et se termine par un codon stop.

6) Le code génétique est universel : les gènes de tout organisme codent des informations sur les protéines exactement de la même manière. Cela ne dépend pas du niveau de complexité de l’organisation de l’organisme ni de sa position systémique.

Science moderne suggère que le code génétique apparaît directement lors de la génération d'un nouvel organisme à partir de la matière osseuse. Les changements aléatoires et les processus évolutifs rendent possibles toutes les variantes de code, c'est-à-dire les acides aminés peuvent être réorganisés dans n’importe quel ordre. Pourquoi ce type particulier de code a-t-il survécu au cours de l’évolution, pourquoi le code est-il universel et a-t-il une structure similaire ? Plus la science en apprend sur le phénomène du code génétique, plus de nouveaux mystères surgissent.

- un système enregistrements d'informations héréditaires dans des molécules acides nucléiques comme une séquence de nucléotides. Le code génétique repose sur l'utilisation d'un alphabet composé de seulement quatre lettres-nucléotides, distinguées par des bases azotées : A, T, G, C.

Les principales propriétés du code génétique sont les suivantes :

1. Le code génétique est triple. Un triplet (codon) est une séquence de trois nucléotides codant pour un acide aminé. Puisque les protéines contiennent 20 acides aminés, il est évident que chacun d'eux ne peut pas être codé par un nucléotide (puisqu'il n'y a que quatre types de nucléotides dans l'ADN, dans ce cas 16 acides aminés restent non codés). Deux nucléotides ne suffisent pas non plus pour coder des acides aminés, puisque dans ce cas, seuls 16 acides aminés peuvent être codés. Moyens, le plus petit nombre le nombre de nucléotides codant pour un acide aminé est égal à trois. (Dans ce cas, le nombre de triplets de nucléotides possibles est de 4 3 = 64).

2. La redondance (dégénérescence) du code est une conséquence de sa nature triplet et signifie qu'un acide aminé peut être codé par plusieurs triplets (puisqu'il y a 20 acides aminés et 64 triplets). Les exceptions sont la méthionine et le tryptophane, qui sont codés par un seul triplet. De plus, certains triplés remplissent des fonctions spécifiques. Ainsi, dans la molécule d'ARNm, trois d'entre eux UAA, UAG, UGA sont des codons stop, c'est-à-dire des signaux stop qui arrêtent la synthèse de la chaîne polypeptidique. Le triplet correspondant à la méthionine (AUG), situé au début de la chaîne d'ADN, ne code pas pour un acide aminé, mais remplit la fonction d'initier (exciter) la lecture.

3. Outre la redondance, le code se caractérise par la propriété d'absence d'ambiguïté, ce qui signifie que chaque codon ne correspond qu'à un seul acide aminé spécifique.

4. Le code est colinéaire, c'est-à-dire la séquence de nucléotides d’un gène correspond exactement à la séquence d’acides aminés d’une protéine.

5. Le code génétique est compact et sans chevauchement, c’est-à-dire qu’il ne contient pas de « signes de ponctuation ». Cela signifie que le processus de lecture ne permet pas la possibilité de chevauchement de colonnes (triplets) et, à partir d'un certain codon, la lecture se poursuit en continu, triplet après triplet, jusqu'aux signaux d'arrêt (codons de terminaison). Par exemple, dans l'ARNm, la séquence suivante de bases azotées AUGGGGUGTSUAUAUGUG ne sera lue que par de tels triplets : AUG, GUG, TSUU, AAU, GUG, et non AUG, UGG, GGU, GUG, etc. ou AUG, GGU, UGC, CUU , etc. etc. ou d'une autre manière (par exemple, codon AUG, signe de ponctuation G, codon UGC, signe de ponctuation U, etc.).

6. Le code génétique est universel, c'est-à-dire que les gènes nucléaires de tous les organismes codent de la même manière des informations sur les protéines, quel que soit le niveau d'organisation et position systématique ces organismes.

0

Code génétique est une méthode caractéristique de tous les organismes vivants consistant à coder la séquence d'acides aminés des protéines en utilisant la séquence de nucléotides dans une molécule d'ADN.

La mise en œuvre de l'information génétique dans les cellules vivantes (c'est-à-dire la synthèse d'une protéine codée dans l'ADN) s'effectue à l'aide de deux processus matriciels : la transcription (c'est-à-dire la synthèse d'un ARNm sur une matrice d'ADN) et la traduction (la synthèse d'un chaîne polypeptidique sur une matrice d'ARNm).

L'ADN utilise quatre nucléotides : l'adénine (A), la guanine (G), la cytosine (C), la thymine (T). Ces « lettres » constituent l’alphabet du code génétique. L'ARN utilise les mêmes nucléotides, à l'exception de la thymine, qui est remplacée par l'uracile (U). Dans les molécules d’ADN et d’ARN, les nucléotides sont disposés en chaînes et des séquences de « lettres » sont ainsi obtenues.

La séquence nucléotidique de l'ADN contient des « mots » codés pour chaque acide aminé de la future molécule protéique - le code génétique. Il s'agit d'une certaine séquence d'arrangement de nucléotides dans une molécule d'ADN.

Trois nucléotides consécutifs codent le « nom » d'un acide aminé, c'est-à-dire que chacun des 20 acides aminés est crypté par une unité de code significative - une combinaison de trois nucléotides appelée triplet ou codon.

Actuellement, le code de l'ADN a été complètement déchiffré, et on peut parler de certaines propriétés caractéristiques de ce système biologique unique, qui assure la traduction des informations du « langage » de l'ADN vers le « langage » des protéines.

Le support de l'information génétique est l'ADN, mais comme l'ARNm, une copie de l'un des brins d'ADN, est directement impliqué dans la synthèse des protéines, le code génétique est le plus souvent écrit dans le « langage ARN ».

Acide aminé Triplets codant pour l'ARN
Alanine GCU GCC GCA GCH
Arginine TsGU TsGTs TsGA TsGG AGA AGG
Asparagine AAU AAC
L'acide aspartique GAU GAC
Valin GUU GUTS GUA GUG
Histidine TsAU TsAT
Glycine GGU GGC GGA AAAA
Glutamine CAA-CAG
Acide glutamique GAA GAG
Isoleucine AUU AUC AUA
Leucine TSUU TSUTS TSUA TSUG UUA UUG
Lysine AAAAAG
Méthionine AOÛT
Proline TsTsu TsTs TsTsTsG
Sérine UCU UCC UCA UCG ASU AGC
Tyrosine UAU UAC
Thréonine ACU ACC ACA ACG
Tryptophane UGG
Phénylalanine UUU UUC
Cystéine UGUUGC
ARRÊT UGA UAG UAA

Propriétés du code génétique

Trois nucléotides consécutifs (bases azotées) codent le « nom » d'un acide aminé, c'est-à-dire que chacun des 20 acides aminés est crypté avec une unité de code significative - une combinaison de trois nucléotides appelés triolet ou codon

Triplet (codon)- une séquence de trois nucléotides (bases azotées) dans une molécule d'ADN ou d'ARN qui détermine l'inclusion d'un certain acide aminé dans la molécule protéique lors de sa synthèse.

  • Unicité (discrétion)

Un triplet ne peut pas coder deux acides aminés différents ; il ne chiffre qu’un seul acide aminé. Un codon spécifique correspond à un seul acide aminé.

Chaque acide aminé peut être défini par plus d'un triplet. Exception - méthionine Et tryptophane. Autrement dit, plusieurs codons peuvent correspondre au même acide aminé.

  • Sans chevauchement

La même base ne peut pas apparaître simultanément dans deux codons adjacents.

Certains triplets ne codent pas pour les acides aminés, mais sont particuliers" panneaux routiers", qui déterminent le début et la fin des gènes individuels (UAA, UAG, UGA), dont chacun signifie l'arrêt de la synthèse et se situe à la fin de chaque gène, on peut donc parler de la polarité du code génétique.

Chez les animaux et les plantes, les champignons, les bactéries et les virus, le même triplet code pour le même type d'acide aminé, c'est-à-dire que le code génétique est le même pour tous les êtres vivants. En d’autres termes, l’universalité est la capacité du code génétique à fonctionner de la même manière dans des organismes de différents niveaux de complexité, depuis les virus jusqu’aux humains. L'universalité du code ADN confirme l'unité d'origine de toute vie sur notre planète. Les méthodes de génie génétique reposent sur l'utilisation de la propriété d'universalité du code génétique.

De l'histoire de la découverte du code génétique

Pour la première fois l'idée d'existence code génétique formulé par A. Down et G. Gamow en 1952 - 1954. Les scientifiques ont montré que la séquence nucléotidique qui détermine de manière unique la synthèse d'un acide aminé particulier doit contenir au moins trois unités. Il a été prouvé plus tard qu'une telle séquence est constituée de trois nucléotides appelés codon ou triolet.

La question de savoir quels nucléotides sont responsables de l'inclusion d'un acide aminé particulier dans une molécule protéique et combien de nucléotides déterminent cette inclusion est restée en suspens jusqu'en 1961. L'analyse théorique a montré que le code ne peut pas être constitué d'un seul nucléotide, puisque dans ce cas, seuls 4 acides aminés peuvent être codés. Cependant, le code ne peut pas être un doublet, c'est-à-dire qu'une combinaison de deux nucléotides d'un « alphabet » de quatre lettres ne peut pas couvrir tous les acides aminés, puisque seules 16 de ces combinaisons sont théoriquement possibles (4 2 = 16).

Pour coder 20 acides aminés, ainsi qu'un signal d'arrêt indiquant la fin de la séquence protéique, trois nucléotides consécutifs suffisent, lorsque le nombre de combinaisons possibles est de 64 (4 3 = 64).

Ils s'alignent en chaînes et produisent ainsi des séquences de lettres génétiques.

Code génétique

Les protéines de presque tous les organismes vivants sont constituées de seulement 20 types d’acides aminés. Ces acides aminés sont appelés canoniques. Chaque protéine est une ou plusieurs chaînes d'acides aminés reliées dans une séquence strictement définie. Cette séquence détermine la structure de la protéine, et donc toutes ses propriétés biologiques.

C

CUU (Leu/L)Leucine
CUC (Leu/L)Leucine
CUA (Leu/L)Leucine
CUG (Leu/L)Leucine

Dans certaines protéines, des acides aminés non standards, comme la sélénocystéine et la pyrrolysine, sont insérés par un ribosome lisant le codon stop, en fonction des séquences dans l'ARNm. La sélénocystéine est désormais considérée comme le 21ème, et la pyrrolysine, le 22ème, des acides aminés qui composent les protéines.

Malgré ces exceptions, tous les organismes vivants possèdent un code génétique caractéristiques communes: un codon est constitué de trois nucléotides, les deux premiers étant décisifs ; les codons sont traduits par l'ARNt et les ribosomes en une séquence d'acides aminés.

Écarts par rapport au code génétique standard.
Exemple Codon Signification normale Se lit comme :
Certains types de levure Candidose C.U.G. Leucine Sérine
Les mitochondries, en particulier dans Saccharomyces cerevisiae CU(U, C, A, G) Leucine Sérine
Mitochondries des plantes supérieures CGG Arginine Tryptophane
Mitochondries (dans tous les organismes étudiés sans exception) U.G.A. Arrêt Tryptophane
Mitochondries chez les mammifères, la drosophile, S. cerevisiae et de nombreux protozoaires AUA Isoleucine Méthionine = Début
Procaryotes G.U.G. Valin Commencer
Eucaryotes (rares) C.U.G. Leucine Commencer
Eucaryotes (rares) G.U.G. Valin Commencer
Procaryotes (rares) UUG Leucine Commencer
Eucaryotes (rares) A.C.G. Thréonine Commencer
Mitochondries de mammifères AGC, AGU Sérine Arrêt
Mitochondries de drosophile A.G.A. Arginine Arrêt
Mitochondries de mammifères UN GAG) Arginine Arrêt

Histoire des idées sur le code génétique

Cependant, au début des années 60 du 20e siècle, de nouvelles données ont révélé l'incohérence de l'hypothèse du « code sans virgules ». Ensuite, des expériences ont montré que les codons, considérés comme dénués de sens par Crick, pouvaient provoquer la synthèse de protéines in vitro, et en 1965, la signification des 64 triplets était établie. Il s'est avéré que certains codons sont simplement redondants, c'est-à-dire que toute une série d'acides aminés est codée par deux, quatre ou même six triplets.

voir également

Remarques

  1. Le code génétique prend en charge l'insertion ciblée de deux acides aminés par un codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Science. 9 janvier 2009;323(5911):259-61.
  2. Le codon AUG code pour la méthionine, mais sert en même temps de codon d'initiation - la traduction commence généralement par le premier codon AUG de l'ARNm.
  3. NCBI : "Les codes génétiques", compilé par Andrzej (Anjay) Elzanowski et Jim Ostell
  4. Jukes TH, Osawa S, Le code génétique des mitochondries et des chloroplastes., Expérience. 1er décembre 1990; 46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (mars 1992). "Preuve récente de l'évolution du code génétique." Microbiol. Tour. 56 (1) : 229-64. PMID 1579111.
  6. SANGER F. (1952). "La disposition des acides aminés dans les protéines." Chimie avancée des protéines. 7 : 1-67. PMID 14933251.
  7. M.Ichas Code biologique. - Monde, 1971.
  8. WATSON JD, CRICK FH. (avril 1953). « Structure moléculaire des acides nucléiques ; une structure pour l'acide nucléique désoxyribose. Nature 171 : 737-738. PMID 13054692.
  9. WATSON JD, CRICK FH. (Mai 1953). "Implications génétiques de la structure de l'acide désoxyribonucléique." Nature 171 : 964-967. PMID 13063483.
  10. Crick FH. (avril 1966). "Le code génétique - hier, aujourd'hui et demain." Cold Spring Harb Symp Quant Biol.: 1-9. PMID 5237190.
  11. G. GAMOW (février 1954). "Relation possible entre l'acide désoxyribonucléique et les structures protéiques." Nature 173 : 318. est ce que je:10.1038/173318a0. PMID 13882203.
  12. GAMOW G, RICH A, YCAS M. (1956). "Le problème du transfert d'informations des acides nucléiques vers les protéines." Adv Biol Med Phys. 4 : 23-68. PMID 13354508.
  13. Gamow G, Ycas M. (1955). « CORRÉLATION STATISTIQUE DE LA COMPOSITION DES PROTÉINES ET DES ACIDES RIBONUCLÉIQUES. " Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789.
  14. Crick FH, Griffith JS, Orgel LE. (1957). « CODES SANS VIRGULE. " Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032.
  15. Hayes B. (1998). "L'invention du code génétique." (Réimpression PDF). Scientifique américain 86 : 8-14.

Littérature

  • Azimov A. Code génétique. De la théorie de l'évolution au décryptage de l'ADN. - M. : Tsentrpoligraf, 2006. - 208 pp. - ISBN 5-9524-2230-6.
  • Ratner V. A. Le code génétique en tant que système - Journal pédagogique Soros, 2000, 6, n° 3, pp.
  • Crick FH, Barnett L, Brenner S et Watts-Tobin RJ. Nature générale du code génétique des protéines - Nature, 1961 (192), pp. 1227-32

Liens

  • Code génétique- article de la Grande Encyclopédie Soviétique

Fondation Wikimédia. 2010.

Le code génétique est un système d'enregistrement d'informations héréditaires dans des molécules d'acide nucléique, basé sur une certaine alternance de séquences nucléotidiques dans l'ADN ou l'ARN, formant des codons correspondant aux acides aminés d'une protéine.

Propriétés du code génétique.

Le code génétique possède plusieurs propriétés.

    Tripleté.

    Dégénérescence ou redondance.

    Sans ambiguïté.

    Polarité.

    Sans chevauchement.

    Compacité.

    Polyvalence.

Il convient de noter que certains auteurs proposent également d’autres propriétés du code liées aux caractéristiques chimiques des nucléotides inclus dans le code ou à la fréquence d’apparition d’acides aminés individuels dans les protéines de l’organisme, etc. Cependant, ces propriétés découlent de celles énumérées ci-dessus, nous les considérerons donc ici.

UN. Tripleté. Le code génétique, comme de nombreux systèmes organisés de manière complexe, possède la plus petite unité structurelle et la plus petite unité fonctionnelle. Un triplet est la plus petite unité structurelle du code génétique. Il se compose de trois nucléotides. Un codon est la plus petite unité fonctionnelle du code génétique. Généralement, les triplets d’ARNm sont appelés codons. DANS code génétique Le codon remplit plusieurs fonctions. Premièrement, sa fonction principale est de coder pour un seul acide aminé. Deuxièmement, le codon ne code peut-être pas pour un acide aminé, mais, dans ce cas, il remplit une autre fonction (voir ci-dessous). Comme le montre la définition, un triplet est un concept qui caractérise élémentaire unité structurelle code génétique (trois nucléotides). Codon – caractérise unité sémantique élémentaire génome - trois nucléotides déterminent la fixation d'un acide aminé à la chaîne polypeptidique.

L'unité structurelle élémentaire a d'abord été déchiffrée théoriquement, puis son existence a été confirmée expérimentalement. En effet, 20 acides aminés ne peuvent pas être codés avec un ou deux nucléotides car ces derniers n'en sont que 4. Trois nucléotides sur quatre donnent 4 3 = 64 variantes, ce qui couvre largement le nombre d'acides aminés disponibles dans les organismes vivants (voir tableau 1).

Les 64 combinaisons de nucléotides présentées dans le tableau présentent deux caractéristiques. Premièrement, sur les 64 variantes de triplet, seules 61 sont des codons et codent pour un acide aminé ; elles sont appelées codons de détection. Trois triolets ne codent pas

les acides aminés a sont des signaux d'arrêt indiquant la fin de la traduction. Il existe trois de ces triplés - UAA, UAG, UGA, ils sont aussi appelés « dénués de sens » (codons non-sens). À la suite d'une mutation associée au remplacement d'un nucléotide dans un triplet par un autre, un codon non-sens peut provenir d'un codon sens. Ce type de mutation est appelé mutation absurde. Si un tel signal d'arrêt se forme à l'intérieur du gène (dans sa partie informationnelle), alors pendant la synthèse des protéines à cet endroit, le processus sera constamment interrompu - seule la première partie (avant le signal d'arrêt) de la protéine sera synthétisée. Une personne atteinte de cette pathologie connaîtra un manque de protéines et ressentira des symptômes associés à cette carence. Par exemple, ce type de mutation a été identifié dans le gène codant pour la chaîne bêta de l’hémoglobine. Une chaîne d'hémoglobine inactive raccourcie est synthétisée et rapidement détruite. En conséquence, une molécule d'hémoglobine dépourvue de chaîne bêta se forme. Il est clair qu’il est peu probable qu’une telle molécule remplisse pleinement ses fonctions. Une maladie grave survient, se développant selon le type l'anémie hémolytique(thalassémie bêta-zéro, de mot grec"Talasa" - Mer Méditerranée, où cette maladie a été découverte pour la première fois).

Le mécanisme d’action des codons stop diffère du mécanisme d’action des codons sens. Cela découle du fait que pour tous les codons codant pour les acides aminés, des ARNt correspondants ont été trouvés. Aucun ARNt n'a été trouvé pour les codons non-sens. Par conséquent, l’ARNt ne participe pas au processus d’arrêt de la synthèse des protéines.

CodonAOÛT (parfois GUG chez les bactéries) codent non seulement pour les acides aminés méthionine et valine, mais sont égalementinitiateur de diffusion .

b. Dégénérescence ou redondance.

61 des 64 triplets codent pour 20 acides aminés. Cet excès triple du nombre de triplets par rapport au nombre d'acides aminés suggère que deux options de codage peuvent être utilisées dans le transfert d'informations. Premièrement, les 64 codons ne peuvent pas tous être impliqués dans le codage de 20 acides aminés, mais seulement 20 et, deuxièmement, les acides aminés peuvent être codés par plusieurs codons. Des recherches ont montré que la nature a choisi cette dernière option.

Sa préférence est évidente. Si sur 64 triplets variants, seulement 20 étaient impliqués dans le codage des acides aminés, alors 44 triplets (sur 64) resteraient non codants, c'est-à-dire dénué de sens (codons absurdes). Auparavant, nous avons souligné à quel point il est dangereux pour la vie d'une cellule de transformer un triplet codant à la suite d'une mutation en un codon non-sens - cela perturbe considérablement le fonctionnement normal de l'ARN polymérase, conduisant finalement au développement de maladies. Actuellement, trois codons non-sens dans notre génome sont absurdes, mais imaginez maintenant ce qui se passerait si le nombre de codons absurdes était multiplié par environ 15. Il est clair que dans une telle situation, la transition des codons normaux vers les codons non-sens sera infiniment plus élevée.

Un code dans lequel un acide aminé est codé par plusieurs triplets est appelé dégénéré ou redondant. Presque chaque acide aminé possède plusieurs codons. Ainsi, l'acide aminé leucine peut être codé par six triplets - UUA, UUG, TSUU, TsUC, TsuA, TsUG. La valine est codée par quatre triplets, la phénylalanine par deux et seulement tryptophane et méthionine codé par un codon. La propriété associée à l'enregistrement des mêmes informations avec différents symboles est appelée dégénérescence.

Le nombre de codons désignés pour un acide aminé est bien corrélé à la fréquence d'apparition de l'acide aminé dans les protéines.

Et ce n’est probablement pas accidentel. Plus la fréquence d'apparition d'un acide aminé dans une protéine est élevée, plus le codon de cet acide aminé est représenté dans le génome, plus la probabilité de ses dommages par des facteurs mutagènes est élevée. Par conséquent, il est clair qu’un codon muté a plus de chances de coder pour le même acide aminé s’il est fortement dégénéré. De ce point de vue, la dégénérescence du code génétique est un mécanisme qui protège le génome humain des dommages.

Il convient de noter que le terme dégénérescence est utilisé en génétique moléculaire dans un autre sens. Ainsi, l'essentiel de l'information d'un codon est contenu dans les deux premiers nucléotides ; la base en troisième position du codon s'avère avoir peu d'importance. Ce phénomène est appelé « dégénérescence de la troisième base ». Cette dernière fonctionnalité minimise l’effet des mutations. Par exemple, on sait que la fonction principale des globules rouges est de transporter l’oxygène des poumons vers les tissus et gaz carbonique des tissus aux poumons. Cette fonction est assurée par le pigment respiratoire - l'hémoglobine, qui remplit tout le cytoplasme des érythrocytes. Il se compose d'une partie protéique - la globine, qui est codée par le gène correspondant. En plus des protéines, la molécule d'hémoglobine contient de l'hème, qui contient du fer. Des mutations dans les gènes de la globine conduisent à l'apparition diverses options hémoglobines. Le plus souvent, les mutations sont associées à remplacement d'un nucléotide par un autre et apparition d'un nouveau codon dans le gène, qui peut coder pour un nouvel acide aminé dans la chaîne polypeptidique de l'hémoglobine. Dans un triplet, à la suite d'une mutation, n'importe quel nucléotide peut être remplacé - le premier, le deuxième ou le troisième. On connaît plusieurs centaines de mutations qui affectent l’intégrité des gènes de la globine. Près 400 dont sont associés au remplacement de nucléotides uniques dans un gène et au remplacement d'acides aminés correspondant dans un polypeptide. Parmi ceux-ci seulement 100 les remplacements entraînent une instabilité de l'hémoglobine et divers types de maladies allant de légères à très graves. 300 (environ 64 %) mutations de substitution n'affectent pas la fonction de l'hémoglobine et n'entraînent pas de pathologie. L'une des raisons en est la « dégénérescence de la troisième base » mentionnée ci-dessus, lorsqu'un remplacement du troisième nucléotide dans un triplet codant pour la sérine, la leucine, la proline, l'arginine et certains autres acides aminés conduit à l'apparition d'un codon synonyme. codant pour le même acide aminé. Une telle mutation ne se manifestera pas de manière phénotypique. En revanche, tout remplacement du premier ou du deuxième nucléotide d'un triplet entraîne dans 100 % des cas l'apparition d'un nouveau variant de l'hémoglobine. Mais même dans ce cas, il se peut qu’il n’y ait pas de troubles phénotypiques graves. La raison en est le remplacement d’un acide aminé présent dans l’hémoglobine par un autre similaire au premier. proprietes physiques et chimiques. Par exemple, si un acide aminé aux propriétés hydrophiles est remplacé par un autre acide aminé, mais avec les mêmes propriétés.

L'hémoglobine est constituée du groupe fer porphyrine de l'hème (des molécules d'oxygène et de dioxyde de carbone y sont attachées) et de la protéine - globine. L'hémoglobine adulte (HbA) contient deux-des chaînes et deux-Chaînes. Molécule-la chaîne contient 141 résidus d'acides aminés,-chaîne - 146,- Et-les chaînes diffèrent par de nombreux résidus d'acides aminés. La séquence d'acides aminés de chaque chaîne de globine est codée par son propre gène. Codage des gènes-la chaîne est située dans le bras court du chromosome 16,-gène - dans le bras court du chromosome 11. Substitution dans le codage du gène-la chaîne d'hémoglobine du premier ou du deuxième nucléotide entraîne presque toujours l'apparition de nouveaux acides aminés dans la protéine, une perturbation des fonctions de l'hémoglobine et des conséquences graves pour le patient. Par exemple, remplacer "C" dans l'un des triplets CAU (histidine) par "Y" entraînera l'apparition d'un nouveau triplet UAU, codant pour un autre acide aminé - la tyrosine. Phénotypiquement, cela se manifestera par une maladie grave. substitution similaire en position 63-la chaîne du polypeptide histidine à la tyrosine entraînera une déstabilisation de l'hémoglobine. La maladie méthémoglobinémie se développe. Remplacement, par mutation, de l'acide glutamique par la valine en 6ème position-la chaîne est la cause de la maladie la plus grave - la drépanocytose. Ne continuons pas la triste liste. Notons seulement qu'en remplaçant les deux premiers nucléotides, un acide aminé aux propriétés physico-chimiques similaires au précédent peut apparaître. Ainsi, le remplacement du 2ème nucléotide dans l'un des triplets codant pour l'acide glutamique (GAA) dans-la chaîne avec « U » conduit à l'apparition d'un nouveau triplet (GUA), codant pour la valine, et le remplacement du premier nucléotide par « A » forme le triplet AAA, codant pour l'acide aminé lysine. L'acide glutamique et la lysine ont des propriétés physicochimiques similaires : ils sont tous deux hydrophiles. La valine est un acide aminé hydrophobe. Par conséquent, le remplacement de l'acide glutamique hydrophile par de la valine hydrophobe modifie considérablement les propriétés de l'hémoglobine, ce qui conduit finalement au développement de l'anémie falciforme, tandis que le remplacement de l'acide glutamique hydrophile par de la lysine hydrophile modifie dans une moindre mesure la fonction de l'hémoglobine - les patients développent forme légère anémie. Grâce au remplacement de la troisième base, le nouveau triplet peut coder pour les mêmes acides aminés que le précédent. Par exemple, si dans le triplet CAC, l'uracile était remplacé par la cytosine et qu'un triplet CAC apparaissait, alors pratiquement aucun changement phénotypique ne serait détecté chez l'homme. Cela est compréhensible, car les deux triplets codent pour le même acide aminé – l’histidine.

En conclusion, il convient de souligner que la dégénérescence du code génétique et la dégénérescence de la troisième base d'un point de vue biologique général sont des mécanismes de protection inhérents à l'évolution de la structure unique de l'ADN et de l'ARN.

V. Sans ambiguïté.

Chaque triplet (sauf absurdités) code pour un seul acide aminé. Ainsi, dans le sens codon - acide aminé le code génétique est sans ambiguïté, dans le sens acide aminé - codon il est ambigu (dégénéré).

Non ambigu

Codon d'acide aminé

Dégénérer

Et dans ce cas, la nécessité d’une absence d’ambiguïté dans le code génétique est évidente. Dans une autre option, lors de la traduction du même codon, différents acides aminés seraient insérés dans la chaîne protéique et, par conséquent, des protéines avec des structures primaires différentes et des fonctions différentes seraient formées. Le métabolisme cellulaire passerait au mode de fonctionnement « un gène – plusieurs polypeptides ». Il est clair que dans une telle situation, la fonction régulatrice des gènes serait complètement perdue.

G. Polarité

La lecture des informations à partir de l’ADN et de l’ARNm ne s’effectue que dans une seule direction. La polarité a important pour déterminer des structures d’ordre supérieur (secondaire, tertiaire, etc.). Plus tôt, nous avons expliqué comment les structures d’ordre inférieur déterminent les structures d’ordre supérieur. Structure tertiaire et structures plus ordre élevé dans les protéines, ils se forment immédiatement dès que la chaîne d'ARN synthétisée quitte la molécule d'ADN ou que la chaîne polypeptidique quitte le ribosome. Pendant que l'extrémité libre d'un ARN ou d'un polypeptide acquiert une structure tertiaire, l'autre extrémité de la chaîne continue d'être synthétisée sur l'ADN (si l'ARN est transcrit) ou un ribosome (si un polypeptide est transcrit).

Par conséquent, le processus unidirectionnel de lecture de l'information (lors de la synthèse de l'ARN et des protéines) est essentiel non seulement pour déterminer la séquence de nucléotides ou d'acides aminés dans la substance synthétisée, mais aussi pour la détermination stricte des substances secondaires, tertiaires, etc. structures.

d. Sans chevauchement.

Le code peut se chevaucher ou non. La plupart des organismes ont un code qui ne se chevauche pas. Du code qui se chevauche se trouve dans certains phages.

L'essence d'un code sans chevauchement est qu'un nucléotide d'un codon ne peut pas être simultanément un nucléotide d'un autre codon. Si le code se chevauchait, alors la séquence de sept nucléotides (GCUGCUG) pourrait coder non pas deux acides aminés (alanine-alanine) (Fig. 33, A) comme dans le cas d'un code non chevauchant, mais trois (s'il y a un nucléotide en commun) (Fig. 33, B) ou cinq (si deux nucléotides sont communs) (voir Fig. 33, C). Dans les deux derniers cas, une mutation de n’importe quel nucléotide entraînerait une violation de la séquence de deux, trois, etc. acides aminés.

Cependant, il a été établi qu'une mutation d'un nucléotide perturbe toujours l'inclusion d'un acide aminé dans un polypeptide. Il s’agit d’un argument important selon lequel le code ne se chevauche pas.

Expliquons cela dans la figure 34. Les lignes en gras montrent des triplets codant pour des acides aminés dans le cas de codes non chevauchants et chevauchants. Les expériences ont clairement montré que le code génétique ne se chevauche pas. Sans entrer dans les détails de l'expérience, notons que si l'on remplace le troisième nucléotide dans la séquence de nucléotides (voir Fig. 34)U (marqué d'un astérisque) à autre chose :

1. Avec un code sans chevauchement, la protéine contrôlée par cette séquence aurait une substitution d'un (premier) acide aminé (marqué par des astérisques).

2. Avec un code qui se chevauche dans l'option A, une substitution se produirait dans deux (premier et deuxième) acides aminés (marqués par des astérisques). Selon l’option B, le remplacement affecterait trois acides aminés (marqués d’astérisques).

Cependant, de nombreuses expériences ont montré que lorsqu'un nucléotide dans l'ADN est perturbé, la perturbation dans la protéine n'affecte toujours qu'un seul acide aminé, ce qui est typique d'un code qui ne se chevauche pas.

GZUGZUG GZUGZUG GZUGZUG

GCU GCU GCU UGC GCU GCU GCU UGC GCU GCU GCU

*** *** *** *** *** ***

Alanine - Alanine Ala - Cis - Ley Ala - Ley - Ley - Ala - Ley

ABC

Code sans chevauchement Code avec chevauchement

Riz. 34. Un schéma expliquant la présence d'un code non chevauchant dans le génome (explication dans le texte).

Le non-chevauchement du code génétique est associé à une autre propriété - la lecture de l'information commence à partir d'un certain point - le signal d'initiation. Un tel signal d'initiation dans l'ARNm est le codon codant pour la méthionine AUG.

Il convient de noter que les humains possèdent encore un petit nombre de gènes qui s'écartent de règle générale et se chevauchent.

E. Compacité.

Il n'y a pas de ponctuation entre les codons. En d’autres termes, les triplets ne sont pas séparés les uns des autres, par exemple par un nucléotide dénué de sens. L’absence de « signes de ponctuation » dans le code génétique a été prouvée expérimentalement.

et. Polyvalence.

Le code est le même pour tous les organismes vivant sur Terre. Preuve directe L'universalité du code génétique a été obtenue en comparant les séquences d'ADN avec les séquences protéiques correspondantes. Il s’est avéré que tous les génomes bactériens et eucaryotes utilisent les mêmes ensembles de valeurs de code. Il y a des exceptions, mais pas beaucoup.

Les premières exceptions à l’universalité du code génétique ont été trouvées dans les mitochondries de certaines espèces animales. Il s’agissait du codon terminateur UGA, qui se lit de la même manière que le codon UGG, codant pour l’acide aminé tryptophane. D’autres écarts plus rares par rapport à l’universalité ont également été constatés.

Système de code ADN.

Le code génétique de l'ADN est constitué de 64 triplets de nucléotides. Ces triplets sont appelés codons. Chaque codon code pour l'un des 20 acides aminés utilisés dans la synthèse des protéines. Cela donne une certaine redondance dans le code : la plupart des acides aminés sont codés par plus d'un codon.
Un codon remplit deux fonctions interdépendantes : il signale le début de la traduction et code l'inclusion de l'acide aminé méthionine (Met) dans la chaîne polypeptidique en croissance. Le système de codage de l'ADN est conçu de manière à ce que le code génétique puisse être exprimé sous forme de codons d'ARN ou de codons d'ADN. Les codons d'ARN se trouvent dans l'ARN (ARNm) et ces codons sont capables de lire des informations lors de la synthèse de polypeptides (un processus appelé traduction). Mais chaque molécule d’ARNm acquiert une séquence nucléotidique lors de la transcription à partir du gène correspondant.

Tous les acides aminés sauf deux (Met et Trp) peuvent être codés par 2 à 6 codons différents. Cependant, le génome de la plupart des organismes montre que certains codons sont favorisés par rapport à d’autres. Chez l’homme, par exemple, l’alanine est codée quatre fois plus souvent par GCC que par GCG. Cela indique probablement une plus grande efficacité de traduction de l'appareil de traduction (par exemple, le ribosome) pour certains codons.

Le code génétique est presque universel. Les mêmes codons sont attribués à la même section d’acides aminés et les mêmes signaux de départ et d’arrêt sont pratiquement les mêmes chez les animaux, les plantes et les micro-organismes. Cependant, quelques exceptions ont été trouvées. La plupart impliquent l’attribution d’un ou deux des trois codons d’arrêt à un acide aminé.