
We are searching data for your request:
Upon completion, a link will appear to access the found materials.
En vérifiant sur Google Scholar, je peux voir que pour Illumina (juste pour prendre un exemple), le taux d'erreur de séquençage est de l'ordre de 0,001 à 0,01 par nucléotide.
En parlant d'erreur de séquençage, considérons uniquement les mésappariements (substitution d'un nucléotide par un autre). Connaissant le "vrai" nucléotide à une position donnée, est-il aussi susceptible d'être lu que tout autre nucléotide spécifique lors d'un décalage ou y a-t-il un biais ? Par exemple, si le vrai nucléotide estUNE
, est-il plus susceptible d'être trouvé en tant queg
(puisqu'ils sont tous les deux des purines) qu'unT
ou unC
? Certains nucléotides sont-ils plus susceptibles d'être mal interprétés que d'autres ?
J'espère que la réponse ne dépendra pas trop des techniques de séquençage.
Malheureusement, cela dépend des techniques de séquençage.
Par exemple, dans le séquençage Illumina, chaque fragment de séquence est amplifié (afin d'obtenir un signal plus fort) et forme un cluster sur le microarray. Chaque cluster est séquencé par des cycles de :
- Ajout de nucléotides terminateurs fluorescents. Ces nucléotides sont modifiés pour contenir un groupe d'inhibition/de terminaison et empêchent l'ajout de plus de nucléotides. Théoriquement, un seul nucléotide est incorporé dans chaque fragment d'ADN au cours de cette étape.
- Laver les nucléotides en excès.
- Capturer le nucléotide incorporé à l'aide de techniques d'imagerie et déterminer quelle base a été incorporée (sur la base de la couleur de la fluorescence).
- Clivage du terminateur des nucléotides ajoutés, afin que la réaction puisse continuer.
Image de Metzker, 2010.
De cette façon, chaque fragment est synthétisé, un nucléotide à la fois, et chaque nucléotide incorporé est détecté. Cependant, la première étape n'est pas sans faille : parfois plus d'un nucléotide est incorporé dans un certain fragment d'ADN, ou aucun nucléotide n'est incorporé. Finalement, les fragments d'ADN dans un cluster (contenant tous la même séquence) se désynchroniseront (« phasing ») et le signal fluorescent deviendra moins clair, avec un mélange de couleurs différentes. C'est la principale cause d'erreur de séquençage pour les machines Illumina, et aussi la raison pour laquelle les lectures Illumina sont relativement courtes (~300bp).
Donc, pour répondre à votre question, dans cet exemple, les nucléotides peuvent être lus à tort comme des nucléotides proches dans cette séquence. Les erreurs varieront en utilisant d'autres méthodes de séquençage et la façon dont ces méthodes fonctionnent.
L'article que j'ai lié plus tôt explique différentes méthodes de séquençage plus en détail. (Malheureusement, il se trouve derrière un paywall, donc certains ne pourront peut-être pas le voir.)
Introduction
Les nucléotides sont les molécules biologiques qui servent de blocs de construction aux acides nucléiques comme l'ADN et l'ARN. Ils sont essentiels pour toutes les fonctions remplies par une cellule vivante. Non seulement cela, mais ils sont également essentiels pour transférer des informations vers de nouvelles cellules ou la prochaine génération d'organismes vivants.
Les nucléotides se rejoignent pour former des dinucléotides, des trinucléotides, etc., ce qui entraîne la formation de polymères appelés polynucléotides. Ces polynucléotides se rejoignent ensuite pour former des acides nucléiques complexes comme l'ADN et l'ARN. Dans cette section, nous discuterons des différents aspects des nucléotides, de leur structure, de leur emplacement dans les corps vivants, des arrangements chimiques et des fonctions qu'ils remplissent. Nous discuterons également en détail de certains nucléotides qui remplissent des fonctions importantes dans notre corps.
- Les deux brins d'ADN sont de nature anti-parallèle, c'est-à-dire que l'extrémité 3&prime d'un brin fait face à l'extrémité 5&prime de l'autre brin.
- Les nucléotides qui composent l'ADN contiennent une base azotée, un sucre désoxyribose et un groupe phosphate qui se lient de manière covalente avec d'autres nucléotides pour former des liaisons phosphodiester.
- Les bases nucléotidiques peuvent être classées en purines (contenant une structure à double cycle) ou en pyrimidines (contenant une structure à un seul cycle).
- L'adénine (purine) et la thymine (pyrimidine) sont des paires de bases complémentaires tout comme la guanine (purine) et la cytosine (pyrimidine).
- Le séquençage de l'ADN est le processus consistant à déterminer l'ordre précis des nucléotides dans une molécule d'ADN.
- désoxyribose: un dérivé du sucre pentose ribose dans lequel le 2&prime hydroxyle (-OH) est réduit en un hydrogène (H) un constituant des nucléotides qui composent l'acide désoxyribonucléique, ou ADN
- liaison hydrogène: Une liaison faible dans laquelle un atome d'hydrogène déjà lié de manière covalente à un atome d'oxygène ou d'azote dans une molécule est attiré par un atome électronégatif (généralement l'azote ou l'oxygène) dans la même molécule ou une molécule différente.
- nucléotide: le monomère comprenant des molécules d'ADN ou d'ARN est constitué d'une base hétérocyclique azotée qui peut être une purine ou une pyrimidine, un sucre pentose à cinq carbones, et un groupement phosphate
Les éléments constitutifs monomères de l'ADN sont des désoxyribomononucléotides (généralement appelés simplement nucléotides), et l'ADN est formé à partir de chaînes linéaires, ou polymères, de ces nucléotides. Les composants du nucléotide utilisé dans la synthèse de l'ADN sont une base azotée, un désoxyribose et un groupe phosphate. Le nucléotide est nommé en fonction de la base azotée présente. La base azotée peut être une purine telle que l'adénine (A) et la guanine (G), caractérisées par des structures à double cycle, ou une pyrimidine telle que la cytosine (C) et la thymine (T), caractérisées par des structures à un seul cycle. Dans les polynucléotides (les polymères linéaires des nucléotides), les nucléotides sont reliés les uns aux autres par des liaisons covalentes appelées liaisons phosphodiester ou liaisons phosphodiester.
Figure (PageIndex<1>) : Structure nucléotidique: Chaque nucléotide est composé d'un sucre, d'un groupement phosphate et d'une base azotée. Le sucre est le désoxyribose dans l'ADN et le ribose dans l'ARN. Sous leur forme mononucléotidique, les nucléotides peuvent avoir un, deux ou trois phosphates qui leur sont attachés. Lorsqu'ils sont liés entre eux dans des chaînes polynucléotidiques, les nucléotides n'ont toujours qu'un seul phosphate. Une molécule avec juste une base azotée et un sucre est connue sous le nom de nucléoside. Une fois qu'au moins un phosphate est lié de manière covalente, il est appelé nucléotide.
James Watson et Francis Crick, avec l'aide de Rosalind Franklin et Maurice Wilkins, sont reconnus pour avoir découvert la structure de l'ADN. Watson et Crick ont proposé que l'ADN soit composé de deux brins polynucléotidiques qui sont enroulés l'un autour de l'autre pour former une hélice droite.
Les deux brins polynucléotidiques sont de nature anti-parallèle. C'est-à-dire qu'ils courent dans des directions opposées.
Les sucres et les phosphates des nucléotides forment le squelette de la structure, tandis que les paires de bases azotées sont pointées vers l'intérieur de la molécule.
La torsion des deux brins l'un autour de l'autre entraîne la formation de rainures majeures et mineures uniformément espacées bordées par les squelettes sucre-phosphate des deux brins.
Figure (PageIndex<1>) : Trois représentations de l'ADN à double structure hélicoïdale.: A est un modèle d'ADN rempli d'espace, où chaque atome est représenté comme une sphère. Les deux brins polynucléotidiques antiparallèles sont colorés différemment pour illustrer comment ils s'enroulent l'un autour de l'autre. B est un modèle d'ADN de bande dessinée, où les squelettes sucre-phosphate sont représentés par des brins violets et les bases azotées sont représentées par des anneaux codés par couleur. C est un autre modèle de remplissage d'espace, avec les atomes de sucre-phosphate colorés en violet et tous les atomes de base azotés colorés en vert. Les rainures majeures et mineures, qui s'enroulent autour de la molécule entière, sont apparentes comme les espaces entre les squelettes sucre-phosphate.
Le diamètre de la double hélice d'ADN est de 2 nm et est uniforme partout. Seul l'appariement entre une purine et une pyrimidine peut expliquer le diamètre uniforme. C'est-à-dire qu'à chaque point le long de la molécule d'ADN, les deux squelettes sucre phosphate sont toujours séparés par trois cycles, deux d'une purine et un d'une pyrimidine.
Les deux brins sont maintenus ensemble par appariement de bases entre les bases azotées d'un brin et les bases azotées de l'autre brin. L'appariement des bases a lieu entre une purine et une pyrimidine stabilisée par des liaisons hydrogène : A s'apparie avec T via deux liaisons hydrogène et G s'apparie avec C via trois liaisons hydrogène.
Les paires de bases intérieures tournent les unes par rapport aux autres, mais sont également empilées les unes sur les autres lorsque la molécule est observée en regardant vers le haut ou vers le bas de son axe long.
Chaque paire de bases est séparée de la paire de bases précédente par une hauteur de 0,34 nm et chaque tour de 360 o de l'hélice parcourt 3,4 nm le long du grand axe de la molécule. Par conséquent, dix paires de bases sont présentes par tour d'hélice.
Figure (PageIndex<1>) : Structure de l'ADN: L'ADN a (a) une structure en double hélice et (b) des liaisons phosphodiester. Les sillons (c) majeurs et mineurs sont des sites de liaison pour les protéines de liaison à l'ADN au cours de processus tels que la transcription (la copie de l'ARN à partir de l'ADN) et la réplication.
Le séquençage de l'ADN est le processus de détermination de l'ordre précis des nucléotides dans une molécule d'ADN. Les méthodes de séquençage rapide de l'ADN ont considérablement accéléré la recherche et les découvertes biologiques et médicales. La connaissance des séquences d'ADN est devenue indispensable pour la recherche biologique fondamentale et dans de nombreux domaines appliqués tels que le diagnostic, la biotechnologie, la biologie médico-légale et la systématique biologique. La vitesse rapide de séquençage atteinte avec la technologie moderne a contribué à l'obtention de séquences d'ADN complètes, ou génomes, de nombreux types et espèces de vie, y compris le génome humain et ceux d'autres espèces animales, végétales et microbiennes.
La technique plus/moins
Alors que Sanger et son équipe avaient réussi à séquencer une partie substantielle de l'ADN f1, ils n'avaient pas terminé toute sa séquence. De plus, leur méthode était longue et laborieuse. Désireux de trouver une technique plus rapide qui lui permettrait de déterminer de plus grandes séquences d'ADN, Sanger a continué à chercher de nouvelles voies pour s'attaquer au problème.
En 1975, Sanger et son assistant Coulson publient un article ( Sanger, Coulson, 1975 ) dans lequel ils esquissent une approche radicalement différente de la précédente. Ce qui était nouveau dans leur technique, c'est qu'elle ne reposait pas sur la reconstitution d'une séquence basée sur l'examen des chevauchements dans de petits fragments d'ADN. De plus, il permettait le balayage visuel direct d'une séquence. Sanger et Coulson n'avaient pas développé la méthode du jour au lendemain. Elle est plutôt apparue progressivement à la suite de quelques expériences, lancées en avril 1973, destinées à tester l'action de différentes polymérases et l'efficacité de différentes techniques de fractionnement ( Sanger, Dowding, 1996 Garcia-Sancho, 2010 ).
Ces notes proviennent de l'expérience D80. Ce fut l'une des premières expériences de Sanger où il commença à tester la possibilité de copier avec les quatre désoxytriphosphates. Carnet de laboratoire d'ADN de Sanger, 1972. Crédit : Wellcome Library, dossier SA//BIO, P/1/42.
Dans cette note, Sanger enregistre le début d'une « expérience assez ambitieuse ». Le but de l'expérience, étiquetée D93, était de trouver un moyen d'étendre des fragments d'ADN, clivés avec une enzyme de restriction, par l'ajout des quatre nucléotides de l'ADN, qui devaient ensuite être séparés par ionophorèse sur gels et leurs séquences analysées. Les résultats de cette expérience étaient assez prometteurs. Sanger continuerait à affiner la méthode utilisée dans cette expérience avec l'aide de Coulson et Barrell. L'expérience a jeté les bases de la méthode du plus et du moins. Cahier de laboratoire d'ADN de Sanger, 1973-1974. Crédit : Wellcome Library, dossier SA//BIO, P/1/43.
Appelée finalement le système « plus/moins », la technique consistait en un certain nombre d'étapes différentes. Dans un premier temps, une amorce a été synthétisée. Il s'agissait d'une copie complémentaire d'une courte longueur de l'échantillon d'ADN à l'étude. Une fois fabriquée, l'amorce a été liée à une région complémentaire spécifique sur une matrice d'ADN simple brin afin de fournir un point de départ pour la synthèse d'ADN. Les brins combinés ont ensuite été incubés avec de la polymérase I (provenant de Escherichia coli) afin qu'il puisse ajouter des nucléotides radiomarqués à l'extrémité 3' de l'amorce. Ce processus a fourni un assortiment aléatoire de fragments d'ADN synthétisés de différentes longueurs. Chacun a été purifié pour éliminer les nucléotides en excès.
Après purification, les échantillons ont été répartis entre deux traitements. Le premier traitement, connu sous le nom de système « moins », s'appuyait sur la méthode de copie mise au point par Wu et Kaiser. Dans ce cas, l'échantillon a été incubé dans un tube à essai avec de l'ADN polymérase I (provenant de Escherichia coli) avec seulement trois nucléotides d'ADN sur quatre (A, C, G ou T). Un nucléotide a été délibérément soustrait à ce processus d'incubation. Cela a profité du processus biologique naturel, par lequel la polymérase continuera à synthétiser une chaîne d'ADN jusqu'à ce qu'elle rencontre un nucléotide manquant. Dans le cas par exemple où l'adénine est absente, la polymérase va synthétiser un chapelet de nucléotides, s'arrêtant juste avant ce nucléotide. En omettant un nucléotide particulier, un à la fois, l'équipe a pu obtenir des produits d'ADN avec des terminaisons nucléotidiques spécifiques.
Contrairement au système "moins", qui reposait sur l'élimination d'un nucléotide spécifique, le deuxième traitement, le système "plus" reposait sur l'ajout d'un nucléotide pendant le processus d'incubation. Développé par Paul Englund entre 1971 et 1972, le système « plus » utilisait une polymérase différente, la T4. Cela provenait du bactériophage T4. Dans des circonstances normales, cette polymérase agit comme un réactif de synthèse. Cependant, il commencera à dégrader un brin d'ADN à partir de son extrémité 3' lorsqu'il rencontrera un nucléotide supplémentaire. Comme dans le cas du système « moins », le système « plus » a produit des fragments d'ADN avec des terminaisons nucléotidiques spécifiques.
Tests d'enregistrement de notes de Coulson avec la polymérase T4. Crédit : Wellcome Library, Coulson papers, dossier : PP/COU, Notebook 'Plus and minus sequencing, T4 polymerase preparations', 1976.
Les deux systèmes reposaient sur la préparation de quatre réactions en tube à essai avec les deux types différents de polymérase. Après traitement, les amorces ont été séparées de la matrice. Cela a fourni huit brins d'ADN différents. Quatre d'entre eux provenaient de la matrice, connue sous le nom de brins moins, et quatre provenaient de l'amorce, connue sous le nom de brins plus. Le résultat final était une série de fragments se chevauchant avec chacune des terminaisons nucléotidiques (A, C, G, T).
Chaque fragment d'ADN a ensuite été placé côte à côte dans des voies séparées sur un gel d'acrylamide prêt pour l'ionophorèse. Suite à l'application d'une charge électrique, les fragments d'ADN migreraient du haut vers le bas du gel, les plus gros fragments se déplaçant plus lentement que les plus petits. Dans ce contexte, le gel a agi comme un tamis qui a permis de trier les fragments par leur taille. Une fois cette opération terminée, un film radiographique a été superposé sur le gel pendant un certain temps, généralement pendant la nuit, puis développé pour produire une autoradiographie, qui a révélé la position des nucléotides radioactifs marqués dans les fragments. L'image finale montrait une série de bandes sombres dans un motif en échelle qui mettait en évidence l'endroit où les fragments se chevauchaient ( Hutchison, 2007 Finch, 2008 ).
L'utilisation de gel d'acrylamide pour l'analyse des séquences a marqué un changement significatif. Auparavant, Sanger avait généralement effectué ce travail en utilisant la chromatographie sur papier bidimensionnelle. Cependant, cela prenait beaucoup de temps car cela impliquait de nombreuses coupures de groupes. L'un des attraits de l'utilisation du système de gel d'acrylamide était qu'il fournissait une lecture unidimensionnelle d'une séquence. La décision d'utiliser des gels pour fractionner l'ADN avait d'abord semblé une idée folle à Sanger. Alors que les gels étaient couramment utilisés pour séparer les protéines intactes ainsi que l'ADN et les fragments d'ADN, ils n'avaient jamais été utilisés auparavant pour séparer des acides nucléiques individuels (Sanger, 1992).
Cela montre John Donelson qui a joué un rôle central dans le développement du système de gel d'acrylamide pour le système plus et moins. Crédit : John Donelson.
Lorsqu'ils ont commencé à développer la méthode plus et moins, Sanger et Coulson ont largement effectué le fractionnement par homochromatographie. Cependant, ils se sont rapidement tournés vers Donelson pour l'aider dans le processus, ce qu'il a fait en utilisant un système à base de gel d'acrylamide qu'il développait pour d'autres expériences. Au début, ce système avait semblé peu prometteur car les résultats initiaux n'étaient que légèrement meilleurs que ceux obtenus par homochromatographie. Certains progrès ont été réalisés grâce à l'adoption de gels plus gros. Cela a produit des bandes plus nettes dans les autoradiographies. Pourtant, les problèmes de dentition ont continué. À plusieurs reprises, les fragments les plus gros ont couru plus vite que les plus petits. Cela a complètement bouleversé la séquence. De plus, en testant le système avec de l'ADN synthétisé avec la méthode de ribosubstitution pour laquelle une séquence était déjà connue, ils ont continué à obtenir des séquences inversées. Ils l'ont attribué à une structure secondaire dans la matrice d'ADN. Finalement, après de nombreux essais et erreurs, le problème a été résolu par l'ajout d'urée 8M, un produit chimique, et l'application d'une haute tension, dont la combinaison a rendu le gel chaud. Après tous ces changements, l'équipe a commencé à obtenir des résultats beaucoup plus clairs qu'avec la chromatographie sur papier ( Sanger, 1992 Sanger, Dowding, 1996 ).
La combinaison de la méthode plus et moins en tandem avec le système de fractionnement à base de gel d'acrylamide a été un grand pas en avant. Désormais, une séquence pouvait être lue directement à partir d'une autoradiographie. Cela a été fait en balayant l'image de bas en haut, en notant où les bandes sombres, le produit de la radioactivité, sont apparues. Tout cela pourrait être fait à l'œil nu. Sanger considérait cette nouvelle approche comme l'une des meilleures idées qu'il ait jamais eues. La nouvelle méthode a non seulement permis aux chercheurs de scanner directement une séquence d'ADN, mais également de déterminer des tronçons beaucoup plus longs que jamais auparavant, 50 nucléotides à la fois. Il a également marqué un départ de l'utilisation de la dégradation à une procédure de copie. (Sanger, 1988 Finch, 2008).
L'erreur de séquençage est-elle fonction du nucléotide lu ? - La biologie
La région des séquences nucléotidiques du codon de départ (ATG) au codon d'arrêt est appelée cadre de lecture ouvert.
La recherche de gènes dans l'organisme, en particulier les procaryotes, commence par la recherche d'un cadre de lecture ouvert (ORF). Un ORF est une séquence d'ADN qui commence par le codon de départ &ldquoATG&rdquo (pas toujours) et se termine par l'un des trois codons de terminaison (TAA, TAG, TGA). Selon le point de départ, il existe six manières possibles (trois sur le brin avant et trois sur le brin complémentaire) de traduire n'importe quelle séquence nucléotidique en séquence d'acides aminés selon le code génétique. On les appelle cadres de lecture.
Alors que la recherche de gènes eucaryotes est une tâche tout à fait différente, car les gènes eucaryotes ne sont pas continus et interrompus par des séquences non codantes intermédiaires appelées &lsquointrons&rsquo. De plus, l'organisation de l'information génétique chez les eucaryotes et les procaryotes est différente
Qu'est-ce que la séquence de codage (CDS) ? En quoi est-il différent de l'ORF ?
La séquence codante (CDS) est la région réelle de l'ADN qui est traduite pour former des protéines. Alors que l'ORF peut également contenir des introns, le CDS fait référence aux nucléotides (exons concaténés) qui peuvent être divisés en codons qui sont réellement traduits en acides aminés par la machinerie de traduction ribosomique. Chez les procaryotes, l'ORF et le CDS sont les mêmes.
L'erreur de séquençage est-elle fonction du nucléotide lu ? - La biologie
Les réactions de séquençage de l'ADN utilisent toutes une amorce pour initier la synthèse de l'ADN. Cette amorce déterminera le point de départ de la séquence en cours de lecture et la direction de la réaction de séquençage.
La plupart des réactions de séquençage d'ADN utilisent des didésoxy nucléotides (ddNTP) pour arrêter la synthèse d'ADN au niveau de nucléotides spécifiques. Par exemple, si le ddCTP à droite est incorporé dans un brin d'ADN en croissance, l'absence d'un groupe 3 OH libre empêcherait l'ajout du nucléotide suivant et la chaîne se terminerait.
Dans le séquençage automatisé, nous utilisons un marqueur fluorescent différent attaché à chacun des quatre nucléotides didésoxy (ddA, ddC, ddG et ddT). Ainsi, nous pouvons déterminer la base terminale dans chaque fragment d'ADN.
Les deux animations ci-dessous illustrent comment la synthèse d'ADN et la terminaison didésoxy sont utilisées pour séquencer l'ADN.
|
|
|
Je pense, qu'est-ce que c'est - une fausse façon. Et à partir de là, il est nécessaire de désactiver.
Je pense qu'il y en a.
Je suis absolument d'accord avec vous. L'idée est bonne, je la soutiens.