Informations

Comment les aminoacyl-ARNt synthases font-elles la distinction entre des acides aminés similaires ?

Comment les aminoacyl-ARNt synthases font-elles la distinction entre des acides aminés similaires ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Comment les aminoacyl ARNt synthases reconnaissent-elles le bon acide aminé pour leur ARNt ? Quelle est la raison structurelle de la reconnaissance sélective ? J'ai du mal à voir comment, par exemple, la leucine et l'isoleucine peuvent être sélectivement reconnues par différentes poches de liaison lorsqu'elles présentent une hydrophobie, un volume moléculaire, etc.


Les aminoacyl-ARNt synthétases sont hautement spécifiques à leur acide aminé correspondant. Premièrement, le site d'activation, où se fixe l'acide aminé, constitue un réseau complexe d'interactions intermoléculaires. Par exemple, la thréonine, catalysée par la thréonyl-ARNt synthétase, est très similaire à la valine et à la sérine. La valine a un groupe méthyle au lieu du groupe hydroxy de la thréonine, et la sérine, de l'autre côté, n'a pas de groupe latéral méthyle supplémentaire. Unique à la thréonyl-ARNt synthétase, il contient un Zn2+ ion qui présente une structure d'interaction spécifique à la thréonine. Néanmoins, la thréonyl-ARNt synthétase pourrait toujours être mal chargée en sérine car le site de l'ion zinc n'est pas assez spécifique, ce qui conduit à 1% d'ARNt mal chargé. A cet effet, les aminoacyl-ARNt synthétases ont une seconde, édition site qui relit l'ARNt chargé. Le site d'édition peut reconnaître la sérine et la séparer de l'ARNt.

Chiffre: Réseau d'interaction du site d'activation de la thréonyl-ARNt synthétase dans A. pernix. La thréonine-AMP est représentée en vert.

Sources:

une Berg JM, Tymoczko JL, Stryer L. Biochimie. 5e édition. New York : WH Freeman ; 2002. Section 29.2, Aminoacyl-Transfer RNA Synthetases Lisez le code génétique. Disponible sur : https://www.ncbi.nlm.nih.gov/books/NBK22356/

b Nagaoka, Yoshiyuki et al. "ÉVOLUTION ET RECONNAISSANCE DE L'ARNt DE LA SYNTHÉTASE DE THRÉONYL-ARNT À PARTIR D'UN ARCHÉON THERMOPHILE EXTRÊME, Aeropyrum pernix K1." Viva Origino 1.31 (2003), http://www.origin-life.gr.jp/3101/3101062/3101062.html


Aminoacylation de l'ARNt

La deuxième étape de l'aminoacylation de l'ARNt est le transfert de l'acide aminé activé de l'aa-AMP au ribose A76 2′-OH (pour les enzymes de classe I) ou 3′-OH (pour la plupart des enzymes de classe II). Mécaniquement, la nucléophilie de ces groupes hydroxyle serait considérablement améliorée par la déprotonation, suggérant une exigence pour une base de site actif avec un p Kune proche du neutre positionné de manière appropriée dans les sites actifs de l'AARS. Ce même groupe pourrait ensuite agir pour donner un proton au groupe partant AMP après clivage de la liaison. Cependant, aucun candidat clair n'a émergé pour les résidus conservés qui pourraient servir de base générale même lorsque les structures de site actif sont conservées et que des motifs de séquence ont été identifiés pour chaque classe AARS. Alternativement, la catalyse assistée par substrat, utilisant soit le groupe phosphate dans l'aa-AMP, soit la -amine de l'acide aminé (dans l'aa-AMP) comme base requise, pourrait offrir un scénario mécaniste alternatif et être indépendante de la classe.

Une possibilité pour une base potentielle de site actif a été notée à partir du complexe ternaire entre la classe I E. coli GlnRS, son ARNt apparenté Gln et l'analogue glutaminyl adénylate 5′-O-[N-(l-glutaminyl)-sulfamoyl]adénosine (QSI), ce qui a suggéré un glutamate enterré (Glu34) pour ce rôle [79] . Le carboxylate de Glu34 est à 2,7 d'une eau cristallographique adjacente à l'ARNt 2′-OH. Le relais de transfert de protons proposé reposerait sur une déprotonation de l'eau médiée par Glu34, suivie d'une déprotonation du 2′-OH avec une attaque concomitante sur le groupe carbonyle de l'adénylate de glutaminyle lié à l'enzyme. L'état de transition de cette réaction contiendrait un intermédiaire carboné tétraédrique censé être stabilisé par le groupe guanidino de Arg260 [79] . Ce mécanisme proposé pour le transfert d'acides aminés contredisait la suggestion précédente, basée sur la structure GlnRS:tRNA Gln:ATP, selon laquelle un oxygène non pontant dans Gln-AMP déprotonerait le A76 2′-OH [55] . Compte tenu de la très faible pKune (1,5–2) de l'oxygène du phosphate et que Gln a été modélisé dans la structure, la prédiction ultérieure de Glu34 comme base générale était intéressante [79] . Dans un effort pour régler la question mécanistique de la déprotonation catalysée par une enzyme ou un substrat du groupe 2′-OH, Perona et ses collègues ont muté à la fois Glu34 et le Glu73 voisin et ont évalué les taux de réaction par des approches à l'état stationnaire et pré-stationnaire. [80] . Une mutation Glu34Gln a affiché un changement négligeable à kchimie, le taux d'aminoacylation de renouvellement unique (bien que cette substitution ait entraîné une augmentation K pour le substrat Gln). La substitution Glu73Gln correspondante a diminué kchimie par 10 3 fois par rapport à la GlnRS de type sauvage, cette baisse a été attribuée à la perte de contacts avec les résidus adjacents qui positionnent l'extrémité 3' de l'ARNt dans le site actif. Par conséquent, il a été conclu qu'aucun des résidus Glu ne participe à la promotion de la déprotonation A76 2′-OH [80] .

Sans une base générale apparente pour promouvoir l'aminoacylation de l'ARNt dans les enzymes de classe I ou II, l'attention a été dirigée vers la possibilité d'une catalyse assistée par substrat. L'oxyanion phosphate non pontant offrait une possibilité intrigante malgré son faible pKune, en particulier parce que le pKune les valeurs du produit de réaction AMP sont plus élevées à 3,8 et 6,2 (The Merck Index, Rahway, NJ). Par conséquent, un mécanisme concerté est attrayant, tel que l'oxygène adénylate non pontant déprotone le 2′-OH, l'oxygène nucléophile résultant attaque le carbone adénylate carbonyle et la liaison CO adjacente se rompt (Fig. 4). Cette stratégie assistée par substrat est susceptible d'être générale pour les enzymes des deux classes, et peut refléter un mécanisme ancestral préexistant à l'émergence des deux classes structurelles distinctes.

4 . Un mécanisme général pour la participation de l'aa-AMP à l'aminoacylation de l'ARNt. Dérivé des mécanismes proposés précédemment [33,81] . Ado, adénosine R, chaîne latérale d'acides aminés apparentée à l'AARS donné.

Des preuves soutenant un mécanisme concerté assisté par substrat pour l'aminoacylation de l'ARNt comme celui illustré à la figure 4 sont disponibles pour les deux classes d'AARS. Francklyn et ses collègues ont utilisé leur E. coli Structure HisRS:His-AMP avec l'ARNt His A76 modélisé dans le site actif pour proposer un mécanisme détaillé et concerté pour l'aminoacylation de l'ARNt [33] . Dans ce modèle, quatre résidus clés sont à proximité à la fois du His-AMP lié et du ribose terminal : Arg259, Arg113, Gln127 et Glu83. Les deux résidus Arg interagissent avec les oxygènes adénylates Sp et Rp non pontants, respectivement, tandis que Gln entre en contact avec le -carbonyle de l'adénylate. Les variants Arg259His, Glu83Gln et Glu83Ala ont tous présenté des taux de transfert d'acides aminés significativement réduits qui auraient pu être attribués à des défauts de catalyse ou de positionnement A76. Pour remédier à cette incertitude, des analogues phosphorothioates de l'adénylate aux positions Sp et Rp ont été introduits pour sonder le rôle de His-AMP dans la catalyse. Pour HisRS de type sauvage, la substitution ATPαSp a conduit à une perte d'activité de 10 000 fois par rapport à une perte de seulement 50 fois pour la substitution Rp. Des tendances similaires ont été observées avec les enzymes variantes Arg259His et Glu83Gln. Ainsi, l'oxygène Sp non pontant histidyl-adénylate est la base générale probable de la déprotonation A76 3′-OH, et le transfert d'histidine est proposé comme une réaction concertée assistée par substrat [33] . Ce mécanisme est soutenu par les calculs de la théorie de la fonctionnelle de la densité (DFT) [81] .

Des preuves expérimentales suggèrent également que les AARS de classe I reposent sur une catalyse assistée par aa-AMP utilisant un oxygène non pontant pour favoriser la déprotonation, dans ce cas du 2'-OH sur l'extrémité 3' du substrat d'ARNt. L'impact délétère de la substitution du soufre pour l'oxygène non pontant dans le -phosphate de l'ATP a été reconnu pour l'activité MetRS dès 1982 : un stéréoisomère (appelé ATPαSA) provoque une

Chute de 180 fois Vmax, tandis que l'autre (ATPαSB) a complètement éliminé l'activité enzymatique [82] . Avec le mécanisme montré dans la figure 4 à l'esprit, il semble probable que le soufre dans ATPαSB a remplacé l'oxygène non pontant qui serait critique pour la déprotonation du groupe 2′-hydroxyle attaquant. En 2000, First et ses collègues ont utilisé les résultats de la cinétique détaillée de l'état pré-stationnaire pour proposer un état de transition de cycle à 6 chaînons avec l'oxygène non pontant Tyr-AMP sur le phosphate positionné pour déprotoner le 2′-OH sur l'ARNt Tyr [83 ] . Et, en 2017, Aboelnga et Gauld ont examiné informatiquement les mécanismes d'aminoacylation de l'ARNt de la E. coli GlnRS et T. maritima ND-GluRS. Des simulations de dynamique moléculaire, combinées à des calculs QM et QM/MM, ont conduit à une proposition mécaniste similaire à celle illustrée à la Fig. 4 . Dans ces cas, une molécule d'eau ordonnée était positionnée entre l'oxygène phosphate non pontant dans l'aa-AMP et le 2′-OH dans l'ARNt. Ainsi, l'état de transition passerait par un anneau à 8 chaînons et le relais requis des transferts de protons se déroulerait passant par Déprotonation médiée par aa-AMP de cette molécule d'eau avec reprotonation immédiate en utilisant le proton du 2'-OH. Une attaque nucléophile immédiate au niveau du -phosphate achèverait le cycle [84] . Il reste à déterminer si l'eau participe ou non au transfert de protons pour tous les AARS de classe I.

Une exception possible au cas général de la déprotonation assistée par aa-AMP de l'hydroxyle A76 est la classe II ThrRS. Comparaison de E. coli Les structures ThrRS:AMP et ThrRS:tRNA Thr :AMP indiquent qu'un résidu His conservé (His309) se réoriente lors de la liaison de l'ARNt pour entrer en contact avec le A76 2′-OH [34] . La mutation de His309 a diminué l'aminoacylation, et cette perte a été attribuée à l'étape de transfert, avec une diminution de ktrans de > 200 fois. Les auteurs soutiennent que l'A76 2′-OH est également actif dans l'étape de transfert, car la substitution par 2′-désoxy ou 2′-fluoro a diminué, mais n'a pas aboli, ktrans avec des pertes de 10 2 –10 3 par rapport à l'ARNt natif. La participation de l'oxygène adénylate non pontant dans la déprotonation de l'A76 3′-OH a été écartée, car les substitutions de phosphorothioate n'affectaient pas significativement le transfert d'acides aminés [34] . L'analyse du cycle de double mutant entre les substitutions His309Ala et 2′-désoxy ou 2′-fluoro indique un couplage thermodynamique, conduisant à un modèle catalytique pour la synthèse Thr-ARNt Thr qui invoque le relais de protons de His309 à A76 2′-OH vers le nucléophile A76 3 a-OH (figure 5A). Des calculs DFT ultérieurs ont suggéré alternativement un rôle possible pour le groupe amino du substrat thréonine en tant que base générale. ThrRS repose sur un site actif Zn 2 + cofacteur pour la sélection et l'activation des acides aminés en se coordonnant aux groupes -amine et -hydroxy dans Thr (et Ser non apparenté) (décrit plus en détail plus loin dans ce chapitre). La proximité de cet ion Zn 2 + et la labilité calculée de la liaison entre le Zn 2 + et l'amine-amine favorisent la basicité de l'amine ( Fig. 5 B) [85] . Ce nouveau mécanisme n'a pas été testé expérimentalement.

5 . Mécanismes d'aminoacylation de l'ARNt proposés pour ThrRS. (A) His309 agit comme une base catalytique pour initier un relais de transferts de protons qui active le 3′-OH en tant que nucléophile [32] . (B) L'-amine dans le substrat Thr-AMP agit comme la base qui déprotone le 3′-OH. Thr-ARNt Thr (à droite) est le produit qui découlerait de l'une ou l'autre voie [83] .


Discrimination des acides aminés à médiation par les ions zinc par la thréonyl-ARNt synthétase

La traduction précise du code génétique dépend de la capacité des aminoacyl-ARNt synthétases à distinguer des acides aminés similaires. Afin d'étudier les bases de la reconnaissance des acides aminés et de comprendre le rôle joué par l'ion zinc présent dans le site actif de la thréonyl-ARNt synthétase, nous avons déterminé les structures cristallines de complexes d'une forme tronquée active de l'enzyme avec un thréonyl analogue d'adénylate ou thréonine. L'ion zinc est directement impliqué dans la reconnaissance de la thréonine, formant un intermédiaire pentacoordonné avec à la fois le groupe amino et la chaîne latérale hydroxyle. Les expériences d'activation des acides aminés révèlent que l'enzyme ne montre aucune activation de la valine isostérique et active la sérine à un taux 1 000 fois inférieur à celui de la thréonine apparentée. Cette étude démontre que l'ion zinc n'est ni strictement catalytique ni structurel et suggère comment l'ion zinc garantit que seuls les acides aminés qui possèdent un groupe hydroxyle attaché à la position sont activés.


Résultats

Base de données

Sur la base de toutes les structures disponibles dans l'APB, 424 (189 Classe I, 235 Classe II) structures tridimensionnelles d'aaRS co-cristallisées avec leurs ligands d'acides aminés correspondants ont été analysées. Les données sélectionnées couvrent les aaRS de 56 espèces différentes au total, 180 d'eucaryotes, 213 de bactéries et 31 d'archées (SI Annexe Fig. S1). Au total, 70 structures humaines font partie de l'ensemble de données. Chaque chaîne protéique qui contient un complexe protéine-ligand d'un domaine aaRS catalytique a été considérée. Des données étaient disponibles pour chacun des 20 aaRS, plus les aaRS non standard pyrrolysyl-ARNt synthétase (PylRS) et phosphoséryl-ARNt synthétase (SepRS). Malheureusement, la LysRS de classe I n'a pas pu être prise en compte pour l'analyse. La structure unique de cette enzyme de Pyrococcus horikoshii (PDB-ID : 1irx), qui fait partie de l'ensemble de données, ne contient aucun ligand d'acide aminé co-cristallisé. Le nombre de complexes protéine-ligand disponibles pour chaque aaRS est indiqué dans l'annexe SI Fig. S2. Pour douze aaRS, des complexes protéine-ligand étaient disponibles dans les états de réaction de pré-activation et de post-activation, c'est-à-dire co-cristallisés avec un acide aminé ou un ligand aminoacyle (SI Annexe Fig. S3). Sur toutes les structures analysées, 240 sont en état de pré-activation et 184 en état de post-activation. Parmi les complexes post-activation, 72 sont des esters d'adénosine monophosphate (AMP) et 112 sont des analogues non hydrolysables, principalement des dérivés sulfamoyle.

Fonctionnalités d'interaction

Les fréquences des interactions de sites de liaison non covalentes observées en ce qui concerne la classe aaRS et le type d'interaction sont présentées dans le tableau 1. En général, les interactions hydrophobes sont les interactions les plus fréquentes pour les aaRS de classe I avec une fréquence de 44,60 % par rapport à le nombre total d'interactions, tandis que les liaisons hydrogène sont le plus fréquemment observées dans les aaRS de classe II avec une fréquence de 59,23 %. Cinq types d'interaction (liaisons hydrogène, interactions hydrophobes, ponts salins, empilement (pi ) et complexes métalliques) ont été observés dans les aaRS. Aucune interaction (pi)-cation n'a été observée pour être impliquée dans la liaison des acides aminés. Les ponts d'eau ont été exclus de l'analyse des interactions. Certaines structures aaRS déposées dans le PDB sont résolues, y compris l'eau, mais d'autres structures ne contiennent pas de molécules d'eau. Dans ces cas, aucun pont d'eau ne peut être détecté à l'aide du PLIP, malgré leur existence in vivo, ce qui conduirait à un biais expérimental. Néanmoins, les molécules d'eau sont connues pour médier des interactions importantes pour la reconnaissance des ligands 48 et leur rôle ne doit pas être sous-estimé.

Reconnaissance des acides aminés

L'annotation des interactions protéine-ligand non covalentes a permis de caractériser les préférences d'interaction de chaque aaRS au niveau des atomes individuels de leurs ligands d'acides aminés. Cette analyse met en évidence les modes de liaison préférés pour chacun des 22 ligands d'acides aminés. La figure 2 montre les interactions qui se produisent pour chaque aaRS sur la base de l'analyse avec PLIP. Chaque interaction est annotée avec son occupation, c'est-à-dire la fréquence relative d'occurrence par rapport au nombre total de structures pour cette aaRS. Les caractéristiques du site de liaison sont négligées à ce stade et toutes les interactions sont indiquées par rapport au ligand d'acide aminé.

La reconnaissance d'acides aminés individuels par les aaRS mappés à leurs ligands. Les ligands sont regroupés par propriétés physico-chimiques 49 et classe aaRS. Différents types d'interactions protéine-ligand non covalentes ont été déterminés avec PLIP 46 et attribués à des atomes individuels du ligand en utilisant la détection d'isomorphisme de sous-graphe 50 . Les atomes du squelette du ligand sont représentés par des cercles sans intérieur rempli. L'occupation relative de chaque interaction par rapport au nombre total de structures étudiées (nombre entre parenthèses pour chaque aaRS) est donnée par des camemberts. Les interactions avec une occupation inférieure à 0,1 sont négligées. Interactions pour lesquelles une correspondance unique avec un atome individuel n'est pas possible en raison d'un isomorphisme ambigu, par ex. pour la chaîne latérale de la valine, ont été attribués à plusieurs atomes. (pi ) -les interactions d'empilement sont indiquées en vert foncé et font référence à tous les atomes des structures cycliques aromatiques dans les TyrRS, TrpRS et PheRS. Certains aaRS empêchent le mauvais chargement de leurs ARNt via des mécanismes de correction d'erreur (« édition ») 51 . Les aaRS effectuant la correction d'erreurs sont en gras.

Classe I

En général, les aaRS de classe I interagissent principalement via des liaisons hydrogène et des interactions hydrophobes avec le ligand. Les atomes du squelette de tous les ligands de classe I présentent une liaison hydrogène avec le groupe amine primaire. L'occupation de cette interaction est élevée dans tous les aaRS de classe I, indiquant un rôle central de cette interaction pour la fixation du ligand. De plus, l'atome d'oxygène du groupe carboxyle du ligand est impliqué dans la liaison hydrogène, à l'exception de la glutaminyl-ARNt synthétase (GlnRS), de l'isoleucyl-ARNt synthétase (IleRS) et de la valyl-ARNt synthétase (ValRS). Le même atome forme des ponts salins supplémentaires dans la leucyl-ARNt synthétase (LeuRS), l'arginyl-ARNt synthétase (ArgRS), la méthionyl-ARNt synthétase (MetRS) et la glutamyl-ARNt synthétase (GluRS). Les chaînes latérales des acides aminés aliphatiques leucine, isoleucine et valine sont exclusivement liées via des interactions hydrophobes. ArgRS et GluRS forment des ponts salins entre les résidus du site de liaison et les groupes carboxyle et guanidine chargés du ligand, respectivement. La glutamine est liée par GlnRS via des liaisons hydrogène conservées au groupe amide et des interactions hydrophobes avec les atomes de carbone bêta et delta. Les deux acides aminés aromatiques tyrosine et tryptophane sont reconnus par des interactions d'empilement (pi) et des réseaux de contact hydrophobes étendus. Le tryptophane est lié de préférence d'un côté de son groupe indole aux positions un, six et sept. L'atome de soufre du ligand cystéinyl-ARNt synthétase (CysRS) forme un complexe métallique avec un ion zinc dans les deux structures. Les MetRS se lient à leur ligand avec une interaction hydrophobe hautement conservée avec l'atome de carbone bêta.

Classe II

Les aaRS de classe II interagissent constamment avec les atomes du squelette du ligand via des liaisons hydrogène et des ponts salins. Le groupe amine primaire forme des liaisons hydrogène avec un taux d'occupation élevé et est impliqué dans la formation de complexes métalliques dans les thréonyl-ARNt synthétases (ThrRS) et les séryl-ARNt synthétases (SerRS). Les atomes d'oxygène carboxyle des ligands sont liés par une combinaison de liaisons hydrogène et d'interactions de pont de sel électrostatique. Le modèle global d'interaction du squelette est hautement conservé dans les aaRS de classe II. Une enquête plus approfondie a révélé qu'un motif structurel précédemment décrit de deux résidus d'arginine 43, responsable de la fixation de l'ATP, semble être impliqué dans la stabilisation du groupe carboxyle d'acide aminé avec son résidu d'arginine N-terminal. Les ligands d'acides aminés chargés dans l'histidyl-ARNt synthétase (HisRS) et LysRS forment des liaisons hydrogène hautement conservées avec les résidus du site de liaison. D'autres interactions conférant une spécificité incluent les interactions d'empilement (pi ) et les contacts hydrophobes observés pour la phénylalanine-ARNt synthétase (PheRS), la formation de complexes métalliques pour ThrRS et SerRS avec le zinc, et les ponts salins ainsi que les liaisons hydrogène pour l'aspartyl-ARNt synthétase (AspRS). Les acides aminés alanine et proline sont liés par des alanyl-ARNt synthétases (AlaRS) et des prolyl-ARNt synthétases (ProRS) via des interactions hydrophobes. Aucune interaction conférant une spécificité ne peut être décrite pour le plus petit acide aminé glycine en raison de l'absence d'une chaîne latérale. Par conséquent, la glycyl-ARNt synthétase (GlyRS) ne peut former des interactions qu'avec les atomes du squelette du ligand. De plus, les asparaginyl-ARNt synthétases (AsnRS) assurent la médiation de liaisons hydrogène hautement conservées avec le groupe amide de leur ligand asparagine. L'acide aminé non standard pyrrolysine est lié par PylRS via plusieurs liaisons hydrogène et interactions hydrophobes avec le groupe pyrroline. Les SepRS utilisent principalement des interactions de pont salin pour fixer le groupe phosphate du ligand phosphosérine.

Modèles d'interaction conservés

Les aaRS de classe I montrent une forte conservation des liaisons hydrogène avec le groupe amine primaire du ligand d'acide aminé avec 83,16 % de toutes les structures formant cette interaction. Les interactions avec le groupe carboxyle sont moins conservées avec une fréquence de 32,65 % pour les liaisons hydrogène et de 28,57 % pour les ponts salins, respectivement. Dans ce contexte, les ponts salins avec le groupe carboxyle sont une forme de liaison hydrogène extra forte 52 . Les modèles d'interaction avec les atomes du squelette du ligand d'acide aminé sont étonnamment cohérents au sein des aaRS de classe II. Cette classe forme des liaisons hydrogène avec le groupe amine primaire dans 92,15 % de toutes les structures. De plus, des liaisons hydrogène avec l'atome d'oxygène du groupe carboxyle se produisent dans 65,70 % de toutes les structures et des ponts salins avec le même atome sont formés dans 39,26 % de tous les complexes protéine-ligand de classe II.

Une reconnaissance similaire nécessite des mécanismes d'édition

Divers aaRS sont connus pour effectuer une édition pré- ou post-transfert (voir les travaux de Perona et Gruic-Sovulj 51 pour une discussion détaillée des mécanismes d'édition) afin d'assurer une cartographie appropriée des acides aminés à leurs ARNt apparentés. La similitude des préférences d'interaction représentée sur la figure 2 suggère que des groupes d'acides aminés très similaires nécessitent des mécanismes d'édition pour leur manipulation correcte. En particulier, les trois acides aminés aliphatiques isoleucine, leucine et valine sont liés via des interactions hydrophobes non spécifiques et faibles, ce qui prouve la nécessité des mécanismes d'édition observés pour leurs aaRS 53 et que l'hydrophobie du substrat ne peut pas entièrement expliquer la spécificité 54 . Il est proposé que la distinction entre ces trois acides aminés similaires se produise via le mécanisme du « double tamis » 52 . À titre d'exemple pour IleRS, les acides aminés plus gros que l'isoleucine sont exclus avec le « premier tamis » au site d'aminoacylation, tandis que les acides aminés plus petits (comme la valine et la leucine) sont triés par le domaine d'édition, fonctionnant comme un « tamis » plus fin. La spécificité peut donc être obtenue par une sélection stérique basée sur la longueur et la forme de la chaîne latérale au niveau du site d'édition 53 . Une tendance similaire peut être observée, par exemple, pour AlaRS 55 afin de distinguer l'alanine de la sérine ou de la glycine.

Géométrie du site de liaison et volume de la cavité

Nous avons étudié la géométrie du site de liaison et le volume de la cavité afin de quantifier leur contribution potentielle à la reconnaissance des acides aminés. Les mécanismes d'édition connus dans les aaRS sont axés sur la prévention ou la correction des erreurs de chargement d'ARNt au sein d'une classe aaRS (intra-classe), par ex. les acides aminés isoleucine, leucine et valine appartiennent à la classe I. Cependant, les GluRS et les AspRS ont un schéma d'interaction très similaire de liaisons hydrogène et de ponts salins avec le groupe carboxyle et de faibles interactions hydrophobes. Les deux aaRS n'utilisent pas l'édition et sont gérés par différentes classes d'aaRS. Dans ce cas, la géométrie et la taille du site de liaison peuvent agir comme une couche supplémentaire de sélectivité un mécanisme également exploité par ValRS 53,56. Pour quantifier la contribution de la géométrie du site de liaison, sept structures de GluRS et six structures d'AspRS ont été superposées par rapport à leur sous-structure commune d'adénine à l'aide du logiciel Fit3D 57. Comme cette superposition ne peut être calculée que pour des complexes protéine-ligand qui ressemblent à l'état post-réactionnel, seul un sous-ensemble des structures a été utilisé. Les résultats montrent que les ligands des GluRS et des AspRS sont orientés vers des côtés différents d'un plan défini par leur sous-structure commune d'adénine (Fig. 3A). Il y a une différence significative (Mann-Whitney U p<0.01) dans l'orientation du ligand, décrite par l'angle de torsion entre le phosphate et la sous-structure d'acides aminés du ligand (Fig. 3B). Les GluRS de classe I présentent un angle de torsion de 54,64 ± 7,12 (^) , alors que l'angle de torsion des AspRS de classe II est de −65,02 ± 7,40 (^) . En outre, le volume de la fraction conférant la spécificité du site de liaison (voir Fig. 1) a été estimé avec l'algorithme POVME 58. Il diffère considérablement (Mann-Whitney U p<0,01) entre GluRS (147,00 ± 22,31 (^3) ) et AspRS (73,34 ± 17,12 (^3) ). Cette tendance peut être observée pour toutes les structures de classe I et de classe II, respectivement. Une analyse de toutes les structures représentatives des aaRS de classe I et de classe II montre que les sites de liaison de classe I sont significativement (Mann-Whitney U p<0.01) plus grande en moyenne (Fig. 3C). Alors que les cavités de liaison de classe I ont un volume moyen de 143,40 ± 39,62 (^3) , les sites de liaison de classe II ont en moyenne un volume de 90,36 ± 32,09 (^3).

Analyse de la géométrie de la liaison et du volume de la cavité de liaison. (UNE) Géométrie de liaison des GluRS et AspRS. Les ligands aminoacyles des GluRS de classe I et des AspRS de classe II dans un état post-activation alignés avec Fit3D 57 en ce qui concerne leur sous-structure d'adénine. Les points médians des interactions non covalentes 46 avec les résidus du site de liaison sont représentés par de petites sphères. Le bleu est la liaison hydrogène, le jaune est le pont salin et le gris est l'interaction hydrophobe. (B) Distribution des angles de torsion entre la sous-structure phosphate et acide aminé du ligand. L'orientation du ligand dans le site de liaison diffère significativement (Mann-Whitney U (p<0.01) ) entre les GluRS et les AspRS. (C) Le volume de la fraction conférant la spécificité du site de liaison, estimé avec l'algorithme POVME 58, diffère significativement entre les aaRS de classe I et de classe II (Mann-Whitney U (p<0.01)).

Modèles d'interaction des aaRS individuels

En plus de l'étude des préférences d'interaction du point de vue du ligand, les sites de liaison de chaque aaRS ont été analysés en ce qui concerne les résidus qui forment des interactions avec le ligand d'acide aminé. Parce que chaque aaRS est soutenu par plusieurs protéines d'organismes divers avec des séquences considérablement divergentes, nous avons conçu une abstraction informatique pour permettre au lecteur de déduire les acides aminés de protéines individuelles via des alignements de séquences multiples (MSA) axés sur la structure (voir la section « Méthodes ») . Les numéros de séquence originaux pour chaque position peuvent être déduits des tables de mappage publiées avec ce manuscrit (voir Disponibilité des données). Chaque ligne du tableau correspond à la position artificielle de la séquence, tandis que chaque colonne donne la position d'origine de chaque structure de notre ensemble de données telle que définie par l'APB. La figure 4A montre une représentation du logo de séquence 59 des interactions du site de liaison pour AlaRS. Chaque position colorée dans le logo de la séquence représente les interactions se produisant à cette position. Des interactions hautement conservées peuvent être observées à la position renumérotée 135. Les interactions de liaison hydrogène et de pont salin correspondantes sont formées avec les atomes du squelette du ligand. Côté protéine, cette interaction est médiée par un résidu arginine conservé qui correspond au résidu N-terminal du motif Arginine Tweezers 43 précédemment décrit. Une autre interaction importante est formée par la valine à la position renumérotée 293. Ce résidu interagit avec l'atome de carbone bêta du ligand alanine via des interactions hydrophobes. Dans certaines structures, cette interaction hydrophobe est complétée par un résidu alanine à la position renumérotée 325. L'acide aspartique à la position renumérotée 323 est hautement conservé dans les AlaRS et semble être impliqué dans la fixation des acides aminés via une liaison hydrogène du groupe amine primaire. Dans l'ensemble, les interactions conférant une spécificité avec la petite chaîne latérale de l'alanine sont des contacts hydrophobes. Un exemple de reconnaissance des acides aminés dans les AlaRS est donné sur la figure 4B. La structure des bactéries Escherichia coli AlaRS constitue l'ensemble des interactions observées. Les logos de séquence des aaRS restants sont donnés dans les Fig. S4–S24. Sur la base des interactions entre les résidus du site de liaison et le ligand, un résumé qualitatif des mécanismes conférant une spécificité et des résidus clés a été composé (tableau 2). De plus, la taille du ligand et le nombre d'interactions observées ont été vérifiés pour la dépendance. Il existe une corrélation positive faible mais significative entre le nombre moyen de résidus de sites de liaison en interaction pour chaque aaRS et le nombre de tous les atomes non hydrogène du ligand d'acide aminé (Pearson r=0.32, p<0.01). Cela indique que le nombre d'interactions formées augmente généralement avec la taille du ligand. Cependant, les acides aminés plus petits n'ont pas nécessairement un modèle de reconnaissance moins complexe. Les ThrRS, par exemple, se lient à leur ligand d'acides aminés avec en moyenne plus d'une douzaine de résidus de sites de liaison, tandis que les ValRS emploient en moyenne cinq résidus de sites de liaison. Le groupe hydroxyle de la thréonine permet la formation d'une gamme étendue d'interactions non covalentes avec des résidus de site de liaison par rapport à la valine, où seuls des contacts hydrophobes peuvent être établis. Les distributions des résidus de sites de liaison en interaction pour chaque aaRS sont données dans l'annexe SI, figure S25.

Modèles d'interaction d'AlaRS. (UNE) Logo de séquence 59 de séquences représentatives pour les AlaRS. Les interactions non covalentes avec le ligand d'acide aminé se produisant à certaines positions sont indiquées par des cercles colorés. Les cercles pleins sont des interactions avec les atomes de la chaîne latérale, tandis que les cercles creux sont des interactions avec l'un des atomes du squelette du ligand d'acide aminé. Le bleu est la liaison hydrogène, le jaune est le pont salin, le gris est l'interaction hydrophobe. (B) Représentation des interactions dans le site de liaison (modèle du bâton bleu) d'un AlaRS de Escherichia coli (PDB : chaîne A 3hxz) avec son ligand (modèle bâton orange). Ici, des liaisons hydrogène (lignes bleues continues) et des interactions hydrophobes (lignes grises en pointillés) sont établies. Les positions de séquence des résidus en interaction sont données conformément au MSA (noir) ainsi qu'à la structure d'origine (rouge). Figurine réalisée avec PyMol 60 . Les doubles liaisons sont indiquées par des segments de ligne parallèles, les liaisons aromatiques par des lignes en pointillés circulaires.

Comparaison quantitative de la reconnaissance de ligands

Pour permettre une analyse quantitative et une comparaison de la reconnaissance des ligands entre plusieurs aaRS, les caractéristiques des sites d'interaction et de liaison ont été représentées sous forme de vecteurs binaires, appelés empreintes digitales d'interaction (voir la section « Méthodes »). Sur la base de ces empreintes digitales, la distance Jaccard a été calculée pour chaque paire de structures afin de représenter la dissemblance dans la reconnaissance du ligand. Par la suite, l'algorithme Uniform Manifold Approximation and Projection for Dimension Reduction (UMAP) 61 a été utilisé pour la réduction de la dimensionnalité et l'intégration des empreintes digitales de grande dimension dans deux dimensions pour la visualisation. Cet encastrement est considéré comme le espace de reconnaissance des aaRS. La visualisation bidimensionnelle de cet espace de reconnaissance (Fig. 5) peut être considérée comme une carte décrivant la similitude de la reconnaissance des ligands dans tous les aaRS. Ainsi, chaque point de données correspond à un seul site de liaison d'acides aminés qui a été caractérisé par des caractéristiques d'interaction et de site de liaison. In general, a similar recognition mechanism between two aaRSs can be assumed if they are located close to each other in this map. The more distant two aaRSs are from each other, the less similar their amino acid recognition. However, it has to be noted that the applied dimension reduction does not perfectly conserve distances. Figure 5A shows the embedding results for all aaRSs in the dataset colored according to the aaRS classes. A Principal Component Analysis (PCA) of the same data is given in SI Appendix Fig. S26. For each aaRS the average position of all data points in the embedding space was calculated and is shown as one-letter code label. Figure 5B shows the same data colored according to the physicochemical properties of the amino acid ligand, i.e. positive (lysine, arginine, and histidine), aromatic (phenylalanine, tyrosine, and tryptophan), negative (aspartic acid and glutamic acid), polar (asparagine, cysteine, glutamine, proline, serine, and threonine), and unpolar (glycine, alanine, isoleucine, leucine, methionine, and valine).

Recognition space analysis of all aaRSs. (UNE) Embedding 61 space of interaction fingerprints for all aaRS structures in the dataset. Scaling is in arbitrary units. The data points are colored according to the aaRS class. One letter code labels are given for each aaRS based on the averaged coordinates in the embedding space. An asterisk indicates the non-standard amino acids phosphoserine (J*) and pyrrolysine (O*). (B) Embedding space of interaction fingerprints for all aaRS structures in the dataset except phosphoserine and pyrrolysine. Scaling is in arbitrary units. One-letter codes of amino acid ligands are used to identify each aaRS. Every data point represents an individual protein-ligand complex. The color of the data points encodes the physicochemical properties 49 of the ligand.

Classe I

In terms of amino acid binding both aaRS classes seem to employ different overall mechanism they separate almost perfectly in the embedding space. Especially aromatic amino acid recognition in Class I tryptophanyl-tRNA synthetases (TrpRSs) and tyrosyl-tRNA synthetases (TyrRSs) is distinct from Class II aaRSs and forms two outgroups in the embedding space. Remarkably, two different recognition mechanisms exist for TrpRSs, indicated by two clusters approximately at positions (−2.0,6.0) and (1.0,8.5) of the embedding space, respectively. The cluster at position (−2.0,6.0) is formed by structures from bacteria and archaea, while the cluster at position (1.0,8.5) is formed by eukaryotes and archaea and is in proximity to TyrRSs. Closer investigation of two representatives from these clusters shows two distinct forms of amino acid recognition for TrpRSs. Human aaRSs employ a tyrosine residue in order to bind the amine group of the indole ring, while prokaryotes employ different residues (SI Appendix Fig. S27). The Class I aaRSs that are closest to Class II are GluRSs and CysRSs. A cluster of high density is formed by Class I IleRS, MetRS, and ValRS, which handle aliphatic amino acids. This indicates closely related recognition mechanisms and difficult discrimination between these amino acids.

Classe II

For Class II aaRSs the recognition space is less structured. Nonetheless, clusters are formed that coincide with individual Class II aaRSs, e.g. a distinct recognition mechanism in AlaRSs. The aaRSs handling the small and polar amino acids threonine, serine, and proline are closely neighbored in the embedding space. Recognition of GlyRSs seems to be diverse GlyRSs are not grouped in the embedding space. However, the recognition of glycine, which has no side chain, is limited by definition and thus the fingerprinting approach might fail to capture subtle recognition features. AspRSs and AsnRSs are located next to each other in the embedding space. Their recognition mechanisms seem to be very similar as the only difference between these two amino acids is the carboxylate and amide group, respectively.

Mechanisms that drive specificity

In order to quantify the influence of different aspects of binding site evolution on amino acid recognition by aaRSs, different interaction fingerprint designs were compared against each other. Each design includes varying levels of information and combinations thereof: the sequence composition of the enzyme’s binding site (Seq), non-covalent interactions formed between side chains of the enzyme’s binding site and the amino acid ligand (Int), whether pre- or post-transfer correction (i.e. “editing”) is conducted (Ed), and the overall volume of the enzyme’s binding cavity (Vol). To assess the segregation power of each fingerprint variant, the mean silhouette coefficient 62 , a quantification for the error in clustering methods, over all data points was calculated. This score allows to assess to which extent the recognition of one aaRS differs from other aaRSs and how similar it is within its own group. Perfect discrimination between all amino acids would give a value close to one, while a totally random assignment corresponds to a value of zero. Negative values indicate that the recognition of a different aaRS is rated to be more similar than the recognition of the same aaRS. Figure 6 shows the results of this comparison. When using fingerprints describing the sequence composition of the enzyme’s binding site (Seq (_ ext ) ), the mean silhouette coefficient over all samples is −0.0510, which indicates many overlapping data points and unspecific recognition. By including non-covalent interactions (Seq, Int) the value increases to 0.1361. If pre- or post-transfer correction mechanisms are considered (Seq, Int, Ed), the silhouette coefficient improves further to 0.2731. Adding information about the binding cavity volume (Seq, Int, Ed, Vol) slightly increases the quality of the embedding to 0.2757. The silhouette coefficients for error correction and volume-based fingerprints were calculated as baseline comparison. If only pre- or post-transfer correction mechanisms (Ed) are considered the mean silhouette coefficient amounts to −0.3027. For binding cavity volume (Vol) the mean silhouette coefficient is −0.4682.

Relation to physicochemical properties of the ligands

In order to investigate whether the fingerprinting approach is a simple encoding of the physicochemical properties of the amino acids, the results were related to experimentally determined phase transfer free energies for the side chains of amino acids from water ( (Delta G_) ) and vapor ( (Delta G_) ) to cyclohexane 3,63 . These energies are descriptors for the size and polarity of amino acid side chains and underlie both, the rules of protein folding and the genetic code 64 . The Spearman’s rank correlation between pairwise distances for each aaRS in the recognition space and physicochemical property space is weak with ( ho ) =0.2564 and p (<0.01) (see SI Appendix Fig. S28). This indicates that the fingerprinting approach used in this study is a true high-dimensional representation of the complex binding mechanisms of amino acid recognition in aaRSs. This assumption is supported by a PCA (SI Appendix Fig. S26) of the fingerprint data, where the first two principal components account for only 9.24% and 8.44% of the covered variance, respectively.

Comparison of different fingerprint designs that include the sequence composition of the enzyme’s binding site (Seq), non-covalent interactions formed between side chains of the enzyme’s binding site and the amino acid ligand (Int), pre- or post-transfer correction (i.e. “editing”) mechanisms (Ed), and volume of the enzyme’s binding cavity (Vol). Simple sequence-based fingerprints (Seq (_ ext ) ) are a 20-dimensional representation of binding site composition. The line plot shows the silhouette coefficient 62 for each embedding. Points represent mean values, error bars are calculated based on all silhouette coefficients for each data point.


Discussion

In this study, we characterize the translocation of threonine, α-aminobutyrate, and cysteine during editing by ValRS. For all three amino acids, the translocation rates are similar to their respective overall editing rates (2.7–3.5 s −1 ). The rate of translocation is considerably slower than the maximum rate of hydrolysis of exogenously added misacylated tRNA Val (20–40 s −1 ) (18, 19). Thus, once the misactivated amino acid is translocated to the site for editing, the chemical step for hydrolysis is relatively instantaneous. Consequently, under normal circumstances where a noncognate amino acid is mixed with tRNA Val , translocation is rate-limiting for editing.

The close similarities in the translocation rate constants measured for threonine and cysteine establish that the editing domain is not designed to select a specific misactivated amino acid. This possibility is supported by our observation that α-aminobutyrate also is efficiently translocated during editing, even though it is an unnatural amino acid in E. coli (hence, the existence of evolutionary pressure on the E. coli editing domain to select α-aminobutyrate as a substrate is not obvious). Instead, to carry out its role as the “fine sieve” in the double-sieve-editing model, the editing domain probably is structured to accept all misactivated amino acids and to strictly prevent the entrance of the activated cognate amino acid.

The translocation of misactivated amino acid during ValRS editing is thought to occur primarily by the posttransfer pathway, that is, by the deacylation of mischarged tRNA Val (20). A possible molecular mechanism for posttransfer editing in IleRS has been inferred from the structure of IleRS complexed to tRNA Ile (9). Specifically, the last three nucleotides of the tRNA (74–76) are proposed to adopt two conformations in the IleRS⋅tRNA Ile complex. The hairpinned conformation projects the A 76 nucleotide into the active site of the enzyme, where it can be aminoacylated, whereas the stacked conformation places the A 76 nucleotide in the editing domain, where an incorrect amino acid (attached to A 76 ) can be hydrolyzed. The switch from the hairpinned to the stacked conformation could therefore provide the mechanism for translocation during editing.

A similar mechanism might be responsible for the translocation of misactivated amino acids during editing by ValRS. In such a mechanism, the rate of translocation will depend primarily on the rate of the tRNA switching from the hairpinned to the stacked conformation, and not on the side chain of the amino acid attached to the tRNA. This prediction is consistent with our observation that threonine, α-aminobutyrate, and cysteine are translocated with similar efficiencies. It also implies that there is no physical contact between the amino acid side chain and the surface of the enzyme that lies between the synthetic active site and the editing site. If the side chain of an aminoacyl group made contact with the enzyme during translocation, then the difference between the more polar threonine and cysteine, on the one hand, and the hydrophobic α-aminobutyrate, on the other, would probably be reflected in different rates of translocation. Thus, we infer that the amino acid side chain points out, away from the surface of the protein during translocation.


How do aminoacyl-tRNA synthases distinguish between similar amino acids? - La biologie

a School of Biology, Biomedical Sciences Research Complex, University of St Andrews, St Andrews, Fife KY16 9ST, UK
E-mail: [email protected]

b Arab Academy for Science, Technology, and Maritime Transport (AASTMT), Cairo Campus, Egypt

c Institute of Quantitative Biology, Biochemistry and Biotechnology, University of Edinburgh, Waddington 1 Building, King's Buildings, Edinburgh, UK

Résumé

Cyclodipeptide synthases (CDPSs) produce a variety of cyclic dipeptide products by utilising two aminoacylated tRNA substrates. We sought to investigate the minimal requirements for substrate usage in this class of enzymes as the relationship between CDPSs and their substrates remains elusive. Here, we investigated the Bacillus thermoamylovorans enzyme, BtCDPS, which synthesises cyclo(L-Leu–L-Leu). We systematically tested where specificity arises and, in the process, uncovered small molecules (activated amino esters) that will suffice as substrates, although catalytically poor. We solved the structure of BtCDPS to 1.7 Å and combining crystallography, enzymatic assays and substrate docking experiments propose a model for how the minimal substrates interact with the enzyme. This work is the first report of a CDPS enzyme utilizing a molecule other than aa-tRNA as a substrate providing insights into substrate requirements and setting the stage for the design of improved simpler substrates.


Avalos J, Corrochano LM, Brenner S (1991) Cysteinyl-tRNA synthetase is a direct descendant of the first aminoacyl-tRNA synthetase. FEBS Lett 286:176–180

Campbell J (1991) An RNA replisome as the ancestor of the ribosome. J Mol Evol 32:3–5

Crick FHC (1968) The origin of the genetic code. J Mol Biol 38:367–379

Crick FHC, Brenner S, Klug A, Pieczenik G (1976) A speculation on the origin of protein synthesis. Orig Life 7:389–397

Cusack S (1993) Sequence, structure and evolutionary relationships between class 2 aminoacyl-tRNA synthetases—an update. Biochimie 75:1077–1081

Cusack S, Berthet-Colominas C, Hartlein M, Nassar N, Leberman R (1990) A second class of synthetase structure revealed by X-ray analysis of Escherichia coli seryl-tRNA synthetase at 2.5Å. Nature 347:249–255

Cusack S, Härtlein M, Leberman R (1991) Sequence, structural and evolutionary relationships between class 2 aminoacyl-tRNA synthetases. Nucleic Acids Res 19:3489–3498

Doolittle RF (1979) Protein evolution. In: Neurath H, Hill RL (eds). The proteins. Academic Press, New York, p 1

Doolittle RF (1987) Of urfs and orfs. University Science Books, Mill Valley, CA, pp 26–28

Doolittle RF (1994) Convergent evolution: the need to be explicit. Trends Biochem Sci 19:15–18

Doolittle RF, Feng DF (1990) Nearest neighbor procedure for relating progressively aligned amino acid sequences. Methods Enzymol 183:659–669

Eriani G, Delarue M, Poch O, Gangloff J, Moras D (1990) Partition of tRNA synthetases into two classes based on mutually exclusive sets of sequence motifs. Nature 347:203–206

Eriani G, Dirheimer G, Gangloff J (1991) Cysteinyl-tRNA synthetase: determination of the last E. coli aminoacyl-tRNA synthetase primary structure. Nucleic Acids Res 19:265–269

Feng DF, Doolittle RF (1990) Progressive alignment of phylogenetic tree construction of protein sequences. Methods Enzymol 183:375–387

Hou Y-M, Shiba K, Mottes C, Schimmel P (1991) Sequence determination and modeling of structural motifs for the smallest monomeric Amnoacyl-tRNA synthetase. Proc Natl Acad Sci USA 88:976–980

Hountondji C, Blanquet S, Lederer F (1985) Methionyl tRNA synthetase from Escherichia coli: primary structure at the binding site for the 3′end of tRNA-fMet. Biochemistry 24:1175–1180

Jacobo-Molina A, Peterson R, Yang DCH (1989) cDNA sequences, predicted primary structure and evolving amphiphilic helix of human aspartyl-tRNA synthetase. J Biol Chem 264:16608–16612

Lamour V, Quevillon S, Diriong S, N'Guyen VC, Lipinski M, Mirande M (1994) Evolution of the Glx-tRNA synthetase family: the glutaminyl-enzyme as a case of horizontal gene transfer. Proc Natl Acad Sci USA (in press)

Majerfeld I, Yarus M (1994) An RNA pocket for an aliphatic hydrophobe. Nature Struct Biol 1:287–292

Moras D (1992a) Aminoacyl-tRNA synthetases. Curr Opin Struct Biol 2:138–142

Moras D (1992b) Structural and functional relationships between aminoacyl-tRNA synthetases. Trends Biochem Sci 17:159–164

Mosyak L, Safro M (1993) Phenylalanyl-tRNA synthetase from Thermus thermophilus has four antiparallel folds of which only two are catalytically functional. Biochemie 75:1091–1098

Nagel GM, Doolittle RF (1991) Evolution and relatedness in two aminoacyl-tRNA synthetase families. Proc Natl Acad Sci USA 88:8121–8125

Orgel LE (1968) Evolution of the genetic apparatus. J Mol Biol 38:381–393

Orgel LE (1989) The origin of polynucleotide-directed protein synthesis. J Mol Evol 29:465–474

Ruff M, Krishnaswamy S, Boeglin M, Poterszman A, Mitschler A, Podjarny A, Rees B, Thierry JC, Moras D (1991) Class II aminoacyl transfer RNA synthetases: crystal structure of yeast aspartyl-tRNA synthetase complex with tRNA (Asp). Science 252:1682–1689

Schimmel P (1991) Classes of Amnoacyl-tRNA synthetases and the establishment of the genetic code. Trends Biochem Sci 16:1–3

Schimmel P, Giegét R, Moras D, Yokoyama S (1993) An operational RNA code for amino acids and possible relationship to genetic code. Proc Natl Acad Sci USA 90:8763–8768

Szathmáry E (1993) Coding coenzyme handles: a hypothesis for the origin of the genetic code. Proc Natl Acad Sci USA 90:9916–9920

Taylor FJR, Coates D (1989) The code within the codons. Biosystems 22:177–187

Walker EJ, Jeffrey PD (1988) Sequence comparisons in the aminoacyl-tRNA synthetases with emphasis on regions of likely homology with sequences in the Rossmann fold in the methionyl and tyrosyl enzymes. Protein Seq Data Anal 1:187–193

Weiner AM, Maizels N (1987) tRNA-like structures tag the 3′ ends of genomic RNA molecules for replication: implications for the origin of protein synthesis. Proc Natl Acad Sci USA 84:7383–7387

Wetzel R (1978) Aminoacyl-tRNA synthetase families and their significance to the origin of the genetic code. Orig Life 9:39–50

Woese CR (1967) The genetic code. Harper & Roe, New York

Wong JT (1975) A co-evolution theory of the genetic code. Proc Natl Acad Sci USA 72:1909–1912

Wong JT (1991) Origin of genetically encoded protein synthesis: a model based on selection for RNA peptidation. Orig Life 21:165–176

Yarns M (1988) A specific amino acid binding site composed of RNA. Science 240:1751–1758


Quality control of the translation machinery

Faithful translation of the mRNA codons into protein is essential for cellular physiology. The fidelity of the translation machinery firstly depends on the specific coupling of amino acids to their cognate tRNA species, which is catalyzed by aminoacyl-tRNA synthetases (aaRSs) (Fig 4a and 4b). aaRS is capable of discriminating its cognate substrates from structurally analogous tRNAs and amino acids [39]. Subsequently, eukaryotic elongation factor 1A (eEF-1A) or prokaryotic EF-Tu delivers the aminoacyl-tRNA to the ribosome A site for elongation of nascent peptide chain after proper codon–anticodon recognition [40]. Thus, aaRSs are cardinal in protecting protein synthesis against misacylation [39], but their specificity is not absolute. Par exemple, dans E. coli, four types of misacylated-tRNA—including Cys-tRNA Pro , Ser-tRNA Thr , Glu-tRNA Gln , and Asp-tRNA Asn —do not evoke a correctional reaction [41]. In both mice and bacteria, serine is prone to be misacylated by alanyl-tRNA synthetases (AlaRSs) [42]. In mycobacteria, an increase in the substitution of glutamic acid→glutamine and aspartic acid→asparagine by translational misincorporation has been linked to phenotypic resistance to rifampicin treatment [43]. Thus, beneficial mistranslation in both prokaryotes and eukaryotes may exist and improve their survival or facilitate drug resistance [43–45]. Apart from misdecoding, misacylation of amino acids to tRNA molecules is another important source of mistranslated proteins, despite the presence of mechanisms preventing such events.

(a) aa-tRNAs are synthesized by sampling from the amino acid pool and tRNA pool and require catalysis by aaRSs. This process may accidently introduce misacylated aa-tRNAs, because the types of tRNAs and amino acids are difficult to be distinguished by involved aminoacyl synthetase because of analogous structures. (b) During elongation, tRNA wobbling will increase translation efficiency. Misincorporation can also be introduced because of tRNA misdecoding (amino acid misincorporation caused by excessive wobble decoding), especially when certain codon-paired tRNA species are missing. Finally, the fidelity of translation machinery will be impaired and produce mutated proteome, including RNA and DNA polymerases, aaRSs, and accessories. (c) Mistranslation of RdRP in RNA viruses will augment generation of a mutated virome (quasispecies) and facilitate viral evolution and adaption. (d) Similarly, mistranslation of cellular DNA replication-related enzymes and relative proteins amplifies mutagenesis in the genome and contributes to cancer development. aaRS, aminoacyl-tRNA synthetase aa-tRNA, aminoacyl-tRNA RdRP, RNA-dependent RNA polymerase tRNA, transfer RNA.

How could tRNA wobbling guarantee faithful decoding by the codon–anticodon duplex? During elongation, eEF-1A or EF-Tu delivers amino acid–coupled tRNA to the ribosome A site [40]. Subsequently, the ribosome rechecks the codon–anticodon duplex that involves the highly conserved G530, A1492, and A1493 of 16S RNA via stabilization of the first two Watson-Crick pairs of the duplex [31, 46]. A correct confirmation of the codon–anticodon duplex will induce a conformational domain closure in the ribosome and result in the formation of the appropriate peptide bond and elongate the nascent protein [47]. Analysis of X-ray structures suggests that the positions 1 and 2 of the A codon are obligatory Watson-Crick base pairs. In prokaryotes, when U•G and G•U wobbles at the first or second codon–anticodon position, the decoding center forces this pair to adopt the geometry close to that of a canonical C•G pair [40]. Using nuclear magnetic resonance (NMR) relaxation dispersion, it has recently been revealed that dG•dT misincorporation during replication is likely mediated via tautomerization and ionization [37]. As discussed, these Watson-Crick-like mismatches may further contribute to tRNA wobbling and consequently misdecoding [5]. Although the hydrogen bond is the major force to form codon–anticodon pairs [1], the van der Waals forces, steric complementarity, and shape acceptance may concurrently contribute to the codon–anticodon recognition essentially for quality control [3, 40].


Not an inside job: non-coded amino acids compromise the genetic code

The sophistication of the editing mechanisms that prevent gene translation errors indicates that amino acid misincorporation is generally a problem to be avoided. Mistranslation is considered invariably deleterious and often caused by confusion between similar proteogenic amino acids. These views are being challenged. The evidence linking misincorporation of dietary non-proteogenic amino acids to human disease continues to grow, and a report in this issue of The EMBO Journal demonstrates the importance of preventing non-proteogenic amino acid misincorporation for cellular homeostasis (Cvetesic etਊl, 2014).

See also: N Cvetesic et al (August 2014)

The genetic code holds the key to translate 64 codons into 20-odd amino acids. The enzymes that aminoacylate tRNAs, aminoacyl-tRNA synthetases (ARS), are the keepers of the code as they create the molecular link between amino acids and triplet information in the tRNA. ARS form two families of enzymes with a peculiar symmetric organization that clusters them in groups that recognize chemically similar amino acids. These two families possibly emerged from an ancestral complex of two proteins around a single tRNA molecule that evolved to increase the number of cognate substrates as the genetic code grew to its extant size. This expansion in cognate substrates logically involved the gradual incorporation of relatively similar side chains to those that were previously used (Ribas de Pouplana & Schimmel, 2001).

The extent to which some proteogenic amino acids are similar to each other𠅊s well as the structural organization of the ARS themselves𠅎xplain the difficulty in discriminating between certain residues during tRNA aminoacylation. To make matters worse, several nonprotein amino acids, which are ubiquitous in many cellular metabolic pathways, can also be mistakenly incorporated into proteins through ARS recognition errors that also require editing reactions to be corrected (Jakubowski, 2012).

Linus Pauling was the first to note that the chemical proximity between some side chains makes it impossible for ARS to discriminate between them with a tolerable error rate (Pauling, 1958). Hence the necessity of editing activities to remove incorrectly charged amino acids was postulated. A “second sieve” model for aminoacylation editing was proposed by Alan Fersht, and later proven to exist in several ARS (reviewed in Yadavalli & Ibba, 2012).

Valine, isoleucine, and leucine are good examples of amino acids requiring proofreading due to their chemical similarity. The discovery of a common editing domain shared by the ARS cognate to these three residues reinforced the notion that misincorporations would mostly involve related proteogenic amino acids, and that such errors always need to be corrected. However, mistranslation need not be limited to proteogenic amino acids and, in some cases, it may offer adaptive advantages to cells.

In this issue of The EMBO Journal Gruic-Sovulj and colleagues elegantly demonstrate that the editing domain of leucyl-tRNA synthetase (LeuRS) is not designed to fend off the misincorporation of isoleucine, as was previously thought. Earlier reports that suggested otherwise were marred by an unsuspected contamination of leucine in commercial preparations of isoleucine. Once the contaminating cognate amino acid is removed from the reaction the authors clearly show, by kinetic, structural, thermodynamic and in vivo approaches, that isoleucine is in fact a very poor substrate for LeuRS, which gets discriminated early in the reaction cycle and is not incorporated (substantially) to tRNA (Cvetesic etਊl, 2014). This clearly obviates a need for isoleucine editing (Fig ​ (Fig1 1 ).

Contrary to previous belief isoleucine is very effectively discriminated by the synthetic active site of LeuRS, and is not activated nor transferred to tRNALeu. Norvaline is easily charged to tRNA, and requires a posterior docking into the editing domain of the enzyme to prevent its incorporation into proteins.

Norvaline, a non proteogenic amino acid that in microaerobic conditions accumulates in the cytosol of E.਌oli (Soini etਊl, 2008) is, on the other hand, an excellent analog of leucine and is readily mischarged to tRNA Leu by LeuRS. However, accumulation of norvaline-tRNA Leu is prevented by the editing domain of LeuRS (Cvetesic etਊl, 2012).

A beautiful physiologic explanation to this biochemistry is offered in the paper when the authors show that E.਌oli grown under aerobic conditions do not require editing by LeuRS, whereas this activity becomes essential when intracellular concentrations of norvaline increase as a result of growth in microaerobic conditions.

Norvaline thus joins the ranks of non-proteogenic amino acids that can be misincorporated into proteins and cause toxicity. Indeed, recent reports have established links between several types of human neurodegeneration and the ingestion of non-proteogenic amino acids. For example, beta-methylamino-L-alanine is an amino acid analog taken up in the diet, and mischarged by seryl-tRNA synthetases respectively due to its similarity to serine (Dunlop etਊl, 2013). It is still unclear why the nervous system is more affected by this insult than other tissues.

Opposite to the previous examples, a body of literature is also starting to accumulate that reports on cellular strategies that utilize mistranslation to improve biologic fitness. For example, the adaptive nature of random variations in the proteome caused by amino acid misincorporation has been demonstrated in Candida albicans. The proteome of this pathogenic fungus undergoes generalized serine to leucine substitutions as an adaptive strategy that increases the virulence of this species (Moura etਊl, 2010).

The existence of an adaptive mistranslation has been confirmed in bacteria and human cells, and we now know that the mis-methiolation of proteins is a strategy used across the phylogenetic tree to minimize the damage caused by oxidative stress (Pan, 2013). Thus, amino acid misincorporation needs not be a deleterious mistake, but can sometimes be seen as a beneficial relaxation in translation fidelity that increases the fitness of the organism.


The return of pretransfer editing in protein synthesis

The accuracy with which the genetic information contained in protein-coding genes is faithfully translated into the corresponding sequence of amino acids has long fascinated biologists. Before the mechanisms of transcription and protein synthesis had been uncovered in the exquisite molecular detail we know today, some of the inherent problems of faithful gene expression were obvious. Crick's seminal adaptor hypothesis (1) predicted the existence of many then-unknown components of translation, including the aminoacyl-tRNA synthetases. The aminoacyl-tRNA synthetases in effect define the genetic code by catalyzing a 2-step reaction that pairs amino acids with their cognate tRNAs to provide substrates for ribosomal protein synthesis. In the first step, an amino acid is condensed with ATP to form an aminoacyl-adenylate. In the second reaction, the aminoacyl group is transferred to the 3′ end of the tRNA. The aminoacyl-tRNA synthetases also provide a critical safeguard to maintain fidelity during translation of the genetic code by discriminating against and, when necessary, editing noncognate amino acids. Crick was quick to point out that specificity would be of paramount importance to the synthetases, because their function in protein synthesis would require them to precisely distinguish similar amino acids such as isoleucine and valine. Linus Pauling (2), who reasoned that small differences in binding energy between aliphatic amino acids would not provide the level of discrimination necessary for faithful protein synthesis, had also noted this particular problem in molecular recognition. This discrepancy, between the specificity achievable during recognition and the accuracy required for translation, was resolved with the discovery of editing.

It was observed that although isoleucyl-tRNA synthetase did indeed recognize and activate valine, the intermediate valyl-adenylate was subsequently hydrolyzed in a tRNA-dependent reaction (3). The net result is that although isoleucyl-tRNA synthetase can use both isoleucine and valine, only the cognate product isoleucyl-tRNA Ile accumulates. Numerous studies of isoleucyl-tRNA and other synthetases have provided a general picture of the structure and mechanism of editing (Fig. 1). It had long been known that editing could occur either before (pretransfer) or after (posttransfer) amino acids are covalently attached to tRNA, an essential component of the protein synthesis machinery. In both cases the net result is the same, synthesis and release of noncognate aminoacyl-tRNA is prevented and translational accuracy is maintained. In recent years the biological relevance of the pretransfer route had come under question, and the prevailing dogma was that, with a few notable exceptions, editing was essentially a posttransfer process. In this issue of PNAS, Martinis and coworkers (4) now show that posttransfer editing can mask pretransfer editing activity, a finding with far-reaching implications for both quality control and the evolution of protein synthesis.

Posttransfer editing can mask pretransfer editing activity.

Pretransfer and posttransfer editing of noncognate amino acids by aminoacyl-tRNA synthetases. The amino acid (AA) is activated in an ATP-dependent reaction at the active site (AS) to form an enzyme-bound aminoacyl-adenylate (AA-AMP). In pretransfer editing, AA-AMP is hydrolyzed directly, thereby preventing the synthesis of a noncognate aminoacyl-tRNA. In posttransfer editing, AA-AMP is a substrate for esterification of the 3′ end of the tRNA, which then translocates to the editing site (ES) where the AA is removed. PPi, pyrophosphate.

The posttransfer reaction either occurs en cis, before the noncognate aminoacyl-tRNA is released, or en trans catalyzed by synthetases or specific hydrolases (5). A large number of biochemical and structural studies have clearly shown that this reaction occurs in a second active site that is distinct from the ancient catalytic core. Less frequently, the noncognate aminoacyl-adenylate will be hydrolyzed before tRNA esterifcation in a so-called pretransfer reaction (6). However, the relationship between these 2 pretransfer and posttransfer editing pathways has remained unclear in most systems. In particular, the mechanism and physiological relevance of pretransfer editing has continued to be contentious. Many of the points of dispute arise from the inherent instability of aminoacyl-adenylates, which makes their study difficult in vitro and almost impossible in vivo. In addition, much of the controversy surrounding the pretransfer pathway had come from difficulties in envisioning the molecular mechanism by which an unstable aminoacyl-adenylate could translocate some 30 Å from the active site before hydrolysis. Indeed, several examples of pretransfer editing by synthetases that lack a separate editing domain have been reported (7 ⇓ –9).

Leucyl-tRNA synthetase (LeuRS) presents an ideal model system for studying the relationship between, and relative significance of, pretransfer and posttransfer editing. In addition to the well-documented modularity of the conserved CP1 editing domain (10 ⇓ –12), different LeuRSs show widely divergent editing mechanisms. Par exemple, Escherichia coli LeuRS is known to use a posttransfer editing mechanism to deacylate tRNAs charged with a variety of noncognate amino acids, including isoleucine, valine, norvaline, and methionine. Most notably for the present study, although it has been proposed that the yeast enzyme predominantly relies on pretransfer editing, the E. coli enzyme shows no such activity and solely uses posttransfer editing (13). In their study, Martinis and coworkers (4) set out to exploit the known properties of the E. coli enzyme to probe the relationship between pretransfer and posttransfer editing in more detail.

Previous studies had suggested that particular residues are needed for the effective transfer of editing substrates from the synthetic active site to the hydrolytic editing site in the CP1 module of LeuRS (14). To study this postulated translocation pathway Martinis and coworkers (4) used a combination of LeuRS mutants defective in posttransfer editing and CP1 deletion mutants of both E. coli (ecΔCP1) and yeast mitochondrial (ymΔCP1) LeuRSs. The ΔCP1 deletion mutants were found to retain significant cognate aminoacylation activity (Leu-tRNA Leu synthesis), although they did show some loss compared with the wild type. This modest loss in leucylation by the ΔCP1 mutants was not unexpected and was consistent with suggestions that the CP1 domain stabilizes enzyme–tRNA interactions. When tested for hydrolysis en trans of noncognate Ile-tRNA Leu , both of the ΔCP1 deletion mutants display negligible levels of deacylation, confirming that, as expected, these mutants retain little or no posttransfer editing activity. Martinis and coworkers next performed a final control and tested the ability of the mutants to synthesize mischarged tRNAs, a typical property of enzymes in which posttransfer editing has been disrupted. Whereas the editing-site mutant T252Y showed robust Ile-tRNA Ile synthesis as predicted, the ecΔCP1 and ymΔCP1 mutants were incapable of mischarging tRNA Leu with Ile. Pyrophosphate exchange assays performed to test the misactivation of Ile and other noncognate substrates showed that the ecΔCP1 mutant misactivated Ile to a level comparable with that of wild type. The ability of ecΔCP1 to misactivate Ile, together with its inability to form Ile-tRNA, suggested the existence of a dormant pretransfer editing activity, which is only apparent when the posttransfer editing CP1 domain is removed. Finally, by using inactive tRNAs modified to lack the site for amino acid attachment, pretransfer editing activity was shown to be strongly stimulated by tRNA despite the absence of the CP1 domain.

In unveiling pretransfer editing activity in E. coli LeuRS, an enzyme believed to solely depend on posttransfer editing for quality control, Martinis and coworkers (4) raise a number of questions about the origin and function of editing. The most immediate result of their study is to force a reassessment of tRNA-dependent pretransfer editing. Their work clearly shows that translocation to a distinct editing domain is not a prerequisite for tRNA-dependent pretransfer editing as had previously been proposed, which, in turn, raises the question as to how tRNA facilitates editing without itself being aminoacylated. Presumably this would involve increasing the rate of hydrolysis within the active site itself and/or accelerating adenylate dissociation as a prelude to spontaneous hydrolysis, both of which were recently shown to contribute to tRNA-independent editing by prolyl-tRNA synthetase (6). However this particular pretransfer editing mechanism is eventually resolved, the observation that the extant E. coli LeuRS:tRNA Leu pair contains the functional remnants of a rudimentary ribonucleoprotein has some interesting evolutionary implications. The tRNA dependence of this hidden pretransfer editing activity is consistent with the coevolution of tRNAs and quality-control mechanisms, helping to explain how structurally similar amino acids were added to the genetic code without compromising the fidelity of translation.

The biggest remaining mystery of this study is why the E. coli LeuRS has retained a “hidden” capacity for pretransfer editing that would appear to be redundant given that it already has robust posttransfer activity. Editing is not ubiquitous to synthetases as illustrated by the fact that some enzymes, including human mitochondrial LeuRS, have lost their proofreading capacity and rely instead on accurate substrate recognition (15 ⇓ –17). In this context, the retention of 2 distinct editing pathways is all the more surprising and would seem to suggest that the pretransfer reaction of E. coli LeuRS may actually be required for an activity other than translational quality control. No matter what this activity might turn out to be, to paraphrase Mark Twain, reports of the death of pretransfer editing are greatly exaggerated.