Informations

23.3 : Analyse des flux métaboliques - Biologie

23.3 : Analyse des flux métaboliques - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

L'analyse des flux métaboliques (AMF) est un moyen de calculer la distribution des flux de réaction qui est possible dans un réseau métabolique donné à l'état d'équilibre. Encore une fois, cette analyse est indépendante de la biologie particulière du système ; elle ne dépendra plutôt que des stoechiométries (universelles) des réactions en question.

Représentation mathématique

Considérons un système avec m métabolites et n réactions. Soit xi la concentration du substrat i, de sorte que le taux de variation de la concentration du substrat est donné par la dérivée temporelle de xi . Soit x le vecteur colonne (à m composantes) avec les éléments xi . Pour plus de simplicité, nous considérons un système avec m = 4 métabolites A, B, C et D. Ce système consistera en de nombreuses réactions entre ces métabolites, résultant en un équilibre compliqué entre ces composés.

Encore une fois, considérons la réaction simple A + 2B ( ightarrow) 3C. Nous pouvons représenter cette réaction sous forme vectorielle par (-1 -2 3 0). Notez que les deux premiers métabolites (A et B) ont des signes négatifs, car ils sont consommés dans la réaction. De plus, les éléments du vecteur sont déterminés par la stoechiométrie de la réaction, comme dans la section 2.1. Nous répétons cette procédure pour chaque réaction dans le système. Ces vecteurs deviennent les colonnes de la matrice stoechiométrique S. Si le système a m métabolites et n réactions, S sera une m n matrice. Par conséquent, si nous définissons v comme le vecteur colonne à n composants des flux dans chaque réaction, le vecteur Sv décrit le taux de variation de la concentration de chaque métabolite. Mathématiquement, cela peut être représenté comme l'équation fondamentale de l'analyse des flux métaboliques :

[frac{d x}{d t}=S v onumber]

La matrice S est une structure de données extraordinairement puissante qui peut représenter une variété de scénarios possibles dans les systèmes biologiques. Par exemple, si deux colonnes c et d de S ont la propriété que c = d, les colonnes représentent une réaction réversible. De plus, si une colonne a la propriété qu'un seul composant est non nul, elle représente une réaction d'échange, dans laquelle il y a un flux dans (ou depuis) ​​un puits (ou source) supposé infini, selon le signe du composant non nul.

Nous imposons maintenant l'hypothèse d'état stationnaire, qui dit que la taille de gauche de l'équation ci-dessus est identiquement nulle. Par conséquent, nous devons trouver des vecteurs v qui satisfont le critère Sv = 0. Les solutions de cette équation détermineront les flux réalisables pour ce système.

Espace nul de S

L'espace de flux réalisable des réactions dans le système modèle est défini par l'espace nul de S, comme vu ci-dessus. Rappelons de l'algèbre linéaire élémentaire que l'espace nul d'une matrice est un espace vectoriel ; c'est-à-dire que, étant donné deux vecteurs y et z dans l'espace nul, le vecteur ay + bz (pour les nombres réels a, b) est également dans l'espace nul. Puisque l'espace nul est un espace vectoriel, il existe une base bi, un ensemble de vecteurs linéairement indépendants et couvrant l'espace nul. La base a la propriété que pour tout flux v dans l'espace nul de S, il existe des nombres réels (alpha)je tel que

[v=Sigma_{i} alpha_{i} b_{i} onumber]

Comment trouver une base pour l'espace nul d'une matrice ? Un outil utile est la décomposition en valeurs singulières (SVD) [4]. La décomposition en valeurs singulières d'une matrice S est définie comme une représentation S = UEV*, où U est une matrice unitaire de taille m, V est une matrice unitaire de taille n, et E est une matrice diagonale mxn, avec le (nécessairement positif ) valeurs singulières de S dans l'ordre décroissant. (Rappelons qu'une matrice unitaire est une matrice à colonnes et lignes orthonormées, c'est-à-dire U * U = U U * = I la matrice identité). On peut montrer que toute matrice a un SVD. Notez que le SVD peut être réorganisé dans l'équation (S v=sigma u), où u et v sont des colonnes des matrices U et V et est une valeur singulière. Donc, si (sigma) = 0, v appartient à l'espace nul de S. En effet, les colonnes de V qui correspondent aux valeurs singulières nulles forment une base orthonormée pour l'espace nul de S. De cette manière, le SVD nous permet de caractériser complètement les flux possibles pour le système.

Contraindre l'espace de flux

La première contrainte mentionnée ci-dessus est que tous les vecteurs de flux en régime permanent doivent être dans l'espace nul. De plus, les flux négatifs ne sont pas thermodynamiquement possibles. Par conséquent, une contrainte fondamentale est que tous les flux doivent être positifs. (Dans ce cadre, nous représentons les réactions réversibles comme des réactions séparées dans la matrice stoechiométrique S ayant deux flux unidirectionnels.)

Ces deux contraintes clés forment un système qui peut être résolu par analyse convexe. La région de solution peut être décrite par un ensemble unique de voies extrêmes. Dans cette région, les vecteurs de flux à l'état stationnaire v peuvent être décrits comme une combinaison linéaire positive de ces voies extrêmes. Les voies extrêmes, représentées sur la diapositive 25 par des vecteurs bi, circonscrivent un cône de flux convexe. Chaque dimension est un taux pour une réaction. Dans la diapositive 25, la dimension z représente la vitesse de réaction pour v3 . Nous pouvons reconnaître qu'à tout moment, l'organisme vit à un point dans le cône de flux, c'est-à-dire qu'il démontre une distribution de flux particulière. Chaque point du cône de flux peut être décrit par un vecteur de flux en régime permanent possible, contrairement aux points situés à l'extérieur du cône.

Un problème est que le cône de flux sort à l'infini, alors que des flux infinis ne sont pas physiquement possibles. Par conséquent, une contrainte supplémentaire consiste à plafonner le cône de flux en déterminant les flux maximaux de l'une de nos réactions (ces valeurs correspondent à nos paramètres Vmax). Étant donné que de nombreuses réactions métaboliques sont internes à la cellule, il n'est pas nécessaire de fixer un plafond pour chaque flux. Ces plafonds peuvent être déterminés expérimentalement en mesurant les flux maximaux, ou calculés à l'aide d'outils mathématiques tels que les règles de diffusivité.

Nous pouvons également ajouter des flux d'entrée et de sortie qui représentent le transport vers et hors de nos cellules (Vin et Vout). Ceux-ci sont souvent beaucoup plus faciles à mesurer que les flux internes et peuvent donc nous aider à générer un espace de flux plus pertinent sur le plan biologique. Un exemple d'algorithme pour résoudre ce problème est l'algorithme du simplexe [1]. Les diapositives 24-27 montrent comment les contraintes sur les flux modifient la géométrie du cône de flux. En réalité, nous avons affaire à des problèmes dans des espaces de dimension supérieure.

Programmation linéaire

La programmation linéaire est une solution générique capable de résoudre des problèmes d'optimisation compte tenu des contraintes linéaires. Ceux-ci peuvent être représentés sous différentes formes.

Forme canonique :

• Maximiser : (c^{T} x)
• Sous réserve de : (A x leq b)

Forme standard :

• Maximiser (Sigma c_{i} * x_{i})
• Sous réserve de (a_{i j} X_{i} leq b_{i} ext { foralli, } j)
• Contrainte de non-négativité : (X_{i} geq 0)

Une introduction concise et claire à la programmation linéaire est disponible ici : www.purplemath. com/modules/linprog.htm Les contraintes décrites tout au long de la section 3 nous donnent le problème de programmation linéaire décrit dans le cours. La programmation linéaire peut être considérée comme une première approximation et est un problème classique en optimisation. Afin d'essayer de réduire notre flux réalisable, nous supposons qu'il existe une fonction de fitness qui est une combinaison linéaire d'un nombre quelconque de flux dans le système. La programmation linéaire (ou optimisation linéaire) consiste à maximiser ou à minimiser une fonction linéaire sur un polyèdre convexe spécifié par des contraintes linéaires et de non-négativité.

Nous résolvons ce problème en identifiant la distribution de flux qui maximise une fonction objectif :

Le point clé de la programmation linéaire est que nos solutions se situent aux limites de l'espace de flux admissible et peuvent être sur des points, des arêtes ou les deux. Par définition cependant, une solution optimale (si elle existe) se situera en un point de l'espace de flux admissible. Ce concept est démontré sur la diapositive 30. Dans cette diapositive, A est la matrice stoechiométrique, x est le vecteur des flux et b est un vecteur des flux maximaux admissibles.

Les programmes linéaires, lorsqu'ils sont résolus à la main, sont généralement effectués par la méthode Simplex. La méthode simplex définit le problème dans une matrice et effectue une série de pivots, basés sur les variables de base de l'énoncé du problème. Dans le pire des cas, cependant, cela peut fonctionner en un temps exponentiel. Heureusement, si un ordinateur est disponible, deux autres algorithmes sont disponibles. L'algorithme ellipsoïde et les méthodes Interior Point sont tous deux capables de résoudre n'importe quel programme linéaire en temps polynomial. Il est intéressant de noter que de nombreux problèmes apparemment difficiles peuvent être modélisés sous forme de programmes linéaires et résolus ecacement (ou aussi ecacement qu'une solution générique peut résoudre un problème spécifique).

Dans les microbes tels que E. coli, cette fonction objective est souvent une combinaison de flux qui contribuent à la biomasse, comme le montre la diapositive 31. Cependant, cette fonction n'a pas besoin d'être complètement biologiquement significative.

Par exemple, nous pourrions simuler la maximisation des mycolates chez M. tuberculosis, même si cela ne se produit pas biologiquement. Cela nous donnerait des prédictions significatives sur les perturbations qui pourraient être effectuées in vitro qui perturberaient la synthèse des mycolates même en l'absence de la maximisation de la production de ces métabolites. L'analyse de la balance de flux (FBA) a été lancée par le groupe Palssons à l'UCSD et a depuis été appliqué à E. coli, M. tuberculosis et au globule rouge humain [? ].


Étudier les adaptations des flux métaboliques dans le cancer grâce à des approches expérimentales-informatiques intégrées

L'étude du recâblage tumorigène des flux métaboliques est au cœur de la recherche métabolique contre le cancer. Ici, nous passons en revue deux approches d'inférence de flux informatiques largement utilisées : le traçage isotopique couplé à l'analyse de flux métabolique (13C-MFA) et à la reconstruction et à l'analyse basées sur les contraintes (COBRA). Nous décrivons les applications de ces techniques de modélisation complémentaires pour étudier les adaptations métaboliques dans les cellules cancéreuses dues à des mutations génétiques et au microenvironnement tumoral, ainsi que pour identifier de nouvelles cibles enzymatiques pour les médicaments anticancéreux. Nous soulignons en outre les avantages et les limites de COBRA et 13C-MFA et les principaux défis à venir.


Effet du taux d'alimentation et de saignement sur les cellules d'hybridome dans un bioréacteur à perfusion acoustique : analyse métabolique

  • APA
  • Auteur
  • BIBTEX
  • Harvard
  • Standard
  • SIF
  • Vancouver

Dans : Biotechnology Progress , Vol. 23, n° 3, 2007, p. 560-569.

Résultats de recherche : Contribution à la revue › Article › Académique › peer-review

T1 - Effet du taux d'alimentation et de saignement sur les cellules d'hybridome dans un bioréacteur à perfusion acoustique : analyse métabolique

N2 - Pour le développement de processus de perfusion optimaux, il est essentiel de comprendre l'effet de l'alimentation et du taux de saignement sur la croissance cellulaire, la productivité et le métabolisme. Dans l'étude présentée ici, l'effet de l'alimentation et du taux de saignement sur le métabolisme cellulaire a été étudié à l'aide d'une analyse de flux métabolique. Pour tous les taux d'alimentation et de ressuage testés, la concentration de biomasse calculée à partir du bilan azoté (biomasse-azote) augmentait linéairement avec une augmentation du taux d'alimentation, comme on pouvait s'y attendre. Cependant, en fonction de la taille de l'alimentation et du taux de ressuage, cette augmentation a été atteinte de deux manières différentes. Aux faibles taux d'alimentation et de saignement (Région I), l'augmentation a été obtenue par une augmentation de la concentration de cellules viables, tandis que la teneur en azote cellulaire est restée constante. À des taux d'alimentation et de saignement élevés (Région II), l'augmentation a été obtenue grâce à une augmentation de la teneur en azote cellulaire, tandis que la concentration cellulaire est restée constante. Par gramme de biomasse-azote, les taux spécifiques de consommation et de production de la majorité des nutriments et produits étaient identiques dans les deux régions, de même que la plupart des flux. La principale différence entre les deux régions était un flux accru du pyruvate vers le lactate et une diminution du flux de pyruvate vers le citrate dans la région II. La diminution du flux entrant au niveau du citrate peut être soit compensée par une diminution du flux sortant vers la biosynthèse des lipides conduisant à une fraction plus faible de lipides dans la cellule, soit par une diminution du flux sortant vers le cycle de l'acide citrique entraînant une diminution de l'énergie génération, ou par une combinaison de ceux-ci. Enfin, la productivité spécifique augmente moins que la teneur en azote par cellule dans la région II, ce qui implique que pour obtenir des taux de production maximum, il est important d'augmenter la densité cellulaire et pas seulement la densité de la biomasse.

AB - Pour le développement de processus de perfusion optimaux, il est essentiel de comprendre l'effet de l'alimentation et du taux de saignement sur la croissance cellulaire, la productivité et le métabolisme. Dans l'étude présentée ici, l'effet de l'alimentation et du taux de saignement sur le métabolisme cellulaire a été étudié à l'aide d'une analyse de flux métabolique. Pour tous les taux d'alimentation et de ressuage testés, la concentration de biomasse calculée à partir du bilan azoté (biomasse-azote) augmentait linéairement avec une augmentation du taux d'alimentation, comme on pouvait s'y attendre. Cependant, en fonction de la taille de l'alimentation et du taux de ressuage, cette augmentation a été atteinte de deux manières différentes. Aux faibles taux d'alimentation et de saignement (Région I), l'augmentation a été obtenue par une augmentation de la concentration de cellules viables, tandis que la teneur en azote cellulaire est restée constante. À des taux d'alimentation et de saignement élevés (Région II), l'augmentation a été obtenue grâce à une augmentation de la teneur en azote cellulaire, tandis que la concentration cellulaire est restée constante. Par gramme de biomasse-azote, les taux spécifiques de consommation et de production de la majorité des nutriments et produits étaient identiques dans les deux régions, de même que la plupart des flux. La principale différence entre les deux régions était un flux accru du pyruvate vers le lactate et une diminution du flux de pyruvate vers le citrate dans la région II. La diminution du flux entrant au niveau du citrate peut être soit compensée par une diminution du flux sortant vers la biosynthèse des lipides conduisant à une fraction plus faible de lipides dans la cellule, soit par une diminution du flux sortant vers le cycle de l'acide citrique entraînant une diminution de l'énergie génération, ou par une combinaison de ceux-ci. Enfin, la productivité spécifique augmente moins que la teneur en azote par cellule dans la région II, ce qui implique que pour obtenir des taux de production maximum, il est important d'augmenter la densité des cellules et pas seulement la densité de la biomasse.


Résultats

Séquençage, assemblage et annotation du génome

L'ADN pour le séquençage du génome de wintersweet a été obtenu à partir d'une accession plantée sur le campus de l'Université agricole de Huazhong. L'ADN a été extrait et séquencé en combinant trois méthodes de séquençage différentes qui incluent le séquençage Illumina HiSeq, 10X Genomics et PacBio SMRT. Un total de 76,96 Go de longues lectures PacBio ont été obtenus (Fichier supplémentaire 1 : Tableau S1), une couverture de séquences de haute qualité d'environ 98,83 fois du génome de 778,71 Mb (taille estimée par analyse de fréquence k-mer) (Fichier supplémentaire 2 : Fig .S1a et Fiche complémentaire 1 : Tableau S2). La cytométrie en flux a déterminé une taille estimée du génome haploïde de 805,88 Mb (Fichier supplémentaire 2 : Fig. S1b), ce qui était cohérent avec la méthode k-mer. Après correction d'erreur interactive, les lectures PacBio ont été assemblées en contigs primaires à l'aide de FALCON [18]. Les contigs générés primaires ont ensuite été polis avec Quiver, donnant 1623 contigs avec une longueur N50 de 2,19 Mb (tableau 1). La correction d'erreur de séquence des contigs finaux a été effectuée en utilisant des lectures courtes Illumina de 36,48 Gb (46,85X) par pilon [19]. Les séquences consensus ont été davantage échafaudées en intégrant des lectures liées à 156,26 Gb (200,67X) 10X Genomics (Fichier supplémentaire 1 : Tableau S1). L'assemblage final se compose de 1259 échafaudages totalisant 695,31 Mb avec une taille d'échafaudage N50 de 4,49 Mb, couvrant 89,2 % de la taille du génome estimée par enquête génomique (tableau 1 et fichier supplémentaire 1 : tableau S3). Afin d'améliorer l'assemblage, nous avons utilisé 93 × données Hi-C pour faciliter la correction de l'assemblage et ancré 1027 des 1259 échafaudages dans 763 super-échafaudages (Fichier supplémentaire 1 : Tableau S4 et S5). Tous les super-échafaudages ont été regroupés avec précision et classés en 11 pseudochromosomes (Fichier supplémentaire 2 : Fig. S2), couvrant 99,42 % de l'assemblage d'origine de 695,31 Mb, avec un super-échafaudage N50 de 65,35 M et une longueur d'échafaudage maximale de 85,71 Mb (Fichier supplémentaire 1 : Tableau S5). Le nombre de groupes correspondait bien au nombre de chromosomes déterminé expérimentalement dans les cellules somatiques (2m = 22) (Fichier supplémentaire 2 : Fig. S3). De plus, des données de séquence de 185,93 Gb Illumina ont également été générées et utilisées pour assembler le Calycanthus chinensis (un proche parent de la reine des neiges appartenant à la même famille) génome (Fichier supplémentaire 1 : Tableau S1). La taille de l'assemblé C. chinensis le projet de génome était de 767,4 Mb, représentant

92,78 % de la taille estimée du génome (Fichier supplémentaire 1 : Tableau S2), avec 291 991 contigs (N50 = 38,7 kb) et 241 923 échafaudages (N50 = 20,34 Mb) respectivement (Fichier supplémentaire 1 : Tableau S3).

Pour évaluer la qualité de l'assemblage du génome, nous avons effectué des analyses BUSCO et CEGMA et avons constaté que 95 % et 92,74 % de gènes conservés eucaryotes complets ont été identifiés dans le génome de l'hiver respectivement (Fichier supplémentaire 1 : Tableau S6), suggérant un degré élevé d'exhaustivité de l'assemblage final . De plus, les lectures courtes de haute qualité générées à partir d'Illumina ont été mappées sur le génome assemblé, qui présente d'excellents alignements avec un taux de mappage de 99,95 %. Pris ensemble, les résultats ci-dessus indiquent un degré élevé de contiguïté et d'exhaustivité du génome de la reine des neiges.

Sur la base de prédictions de novo et basées sur l'homologie et de données de transcriptome, un total de 23 591 gènes codant pour des protéines a été prédit avec une longueur moyenne de 9017 pb et une longueur CDS moyenne de 1250 pb, qui étaient comparables à celle de Amborella et Lotus (Fichier supplémentaire 1 : Tableau S7). La distribution spatiale de ces gènes codant pour les protéines le long du chromosome était inégale avec des densités plus élevées situées aux extrémités des bras chromosomiques (Fig. 1b). Un total de 21 940 (93,1 %) prédit le codage des protéines possédait une annotation fonctionnelle (Fichier supplémentaire 1 : Tableau S8). Un total de 2749 ARN non codants (ARNnc) dont 245 ARN ribosomiques (ARNr), 567 ARN de transfert (ARNt), 909 microARN et 1028 petits ARN nucléaires (snRNA) (Fichier supplémentaire 1 : Tableau S9) ont également été identifiés.

Analyses évolutives comparatives de la reine des neiges et d'autres espèces de plantes à fleurs typiques

L'expansion ou la contraction des familles de gènes a un rôle profond dans la conduite de la diversité phénotypique et de l'évolution adaptative des plantes à fleurs [20]. En comparaison avec les familles de gènes dans son espèce relative C. chinensis, wintersweet a montré un enrichissement et une réduction significatifs de 12 et 45 familles de gènes respectivement (Fig. 2a). L'analyse d'enrichissement fonctionnel KEGG des familles de gènes étendues démontre qu'ils ont été principalement affectés dans les voies « biosynthèse des sesquiterpénoïdes et triterpénoïdes », « biosynthèse des monoterpénoïdes », « la biosynthèse des flavonoïdes » et « la biosynthèse des phénylpropanoïdes » (Fichier supplémentaire 2 : Fig. S4a et tableau S10 ), qui sont à l'origine du trait majeur (parfum fort) propre à l'hiver doux.

Évolution du génome et des familles de gènes de la douceur d'hiver. une Arbre phylogénétique de 17 espèces végétales. Les nombres bleus indiquent le temps de divergence de chaque nœud (MYA, il y a des millions d'années), et ceux entre parenthèses sont des intervalles de confiance à 95% pour le temps de divergence entre les différents clades. Les nombres rouges sur la branche représentent la valeur de bootstrap. Le diagramme circulaire sur chaque branche de l'arbre représente la proportion de familles de gènes subissant des événements de gain (rouge) ou de perte (vert). Les chiffres sous le diagramme circulaire indiquent le nombre total de familles de gènes d'expansion et de contraction. Angiosperme basal (Ba). b La distribution des orthologues à copie unique, à copies multiples, uniques et autres dans les 17 espèces végétales. c Le diagramme de Venn représente les familles de gènes partagées et uniques parmi cinq magnoliidés étroitement apparentés (C. praecox, C. kanehirae, L. chinense, P. nigrum, et C. chinensis). Chaque nombre représente le nombre de familles de gènes

Définir la relation entre les familles de gènes parmi les espèces de plantes à fleurs a été une approche puissante pour étudier la base génétique de l'évolution des plantes. Sur la base des similitudes de séquences par paires, nous avons appliqué les protéomes prédits de l'hiver et 16 autres espèces séquencées pour identifier des groupes de gènes orthologues putatifs. Un total de 37 137 familles de gènes orthologues composées de 554 042 gènes ont été identifiés à partir de 17 espèces végétales, dont 5339 groupes de gènes ont été partagés par toutes les espèces étudiées, représentant des familles de gènes ancestrales (Fig. 2b). D'autre part, 8733 familles de gènes étaient présentes à travers C. chinensis, L. chinensis, et C. kanehirae, qui représentent très probablement le protéome « noyau » des magnoliides (Fig. 2c). Il existe 339 familles de gènes contenant 507 protéines spécifiques du génome de la reine des neiges (Fichier complémentaire 1 : Tableau S11). Les analyses d'enrichissement de terme Gene Ontology (GO) de gènes spécifiques à la douceur des neiges ont révélé que les catégories fonctionnelles appelées « activité oxydoréductase » et « activité pectinesterase » impliquées dans le métabolisme étaient enrichies (Fichier supplémentaire 2 : Fig. S4b).

Contenu répétitif et rafale récente de rétrotransposons LTR

Dans le génome de la douceur hivernale, les éléments répétitifs occupaient 45,73 % du génome, dont 96,69 % étaient annotés comme éléments transposables (ET) (Fichier complémentaire 1 : Tableau S12). Les rétrotransposons à répétition terminale longue (LTR) étaient la principale classe de TE qui représentent 36,2 % de l'assemblage. Parmi les LTR, les éléments LTR/Gypsy étaient les plus abondants, composant 23,3 % du génome, suivis des éléments LTR/Copia (8,6 %, Fichier complémentaire 1 : Tableau S12). Outre les principaux groupes d'éléments LTR, 3,65 % du génome était annoté en éléments d'ADN et 3,45 % en éléments nucléaires longs intercalés, tandis que le reste était attribué à d'autres familles répétées ou n'a pas pu être attribué (Fichier supplémentaire 1 : Tableau S12). Les éléments transposables sont inégalement répartis sur les chromosomes et se révèlent particulièrement abondants dans les régions centromériques (Fig. 1b). Une analyse comparative plus poussée de la distribution des TE a indiqué une proportion plus élevée de régions intergéniques (79,19 %) par rapport aux régions géniques (16,04 %) et aux régions adjacentes aux gènes (4,77 %) (Fichier supplémentaire 2 : Fig. S5a). Au sein des régions géniques, les TE présentaient une distribution inégale entre les exons et les introns. 98,98 % des TE dans les régions géniques se sont produits dans les introns et constituaient 25 % de la longueur totale des introns (Fichier supplémentaire 2 : Fig. S5b). La comparaison de la structure des gènes avec d'autres espèces a révélé que la longueur moyenne et le nombre d'exons sont similaires, tandis que la longueur moyenne des introns est légèrement plus longue et peut, dans une certaine mesure, être attribuée à une accumulation répétée. De plus, le temps de la rafale de la LTR-RT dans la douceur d'hiver a été estimé à l'aide des 8812 LTR-RT complètes putatives et a révélé un taux de substitution maximal à environ 0,03 (Fichier supplémentaire 2 : Fig. S6). Nous avons supposé un taux de mutation de 1,51 × 10 − 9 par base et par an [14], résultant en un temps d'insertion d'environ 9,9 Ma.

Afin d'étudier l'évolution des TE chez les Magnoliids, des arbres phylogénétiques de domaines dans les gènes de la transcriptase inverse ont été construits pour les deux Ty1/Copia et Ty3/Tsigane superfamille. Dans l'arbre phylogénétique de Ty3/Tsigane superfamille, la majorité des LTR-RT de wintersweet étaient regroupées dans le clade tork (Fichier supplémentaire 2 : Fig. S7a). Comparé à L. chinensis et C kanehirae, les LTR-RT dans wintersweet et C. chinensis présentait une diversité et une abondance plus élevées au sein du clade tork, indiquant une plus grande expansion et divergence dans les C. chinensis génome. Les Copia la superfamille affichait un modèle différent, avec quatre clades principaux constitués d'éléments de ces quatre espèces (Fichier supplémentaire 2 : Fig. S7b), suggérant un modèle d'évolution conservé de la Copia superfamille, comme décrit précédemment [21, 22].

Placement phylogénomique des Magnoliidés sœurs des eudicots

Les relations phylogénétiques des Magnoliids, des monocotylédones et des eudicots ont été quelque peu controversées en taxonomie végétale. Dans un effort pour déduire la position phylogénétique des Magnoliids par rapport aux monocotylédones et aux eudicots, un ensemble de 213 ensembles d'orthologues à copie unique (OSCG) évalués a été identifié pour la première fois avec OrthoMCL [23] en utilisant les données du génome de 17 espèces de plantes à fleurs qui comprend 5 monocotylédones , 6 eudicots, 5 magnoliidae et 1 angiosperme basal. Nous avons appliqué des approches de coalescence et de concaténation pour reconstruire des arbres phylogénétiques à l'aide de l'ensemble de données de 213 gènes. Les analyses de coalescence et de concaténation ont toutes deux donné une topologie identique et hautement supportée avec les Magnoliidae comme groupe frère des eudicots après leur divergence avec les monocotylédones (Fig. 2a et Fichier supplémentaire 2 : Fig. S8a). Pour éviter les erreurs potentielles d'identification orthologue, nous avons également utilisé SonicParanoid [24] pour extraire les gènes à copie unique (SSCG) des 17 génomes végétaux décrits ci-dessus. Seuls les gènes échantillonnés d'au moins 14 espèces ont été utilisés pour la construction d'arbres phylogénétiques. Sur la base de 216 gènes à copie unique, les arbres phylogénétiques ont ensuite été déduits de la même manière par des méthodes de coalescence et de concaténation que celles décrites ci-dessus. Les arbres d'espèces résultants étaient topologiquement identiques aux découvertes phylogénétiques révélées par OrtholMCL décrites ci-dessus (Fichier supplémentaire 2 : Fig. S8b).

Bien que le même ensemble de relations phylogénétiques parmi les Magnoliidae, les monocotylédones et les eudicots ait été systématiquement récupéré, les conflits topologiques ont également été observés parmi les arbres génétiques à base de coalescence (Fichier supplémentaire 2 : Fig. S8c). Pour estimer la discordance entre les arbres de gènes dans les ensembles de données OSCG et SSCG, nous avons profité du score du quatuor dans ASTRAL [25] pour afficher les proportions d'arbres de gènes à l'appui de trois ordres de branchement différents pour les Magnoliidae, les monocotylédones et les eudicots (Fichier supplémentaire 2 : Fig. S8d) et a trouvé que les pourcentages d'arbres génétiques supportant les Magnoliidae et les eudicots formant ensemble un groupe frère avec les monocotylédones est plus élevé que les deux autres topologies (Fichier supplémentaire 2 : Fig. S8c). Cependant, dans les analyses phylogénétiques d'un alignement de séquences concaténées de 38 gènes chloroplastiques à copie unique pour 26 taxons, les magnoliidés ont été placés en tant que groupe frère du clade composé d'eudicots et de monocotylédones (Fichier supplémentaire 2 : Fig. S9). De plus, les branches phylogénétiques courtes parmi les clades des magnoliidés, des eudicots et des monocotylédones, représentant des événements de spéciation rapide, ont également été observées dans ces gènes phylogénétiques. L'incongruence phylogénétique entre les génomes nucléaire et plastidial peut être causée par un tri de lignée incomplète (ILS), qui apparaît plus fréquemment lors de la divergence rapide des premiers mésangiospermes. Comme l'échantillonnage de taxon inadéquat pourrait entraîner une phylogénie incongrue, nous avons amélioré l'échantillonnage de taxon en ajoutant des données génomiques supplémentaires de 11 espèces phylogénétiquement pivotales et un ensemble de données de transcriptome de chloranthales pour reconstruire l'arbre phylogénétique. Cette approche a permis de retrouver les mêmes relations phylogénétiques chez les magnoliidae, les eudicots et les monocotylédones (Fichier supplémentaire 2 : Fig. S10). Ainsi, à partir de ces résultats, nous pensons que la relation phylogénétique proposée dans notre étude est relativement précise dans l'ensemble de données actuel. Sur la base de l'arbre phylogénétique de haute confiance et des points d'étalonnage sélectionnés à partir d'articles et du site Web TimeTree, le temps de divergence entre les magnoliidae et les eudicots a été estimé entre 113,0 et 153,1 Ma (intervalle de confiance à 95 %) (Fig. 2a), qui chevauche avec trois estimations récentes (114,6-164 Ma, 117-189 Ma et 136,0-209,4 Ma) [13, 25, 26].

Duplication du génome entier et analyse de l'évolution du génome

La duplication du génome entier (WGD) a longtemps été considérée comme le principal moteur de l'évolution des plantes [27]. Pour étudier les événements WGD au cours de l'évolution de l'hiver, nous avons d'abord recherché des duplications à l'échelle du génome et les avons affectées à quatre modes différents avec l'analyse MCScanX (Fichier supplémentaire 2 : Fig. S11). La duplication WGD/segmentaire a été identifiée comme le type dominant qui comprend 4511 paires de gènes paralogues dans 265 blocs synténiques. Parmi ces blocs synténiques, 36,09 % se sont avérés partager des relations avec trois autres blocs à travers le génome (Fichier supplémentaire 2 : Fig. S12). La synténie généralisée et les blocs synténiques un contre trois bien entretenus suggèrent que deux événements WGD pourraient s'être produits au cours de l'évolution du génome de l'hiver. Il est bien admis que Amborella est une seule espèce vivante qui est la lignée sœur de tous les autres groupes au sein des angiospermes, et il n'y a aucune preuve de polyploïdie spécifique à la lignée après avoir divergé du dernier ancêtre commun des angiospermes [28]. Analyse de la colinéarité et de la synténie entre l'hiver doux et Amborella le génome a également fourni des preuves structurelles claires pour deux WGD dans wintersweet avec un rapport de profondeur synténique de 1:4 dans Amborella-comparaison hiver-douce (Fig. 3a). Pour élucider davantage la polyploïdie des génomes de l'hiver, nous avons effectué une analyse génomique comparative de l'hiver avec C. kanehirae et L. chinensis. Des rapports de profondeur synténique de 4:4 et 2:4 ont été déduits dans le wintersweet-Cannelle et doux d'hiver-Liriodendron comparaisons, respectivement (Fig. 3b). Sur la base des relations synténiques entre et au sein de chaque espèce, nos analyses indiquent collectivement que l'hiver a subi deux événements WGD.

Analyses de génomique comparative. une Modèles de synthèse entre les régions génomiques de wintersweet et Amborella. Ce modèle montre que certaines régions ancestrales typiques de l'angiosperme basale Amborella ont quatre régions de copie correspondantes dans wintersweet. Cette relation colinéaire est mise en évidence par un ensemble synténique représenté en rouge et en vert. b Blocs synténiques entre les génomes. Les dot plots des orthologues montrent une relation chromosomique 4–4 entre le génome de l'hiver et C. kanehirae génome, et relation chromosomique 2–4 entre le génome de l'hiver et L. chinense génome. c Distribution des niveaux de substitution synonymes (Ks) des gènes orthologues synténiques (courbes en pointillés) et paralogues (courbes pleines) après correction du taux d'évolution. Modèle évolutif des génomes de Laurales. Les chromosomes ancestraux de Laurales sont représentés par dix couleurs. Les événements de polyploïdisation sont représentés par 3 points de couleurs différentes, ainsi que les fusions chromosomiques (Fu) et les fissions (Fi). La structure moderne des génomes de Laurales est illustrée en bas de la figure. Dans certaines régions, nous n'avons pas pu déterminer de quel chromosome ancestral ils provenaient, et ces régions étaient représentées par des espaces blancs

Pour estimer le moment des deux événements WGD dans le génome de wintersweet, nous avons caractérisé des substitutions synonymes sur des sites nucléotidiques (Ks) synonymes entre des homéologues colinéaires au sein ou entre wintersweet et trois autres espèces, y compris C. chinensis, Cinnamomum kanehirae, et Liriodendron chinensis des Magnoliides. Les distributions Ks des orthologues un à un identifiés entre Amborella et les quatre autres espèces présentent des pics de Ks différents, suggérant des taux d'évolution divergents entre ces quatre espèces (Fichier supplémentaire 2 : Fig. S13). Après correction pour le taux d'évolution [29], les substitutions synonymes par site et par an comme 4,21 × 10 − 9 pour Laurales ont été calculées en utilisant les valeurs moyennes de Ks des blocs synténiques, ce qui a donné le temps estimé de l'événement WGD à environ 77,8 millions et 112,1 il y a des millions d'années (Ma), respectivement (Fig. 3c). Analyse précédente du génome de Cannelle ont suggéré que l'événement WGD ancien semble partagé par Magnoliales et Laurales [13], et la datation absolue des événements WGD identifiés dans Liriodendron tulipifera a également soutenu cette hypothèse [14]. Dans notre étude, nous avons également détecté deux et un événements de polyploïdisation dans Cannelle et Liriodendron respectivement, mais aucun événement WGD commun n'a été partagé par ces deux espèces. De plus, le génome de la douceur d'hiver partage un ancien événement WGD avec Cannelle mais pas avec Liriodendron. De plus, les arbres des groupes de gènes synténiques de l'hiver et Liriodendron vs. Amborella a indiqué que la douceur de l'hiver et Liriodendron ont connu un événement WGD respectivement après leur divergence d'un ancêtre commun (Fichier supplémentaire 2 : Fig. S14 et Fichier supplémentaire 3 : Note supplémentaire 3). Ainsi, à partir de ces résultats, nous concluons que l'ancien évènement WGD de l'hiver doux s'est produit avant la divergence des Calycantaceae et des Lauracées mais après la divergence des Calycantaceae et des Magnoliaceae.

Nous avons également utilisé des gènes orthologues et paralogues issus de l'analyse intergénomique et intragénomique de l'hiver C. chinensis aussi bien que C. kanehirae génomes pour construire un génome ancestral putatif des Laurales, et a proposé un scénario évolutif où ces trois lignées étaient dérivées d'un ancêtre putatif (Fig. 3d et fichier supplémentaire 2 : Fig. S15), qui se composait de dix chromosomes et de 4216 gènes. Cet ancêtre est passé par un événement WGD pour atteindre un intermédiaire de 20 chromosomes, puis a subi des réarrangements chromosomiques pour former les caryotypes actuels. Dans wintersweet, tous les chromosomes ont subi des réarrangements et chaque chromosome provenait d'au moins deux chromosomes anciens. Un minimum de 49 fissions chromosomiques et 48 fusions chromosomiques ont été prédits pour se produire dans wintersweet pour atteindre sa structure actuelle de 11 chromosomes (Fig. 3d).

Base génétique de la transition florale, spécification des organes floraux et floraison précoce en hiver

Wintersweet est l'un des arbres vivaces qui fleurissent en hiver profond. Il a fallu environ 10 mois pour C. praecox pour achever son développement reproducteur. Pour étudier l'ensemble du processus de développement de la fleur qui peut influencer la période de floraison finale, nous avons d'abord effectué une étude systématique sur l'ontogénie florale et les modèles de développement par coupes de paraffine à travers l'observation. Les résultats ont indiqué que le bourgeon floral a été initié en avril, la structuration florale et la spécification des organes floraux se sont produites d'avril à juillet, une croissance lente en été, les gamétophytes mâles et femelles se sont formés respectivement en octobre et décembre, le bouton floral est passé en dormance, puis la rupture a eu lieu en décembre et la fleur a fleuri en hiver profond (Fig. 4a). Pour étudier les mécanismes moléculaires qui sous-tendent les étapes critiques du développement des fleurs, nous avons généré et analysé les données ARN-seq pour les étapes représentatives du développement des fleurs, du moment de l'initiation florale à la maturation.

Représentation schématique des étapes clés du développement du bouton floral et analyse de l'identité des organes floraux et des gènes liés à la période de floraison. une Stades de développement des fleurs, y compris la transition florale, la spécification des méristèmes, la spécification des organes floraux, la dormance et la libération des bourgeons floraux et la floraison. Abréviations pour les stades de développement des boutons floraux : stade indifférencié du bouton floral (FBS1) stade de la formation du primordium de la fleur (FBS2) stade de la formation du primordium du tépal (FBS3) stade de la formation du primordium de l'étamine (FBS4) stade de la formation du primordium du pistil (FBS5) stade de développement et de différenciation des organes floraux ( FBS6) stade de croissance lente (FBS7) stade d'apparition des ovules (FBS8) stade de formation du pollen (FBS9), floraison en hiver. ap, apex de pousse fp, primordium floral t, tépales s, étamines p, pistil a, anthère o, ovule po, pollen es, sac embryonnaire. b Les modèles d'expression des gènes liés à la période de floraison et à l'identité des organes floraux à différents stades de développement de la fleur. c L'arbre phylogénétique des gènes MADS-box et les modèles d'expression génique des gènes de fonction B/C de divers organes floraux. Les protéines MADS-box dans wintersweet sont marquées par la boîte jaune

L'initiation florale est contrôlée par l'expression spatiale et temporelle des gènes liés au temps de floraison dans de multiples voies [11]. De nombreux gènes de ces voies ont été identifiés et caractérisés chez diverses espèces herbacées et pérennes et auraient la fonction conservée [30,31,32]. Une base de données des réseaux de gènes au moment de la floraison a été récemment construite en Arabidopsis thaliana [30]. Profitant de cette base de données, nous avons identifié 594 gènes de floraison dans huit voies (Fichier supplémentaire 1 : Tableau S13). L'analyse des données RNA-seq a montré que pendant la transition florale, les gènes de floraison liés à la biosynthèse de la gibbérelline et à la voie de transduction de la signalisation étaient significativement activés (padj < 0.01), et l'expression de certains gènes dans les voies de l'horloge photopériodique et circadienne était également régulée à la hausse ( Fig. 4b et Fichier supplémentaire 1 : Tableau S14) suggérant que l'hormone endogène (gibbérelline) et le facteur environnemental (photopériode) peuvent jouer un rôle majeur dans le passage de la croissance végétative à la croissance reproductive au printemps.

Après la structuration florale et la spécification des organes floraux d'avril à juillet, le développement des organes floraux se déroule lentement de l'été à l'automne, période pendant laquelle la température est très élevée et la température maximale peut atteindre jusqu'à 39 °C (Fig. 4a et Fichier complémentaire 1 : Tableau S15).Par conséquent, la température peut être un facteur clé qui affecte le développement lent de l'organe floral. Le reflet direct est le niveau d'expression significativement accru des gènes de la protéine de choc thermique (Fig. 4b). De plus, en comparaison avec d'autres stades de développement, de nombreux gènes associés à la division cellulaire ont subi une régulation négative significative (Fig. 4b et fichier supplémentaire 1 : Tableau S16). Les facteurs de transcription du stress thermique (HSF) et les gènes sensibles à la chaleur jouent un rôle essentiel dans la réponse au stress thermique [33]. Nous avons trouvé 21 membres dans la famille HSF en C. praecox. Six HsfA1s, qui servent de régulateurs transcriptionnels maîtres dans la réponse au stress thermique, ont été identifiés (Fig. 4b et fichier supplémentaire 1 : Tableau S17). La PROTÉINE DE LIAISON D'ÉLÉMENT RÉPONDANT À LA DÉSHYDRATATION (DREB2A) réglementée par les HsfA1. Les deux HsfA1-1 et DREB2A-1 ont affiché un modèle d'expression opposé avec les gènes liés à la division cellulaire (Fig. 4b et fichier supplémentaire 1 : Tableau S15). La séquence DRE (motif CTAGA) reconnue par DREB2A a également été détectée dans le promoteur des gènes de division cellulaire (Fichier supplémentaire 2 : Fig. S16a). Ces résultats peuvent suggérer que les signaux de chaleur peuvent être intégrés dans des réseaux de régulation transcriptionnelle par les HSF puis réguler l'expression des gènes liés à la division cellulaire, aboutissant finalement à la croissance lente des organes floraux.

Au total, 58 gènes MADS-box ont été identifiés dans le génome de la douceur d'hiver, dont 31 sont des gènes MADS-box de type MIKC (Fichier supplémentaire 1 : Tableau S13). Les analyses phylogénétiques et de colinéarité de ces gènes ont indiqué que les homologues des gènes prototypes du modèle ABCE, à l'exception de AP1/FUL, se sont tous avérés être dupliqués (Fig. 4c). Quatre AGL6, générés par les événements WGD, ont été identifiés dans les assemblages d'hiver, dont le nombre est plus important que celui d'Arabidopsis et du riz. Parmi ces gènes, le CpAGL6a a été signalé pour favoriser la floraison lorsqu'il est surexprimé dans Arabidopsis [34]. Pendant ce temps, le LOCUS FLEURI C (FLC), qui sert de répresseur à la floraison [35], a été perdu dans la douceur de l'hiver (Fig. 4c). Le promoteur élargi sélectif et la perte de répresseur des gènes liés au temps de floraison peuvent être associés à la floraison plus précoce de la guimauve. La morphologie entre le périanthe interne et externe chez le python présentait une légère différence, qui est la même que chez certains eudicots basaux (Renoncule et Aquilégie). Un modèle « frontière glissante » a été proposé pour expliquer cette morphologie dans Renoncule, dans laquelle les homologues de la fonction B sont exprimés dans les verticilles qui produisent l'organe pétaloïde [36]. Les homologues de la fonction B dans wintersweet ont montré un large schéma d'expression, avec AP3b exprimé de préférence dans le verticille externe du périanthe (Fig. 4c), qui appuyait le modèle de « limite coulissante » et peut compléter l'absence d'une distinction morphologique claire entre les sépales et les pétales chez le doux hivernal. La forte expression des homologues de la fonction C est limitée à l'étamine et au carpelle, ce qui suggère que ces gènes ont une fonction conservée dans la spécification de l'étamine et du carpelle. Les profils d'expression des homologues de l'ABCE d'hiver au cours du développement de la fleur concordent largement avec la formation progressive des organes floraux qu'ils spécifient (Fig. 4b).

Le temps d'écoulement relativement plus précoce en hiver suggérait le besoin de refroidissement plus court pour la levée de la dormance et le débourrement plus précoce de la douceur hivernale. Les membres du PHASE VÉGÉTATIVE COURTE (Vice-président principal) clade de la famille des gènes MADS-box, y compris les gènes SVP et DAM, sont bien connus pour être associés à la levée de la dormance et au débourrement [37, 38]. Deux homologues de Vice-président principal gènes ont été identifiés dans le génome de la douceur de l'hiver. Analyse phylogénétique de SVP a révélé que ces deux gènes se regroupent près de PtSVL (Fichier supplémentaire 2 : Fig. S16b), dont la fonction avait été caractérisée comme un répresseur dans le réseau génétique du débourrement végétatif médié par la température chez le tremble hybride [39]. Les gènes en aval de PtSVL dans le réseau, y compris TEOSINTE BRANCHÉ1, CYCLOIDEE, PCF/BRANCHE1 (TCP18/BRC1), et FLORAISON LOCUS T (FT), qui fonctionnent comme des régulateurs négatifs et positifs du débourrement de contrôle médié par la température, ont également été identifiés dans le génome de l'hiver (Fichier supplémentaire 2 : Fig. S16c). Lors du passage de l'endodormancie au flush, l'augmentation de l'expression de CpFT1 et la régulation à la baisse de CpTCP18/BRC1 et CpSVL1 ont été notés (Fichier supplémentaire 2 : Fig. S16d). L'acide gibbérelline (GA) et l'acide abscissique (ABA) agissent respectivement comme régulateurs positifs et négatifs du débourrement [40], et dont le contenu est dans une certaine mesure associé au niveau d'expression des gènes de biosynthèse et de catabolisme. L'augmentation de l'expression des gènes de biosynthèse des GA tels que GA20 oxydase et la diminution de l'expression des gènes de biosynthèse de l'ABA tels que le NCED (Fichier supplémentaire 2 : Fig. S16d) a également été observée au stade du débourrement, ce qui peut coïncider avec leur rôle dans le débourrement.

Base génétique de forte résistance au froid

Wintersweet est l'un des arbres vivaces qui fleurissent en hiver profond, pendant lequel la température tombe toujours en dessous du point de congélation. Par conséquent, wintersweet a développé un mécanisme systématique pour résister au stress dû au froid. La glycosylation volatile est une forme courante de composés volatils végétaux et joue un rôle important dans la réponse au stress abiotique chez les plantes [41]. Des études récentes ont révélé que la glucosylation des terpènes volatils médiée par les UDP-glycosyltransférases (UGT) était impliquée dans la modulation de la tolérance au stress au froid chez les théiers [42]. Dans la douceur de l'hiver, des substances volatiles abondantes étaient présentes sous des formes liées par des glycosides, telles que le glucoside de linalol, l'alcool benzylique de benzaldéhyde (Fichier supplémentaire 2 : Fig. S17). L'expansion considérable de la famille des UGT (Fichier supplémentaire 1 : Tableau S10) et l'abondance des glycosides terpéniques dans les fleurs de l'algue douce conduisent à l'hypothèse que la forte tolérance au froid de l'algue douce est, dans une certaine mesure, liée à la glucosylation volatile.

Évolution de la biosynthèse des terpènes et des gènes liés à la régulation

Les monoterpènes sont les principaux composants des composés organiques volatils (COV) floraux de la douceur d'hiver, en particulier le linalol, qui représente plus de la moitié de l'odeur florale [5]. Chez les plantes, les monoterpènes/diterpènes et les sesquiterpènes sont généralement générés via le 2-C-méthyl-D-érythritol 4-phosphate (MEP) et la voie du mévalonate (MVA), respectivement [43]. Au total, 46 gènes dans ces deux voies ont été identifiés (Fichier supplémentaire 1 : Tableau S18). Les gènes clés impliqués dans la voie MEP tels que la 1-désoxy-d-xylulose 5-phosphate synthase (DXS), 1-désoxy-d-xylulose 5-phosphate réductoisomérase (DXR), et l'isopentényl diphosphate isomérase (IDI) ont été générés par des événements WGD (Fig. 5a). Le taux élevé de génération de paralogues dans ces gènes pourrait augmenter l'efficacité de la réaction catalytique par des effets de dosage, augmentant ainsi le flux métabolique vers la voie MEP. Les terpènes synthases (TPS) sont les enzymes responsables de la dernière réaction catalytique dans la voie MVA et MEP pour générer des composés terpénoïdes. À l'aide du génome d'assemblage, un total de 52 génomes complets CpTPS ont été identifiés (Fiche supplémentaire 1 : Tableau S19), dont le nombre est environ le double de celui détecté par transcriptomique dans notre étude précédente [5]. L'analyse phylogénétique du TPS de quatre espèces a révélé que CpTPS ont été regroupés en cinq des six sous-familles décrites pour les plantes terrestres (Fig. 5b). La majorité des CpTPS ont été placés dans les sous-familles TPS-a (18) et TPS-b (24), qui sont majoritairement composées respectivement de sesquiterpènes et de monoterpènes synthases spécifiques des angiospermes [44]. L'analyse génomique comparative a révélé que les gènes TPS sont considérablement étendus, en particulier dans la sous-famille TPS-b (Fig. 5b et fichier supplémentaire 1 : Tableau S10). Ces expansions de gènes spécifiques à la lignée dans la sous-famille TPS-b peuvent contribuer à l'accumulation de monoterpènes dans les COV floraux dans la douceur d'hiver.

Biosynthèse des terpènes dans la douceur de l'hiver. une Profils d'expression de gènes codant pour des enzymes éventuellement impliquées dans la biosynthèse des monoterpènes et sesquiterpènes. Les abréviations des enzymes de chaque étape catalytique sont indiquées en gras. Le gradient de couleur pour chaque gène représente les niveaux d'expression du gène dans trois stades de développement floral (S1 : stade de bourgeon S4 : stade de pleine floraison S5 : stade de sénescence). Les gènes homologues sont représentés par des bandes horizontales de même couleur et sont nommés de haut en bas dans l'ordre numérique arabe. Les noms complets des enzymes sont répertoriés dans le fichier supplémentaire 1 : tableau S18. Les gènes entourés dans la boîte verte ont été générés par l'événement WGD. Les gènes non encadrés n'ont pas subi cet événement. b Phylogénie des protéines TPS identifiées dans le génome d'hiver et 5 autres génomes végétaux séquencés montrant les sous-familles de a–g. c L'expression de CpTPS gènes à trois stades différents de développement floral. Ces gènes ont été exprimés dans au moins un des trois stades de développement. Les chromosomes avec plus d'un CpTPS gène. Les losanges rouges représentent les gènes caractérisés fonctionnellement. Les losanges verts représentent les gènes générés par les événements de duplication en tandem. Le remède avec la flèche a lié deux gènes dupliqués. e Identification de produits enzymatiques après incubation de protéines CpTPS recombinantes avec du géranyl diphosphate (GPP)/farnésyl diphosphate (FPP). Les terpènes volatils ont été analysés par analyse GC-MS et par comparaison avec des standards authentiques. F Augmentation de la biosynthèse du linalol dans le CpTPS4-surexprimé le tabac par rapport au type sauvage (WT) et au contrôle vectoriel vide (EV). Les données représentent la moyenne ± ET de trois répétitions biologiques

Analyse de l'expression du 52 CpTPS Les gènes par RNA-seq ont révélé que six gènes présentaient des profils d'expression similaires avec l'émission des principaux monoterpènes (Fig. 5c et fichier supplémentaire 2 : Fig. S18). Sur la base du modèle d'expression et de l'analyse phylogénétique, nous avons en outre sélectionné trois gènes de la sous-famille TPS-b/g pour la caractérisation fonctionnelle et avons constaté que tous les gènes codaient des enzymes polyvalentes avec plusieurs produits (Fig. 5e). L'analyse de la localisation subcellulaire a montré que CpTPS4 et CpTPS9 étaient localisés au plaste alors que CpTPS42 a été ciblé sur le cytosol (Fichier supplémentaire 2 : Fig. S19). CpTPS42 s'est avéré être une sesquiterpène synthase, qui catalysait principalement la formation de nérolidol, conjointement avec d'autres sesquiterpènes (Fig. 5e). CpTPS4 et CpTPS9 sont à la fois des monoterpènes synthases et produisent respectivement du β-pinène et du linalol comme produits principaux (Fig. 5e). Pour mieux comprendre la fonction de CpTPS4, nous avons également surexprimé le gène dans le tabac. Des niveaux accrus des monoterpènes, y compris le linalol, le limonène, le -ocimène et le trans-β-ocimène ont été trouvés dans les feuilles de tabac transgéniques par rapport au témoin de type sauvage (figure 5f). Ces résultats ont indiqué que CpTPS4 joue un rôle primordial dans la biosynthèse du linalol, les principaux composants du parfum floral.

L'assemblage du génome disponible permet CpTPS à localiser soit sur des chromosomes soit sur des positions d'échafaudage pour prendre en compte un contexte génomique. Les CpTPS les gènes ne sont pas uniformément distribués dans les chromosomes avec 44 gènes situés sur six chromosomes et huit gènes sur sept échafaudages (Fig. 5d). Quatorze des 52 CpTPS les gènes ont au moins deux copies et chaque copie de gène dupliquée était adjacente à l'autre. Par exemple, CpTPS4 est situé sur échafaudage662 et a trois exemplaires dont CpTPS17, CpTPS18, et CpTPS19. Ces trois gènes ont été disposés en tandem sur le chromosome 6 et fortement exprimés au stade de la pleine fleur ouverte, qui peuvent avoir une fonction similaire à celle CpTPS4 et contribuent également à la production de linalol.

La formation de terpénoïdes ne dépend pas seulement des propriétés biochimiques des enzymes codées par CpTPS mais nécessite également l'implication de facteurs de transcription (TF). Un total de 1313 TFs qui présentent une expression différentielle au cours du développement des pétales ont été identifiés. Parmi ceux-ci, 99 présentent une corrélation positive avec l'émission de terpènes et sont majoritairement répartis dans les familles MYB, bHLH, WRKY et bZIP (Fichier complémentaire 2 : Fig. S20 et Fichier complémentaire 1 : Tableau S20). Le contrôle transcriptionnel des gènes de biosynthèse des terpènes est en corrélation avec la présence d'éléments cis dans leurs régions promotrices, qui ont été reconnus et liés par des facteurs de transcription spécifiques. Lors du criblage des régions de 2000 pb en amont de la 52 CpTPS gènes, plusieurs éléments de défense et de réponse au stress se sont avérés significativement enrichis, tels que les éléments de liaison à bHLH et MYB (Fichier supplémentaire 2 : Fig. S21). Les résultats ont indiqué que les facteurs de transcription MYB/bHLH peuvent servir de facteurs clés dans la régulation de la CpTPS l'expression des gènes et nous fournissent le point de départ pour d'autres études afin de révéler l'interaction dans la régulation des métabolites secondaires des plantes et des réponses au stress.

Évolution des gènes liés à la biosynthèse des benzénoïdes/phénylpropanoïdes

Les benzénoïdes/phénylpropanoïdes constituent le deuxième groupe le plus important de COV floraux dans la douceur d'hiver, qui sont dérivés de l'acide aromatique phénylalanine. La phénylalanine est synthétisée via deux voies (voie phénylalanine et voie aragénate) [45], et ces deux voies se séparent de la voie plastidiale du shikimate [46]. Les gènes impliqués dans la voie shikimate (20), la voie phénylpyruvate (7) et la voie arogénate (6) ont été identifiés comme le montre la figure 6a. Dans le génome d'hiver doux, les événements de duplication WGD et en tandem ont considérablement affecté à la fois les gènes en amont de la voie phénylpropanoïde et les gènes en aval impliqués dans la biosynthèse spécifique des benzénoïdes (acétate de benzyle et salicylate de méthyle) (Fig. 6a, b), ce qui conduit à la haute taux de formation de paralogues dans 15 familles de gènes (Fichier supplémentaire 1 : Tableau S21).

Évolution et expression de gènes clés impliqués dans la biosynthèse des benzénoïdes/phénylpropanoïdes. une Profils d'expression de gènes codant pour des enzymes éventuellement impliquées dans la voie shikimate/benzénoïde chez la douce d'hiver. Les abréviations des enzymes de chaque étape catalytique sont indiquées en gras. Le gradient de couleur pour chaque gène représente les niveaux d'expression du gène dans trois stades de développement des pétales chez le roux d'hiver (S1 : stade de bourgeon S4 : stade de floraison complètement ouverte S5 : stade de sénescence). Les gènes homologues sont représentés par des bandes horizontales de même couleur et sont nommés de haut en bas dans l'ordre numérique arabe. Les noms complets des enzymes sont répertoriés dans le fichier supplémentaire 1 : tableau S21. Les gènes entourés dans des cases noires et rouges ont été générés respectivement par des événements de duplication WGD et en tandem. Les gènes non encadrés n'ont pas subi ces événements. b Représentation schématique des chromosomes de l'hiver ainsi que des positions des gènes clés impliqués dans la biosynthèse des benzénoïdes/phénylpropanoïdes. Les gènes marqués en brun et en rouge ont été générés respectivement par des événements de duplication WGD et en tandem. c Profils d'expression du 21 BATTRE gènes homologues à trois stades différents (S1, S4 et S5). Ces gènes ont été exprimés dans au moins un des trois stades de développement

L'acétate de benzyle, les composés dominants de l'odeur florale de la douceur d'hiver, est synthétisé à partir d'alcool benzylique via une réaction dépendante de l'acétyl-CoA catalysée par l'acétyl-CoA : l'alcool benzylique acétyltransférase (BEAT) [47]. L'analyse génomique comparative a révélé que le génome de la douceur d'hiver abrite 33 BATTRE gènes homologues (Fichier complémentaire 1 : Tableau S21), dont le nombre est comparable à celui de Prunus mume, dans lequel l'acétate de benzyle est également le composant majeur du parfum floral. Semblable à P. mume, l'élargissement de la BATTRE gènes homologues a été principalement attribué à des événements de duplication en tandem et WGD [47]. Sur 33 BATTRE gènes homologues trouvés dans le génome de wintersweet, 8 ont été dérivés de l'événement WGD et 14 ont été amplifiés par duplication en tandem. L'analyse de corrélation du transcriptome et des métabolites a montré que le modèle d'expression de 4 CpBEAT coïncidait avec l'émission d'acétate de benzyle (Fig. 6c et Fichier supplémentaire 2 : Fig. S18). Ces gènes pourraient être responsables de la biosynthèse de l'acétate de benzyle dans la fleur d'hiver. Le salicylate de méthyle est également la composition majeure des COV floraux dans la douceur d'hiver. L'acide salicylique méthyltransférase dérivée de trois duplications en tandem (SAMT) ont été identifiés dans la tilleul (Fichier supplémentaire 2 : Fig. S22), dont deux étaient fortement exprimés dans la fleur et leurs modèles d'expression étaient corrélés à l'émission de salicylate de méthyle, suggérant que ces deux gènes pourraient être principalement responsables de la biosynthèse du salicylate de méthyle (Fig. 6a). Ces observations ci-dessus suggèrent que l'expansion de gènes spécifiques et l'expression sélective dans la fleur pourraient induire une activité accrue des enzymes correspondantes, ce qui a entraîné la formation d'arômes caractéristiques abondants dans les fleurs de l'hiver.


Résultats

L'inhibition de l'activité GAPC par Tyr-Asp est associée au déplacement du flux glycolytique vers le PPP et à l'augmentation du rapport NADPH/NADP +

L'objectif principal de notre travail était de comprendre la signification biologique de notre in vitro interaction entre le dipeptide Tyr-Asp et GAPC (Veyel et al, 2018 ). Nous avons commencé avec l'hypothèse la plus simple et testé l'activité de GAPC en l'absence et en présence de Tyr-Asp. En effet, l'application de Tyr-Asp (100 µM) a inhibé l'activité enzymatique de GAPC, contrairement au traitement avec des acides aminés simples (Tyr et Asp) ou un dipeptide chimiquement non apparenté (Ile-Glu) (Fig 1A). La réduction de 23 % peut paraître modeste, mais il est important de noter que le dosage de l'activité GAPC rend compte non seulement de la GAPC cytosolique mais aussi de la GAPCp, et de plus de la GAPA/B, qui a une activité substantielle avec le NAD + (Falini et al, 2003 ), alors que l'activité GAPCp est négligeable dans les extraits bruts de rosettes d'Arabidopsis récoltées à la lumière, ce qui n'est pas le cas pour GAPA/B (Munoz-Bertomeu et al, 2009 ). Pour différencier les activités GAPC et GAPA/B, nous avons introduit écartc1 écartc2 double mutant, qui est entièrement dépourvu de l'activité GAPC cytosolique (Guo et al, 2012 ). Ce faisant, nous avons pu démontrer que la réduction de l'activité GAPC produite par l'ajout de Tyr-Asp est similaire à celle observée dans le écartc1 écartc2 double mutant en l'absence du dipeptide (figure 1B). De plus, écartc1 écartc2 double mutant (Guo et al, 2012 ) était insensible à l'inhibition par Tyr-Asp de l'activité GAPC. Sur la base des résultats obtenus, nous concluons que GAPC1 et GAPC2 sont les principales cibles de l'action Tyr-Asp et qu'une concentration de 100 µM de Tyr-Asp est suffisante pour inhiber complètement l'activité de la GAPC glycolytique.Pour étayer davantage nos résultats, nous avons testé l'activité de GAPA/B et GAPN dans des extraits bruts de plantes de type sauvage et le écartc1 écartc2 double mutant (Guo et al, 2012 ). Les figures 1C et D montrent que ni l'activité de GAPA/B ni de GAPN n'a été affectée par Tyr-Asp. Tyr-Asp (100 uM) était suffisant pour inhiber l'activité GAPC. En comparaison, la quantité de Tyr-Asp mesurée dans les semis d'Arabidopsis (conditions témoins) variait de 0,23 à 2,7 nmol g -1 FW -1 avec une moyenne de 0,62 nmol g -1 FW -1 (m = 20 Annexe Fig S1). Nous avons ensuite utilisé les données de Koffler et al ( 2013 ) pour estimer la concentration de Tyr-Asp in planta. Si nous supposons une distribution égale de Tyr-Asp dans tous les compartiments, la concentration intracellulaire de Tyr-Asp serait d'environ 1 µM, alors qu'elle s'élèverait à 26,5 µM si tous les Tyr-Asp étaient exclusivement localisés dans le cytosol.

Figure 1. L'inhibition de l'activité GAPC par Tyr-Asp est associée au déplacement du flux glycolytique vers le PPP et à l'augmentation du rapport NADPH/NADP +

  • A. L'activité enzymatique de GAPC a été mesurée dans des extraits bruts de type sauvage traités avec H2O (faux) et 100 µM de Tyr-Asp, Tyr, Asp et Ile-Glu.
  • B–D. Les activités enzymatiques de GAPC (B), GAPA/B (C) et GAPN (D) ont été mesurées dans le type sauvage et le double k.o. mutant écartc1 écartc2 traité avec H2O (faux) et 100 uM de Tyr-Asp.
  • E. Représentation schématique des voies de la glycolyse et des pentoses phosphates.
  • F. Expérience de flux C6 et C1 marqués au glucose dans des semis d'Arabidopsis âgés de 10 jours. Le rapport C6/C1 pour les semis de type sauvage témoins (traités à l'eau) et Tyr-Asp (100 µM) après 35, 70 et 145 min est indiqué.
  • G. Rapport NADPH/NADP +.
  • H. Rapport NADH/NAD+. Les rapports ont été calculés à partir des mesures de NAD + , NADH, NADP + et NADPH.

Informations sur les données : les données sont la moyenne ± SEM de m = 4 (A–D quatre répétitions techniques), m = 3 (F trois flacons indépendants), et m = 5–6 (G–H cinq à six flacons de semis indépendants). Pour (A–D, F), la significativité a été évaluée à l'aide de la méthode de Student non appariée. t-test. Pour (G–H), la signification a été évaluée à l'aide d'une ANOVA à deux facteurs (P 0,05 lettres indiquent la significativité associée au traitement Tyr-Asp). G6P : glucose 6-phosphate F6P : fructose 6-phosphate FBP : fructose 1,6-bisphosphate DHAP : dihydroxyacétone-phosphate G3P : glycéraldéhyde 3-phosphate 1,3bisPGA : 1,3bis-phosphoglycérate 3PGA : 3-phosphoglycérate PPP : voie des pentoses phosphates R5P : ribose 5-phosphate. Dans (G) et (H), (C) signifie contrôle n.s. : non significatif.

Dans les cellules animales et de levure, l'inactivation oxydative de la GAPDH glycolytique par modification redox de la cystéine catalytique s'est avérée augmenter le rapport NADPH/NADP + en redirigeant le flux glycolytique vers le PPP (Fig 1E) (Ralser et al, 2007 ). De plus, Arabidopsis double écartc1 écartc2 mutant knock-out se caractérise par une augmentation du rapport NADPH/NADP + (Guo et al, 2014 ). Pour tester si les plantes d'Arabidopsis traitées au Tyr-Asp auraient des effets similaires et déplaceraient les intermédiaires glycolytiques vers le PPP en raison de l'inhibition de la GAPC, nous avons exploité la capacité prouvée des racines d'Arabidopsis à absorber les dipeptides du milieu de croissance (Komarova et al, 2008 ). Les semis ont été nourris avec du glucose 14 C marqué en position C1 ou C6 en l'absence ou en présence de 100 M Tyr-Asp (Nunes-Nesi et al, 2005 ). Nous avons comparé les taux auxquels 14 CO2 a été libéré des carbones 1 (C1) et 6 (C6) à 35, 70 et 145 min après l'ajout du glucose 14 C (Fig 1F Annexe Fig S2A). 14 CO2 sortie de C1 est liée à l'activité à la fois du PPP et de la glycolyse, tandis que de C6 seulement de la glycolyse/TCA, et par conséquent un C plus faible6-à-C1 rapport est indicatif du PPP le plus actif (Annexe Fig S2A). Une diminution significative du C6-à-C1 rapport mesuré dans le Tyr-Asp-traité contre les semis témoins plaident pour que le G6P soit redirigé de la glycolyse vers le PPP (figure 1F). Pour déterminer si les changements observés dans l'activité PPP entraînent une modification du rapport NADPH/NADP +, les concentrations cellulaires NAD + , NADH, NADP + et NADPH ont été mesurées dans des simulations (H2témoin traité à l'O) et des semis d'Arabidopsis âgés de 10 jours traités au Tyr-Asp cultivés en culture liquide à 1 et 6 h à l'aide d'un test enzymatique ciblé (annexe Fig S2B–F). La supplémentation en Tyr-Asp a produit une réduction significative des niveaux de NAD + , NADH et NADP + (annexe Fig S2B-F), entraînant une augmentation significative du rapport NADPH/NADP + déduit (Fig 1G), mais un NADH/NAD inchangé + rapport (Fig 1H).

Enfin, nous avons utilisé les lignées marqueurs YFP et GFP de GAPC1 et GAPCp1/2 (Munoz-Bertomeu et al, 2009 Guo et al, 2012 ) pour déterminer la localisation subcellulaire de GAPDH lors du traitement Tyr-Asp, et donc ses activités au clair de lune (Zaffagnini et al, 2013 Schneider et al, 2018 ). Cependant, et au moins dans nos conditions expérimentales, le traitement Tyr-Asp n'a pas modifié la localisation subcellulaire de GAPDH (Annexe Figs S3 et S4).

La supplémentation en Tyr-Asp confère une résistance au stress oxydatif chez les plants d'Arabidopsis et de tabac

L'inactivation de la GAPDH améliore la tolérance au stress oxydatif dans les cellules de levure et animales en fournissant du NADPH (Ralser et al, 2007 ). Ici, nous avons examiné si la réduction de l'activité GAPDH mesurée dans les plantes traitées avec Tyr-Asp conférerait également un avantage dans des conditions de stress oxydatif. Pour tester notre hypothèse, nous avons utilisé deux agents connus pour induire une réponse au stress oxydatif : le peroxyde d'hydrogène (H2O2:50 mM) et catéchine (0,175 mM) (Scarpeci et al, 2008 Kaushik et al, 2010 ). Pour être cohérent avec les expériences d'alimentation Tyr-Asp, nous avons utilisé des plantes cultivées sur des milieux MS synthétiques, puis nous les avons transférées dans des milieux MS liquides pour le stress oxydatif et les traitements Tyr-Asp (voir la section Méthodes). De plus, nous avons testé à la fois des plants d'Arabidopsis et de tabac (dans plusieurs expériences Dataset EV1), ces derniers étant caractérisés par une croissance plus homogène dans des conditions normales. Les plantes ont été mises à germer sur un milieu MS solide et transférées dans une plaque à 24 puits 12 jours après la stratification (DAS). Tout d'abord, les semis ont été incubés avec 100 µM Tyr-Asp ou mock (H2O) pendant 1 h avant d'appliquer la contrainte. Le poids frais, en tant qu'indicateur de croissance, a été mesuré après deux et quatre jours de traitement à la catéchine chez Arabidopsis et le tabac, respectivement, et après 36 h et 2 jours de H2O2 traitement chez Arabidopsis et tabac, respectivement. Bien que la supplémentation en Tyr-Asp n'ait pas affecté la croissance globale des plantes dans des conditions de contrôle, elle a entraîné une augmentation du poids frais sous les deux régimes de stress oxydatif chez les plantules d'Arabidopsis et de tabac (Fig. 2A-C et annexe Fig S5A-D). L'augmentation du poids frais a été encore corroborée par les mesures de la surface foliaire des plants de tabac traités à la catéchine (Fig 2C). Il est important de noter que ni la combinaison de Tyr et Asp ni les deux autres dipeptides testés, Ser-Leu et Gly-Pro, n'ont présenté la bioactivité de Tyr-Asp (Fig 2A et annexe Fig S5A-D).

Figure 2. Le traitement Tyr-Asp améliore les performances de croissance des plants d'Arabidopsis et de tabac exposés au stress oxydatif

  1. Quantification du poids frais des plants d'Arabidopsis et de tabac. Les semis ont été prétraités avec du mock (eau), Tyr-Asp (100 M), Tyr et Asp (100 M), Ser-Leu (100 M) ou Gly-Pro (100 M) pendant 1 h avant un stress oxydatif (catéchine ou H2O2). Chaque traitement a été comparé à son contrôle respectif, correspondant à des plantes cultivées dans une plaque de 24 puits (représentées par les barres accolées).
  2. Des plants de tabac traités à la catéchine (panneau supérieur gauche) et (catéchine) Tyr-Asp (panneau supérieur droit) cultivés pendant quatre jours dans un milieu liquide. H2O2- (panneau supérieur gauche) et (H2O2-) Des plants de tabac traités au Tyr-Asp (panneau supérieur droit) cultivés pendant deux jours dans des milieux liquides. Toutes les plantes avaient 2 semaines avant de commencer le traitement de stress.
  3. Série de feuilles préparées à partir de plantules de tabac prétraitées (1 h) avec soit du mock soit du Tyr-Asp et exposées à la catéchine pendant 4 jours.

Informations sur les données : les données sont la moyenne ± SEM de m = 10-12 (semis). Étudiant bilatéral non apparié t-test a été effectué pour comparer les traitements avec le contrôle. Barre d'échelle : 10 cm.

Pour compléter les régimes de stress oxydatif, nous avons décidé de tester l'effet de la supplémentation en Tyr-Asp sur les performances des plantes sous stress salin. Comme décrit ci-dessus, des semis de tabac âgés de 12 jours ont été incubés avec 100 µM de Tyr-Asp ou de faux (H2O) pendant 1 h avant d'appliquer le stress salin (50 mM NaCl). Les performances des plantes ont été mesurées après 6 jours de traitement au sel en évaluant le poids frais des plantes. Encore une fois, le traitement Tyr-Asp, mais ni la combinaison d'acides aminés ni les deux autres dipeptides testés n'ont amélioré les performances des plantes dans des conditions de stress (annexe Fig S5E et F).

Tester si l'amélioration de la tolérance au stress est limitée à l'utilisation de milieux liquides et donc à l'absorption de dipeptides passant par à la fois des racines et des pousses, nous avons effectué des expériences sur la catéchine et le sel en utilisant des plants de tabac cultivés sur un treillis de nylon recouvrant un support MS solide (voir la section Méthodes). Des plantes âgées de deux semaines ont été transférées d'abord dans des plaques contenant du Tyr-Asp et ensuite dans des plaques contenant une combinaison de Tyr-Asp, de sel et/ou de catéchine. Des mesures de poids frais ont été prises après une semaine de traitement (Annexe Fig S6A). L'ajout de Tyr-Asp n'a eu aucun effet sur la croissance des plantes mesurée dans des conditions de contrôle, mais il en a résulté une biomasse globale plus élevée chez les plantes soumises aux stress de la catéchine et du sel (annexe Fig S6B).

Enfin, et pour évaluer la contribution de l'inhibition Tyr-Asp de l'activité GAPC à l'amélioration de la tolérance au stress associée au traitement Tyr-Asp, nous avons utilisé le double écartc1 écartc2 mutant double knock-out (Guo et al, 2012), qui a montré un effet similaire à celui observé pour le traitement Tyr-Asp, dans la réduction de l'activité GAPC totale (Fig 1B). Arabidopsis de type sauvage et écartc1 écartc2 les plantes ont été soumises à un stress de catéchine comme décrit ci-dessus. Comme observé précédemment, la supplémentation en Tyr-Asp a augmenté la biomasse des semis de type sauvage traités à la catéchine (Fig 3A et D Annexe Fig S7A). En revanche, aucune amélioration de ce type n'a été observée pour le écartc1 écartc2 lignée mutante (figures 3B et E, et annexe figure S7B), faisant valoir que la tolérance au stress associée à Tyr-Asp dépend de l'inhibition des activités GAPC1 et GAPC2. De plus, alors que dans des conditions de contrôle, écartc1 écartc2 la lignée mutante était significativement plus petite par rapport au type sauvage, l'inverse était vrai sous traitement à la catéchine (Fig 3C et F Annexe Fig S7C). Nos résultats sont en accord avec l'amélioration de la tolérance à la sécheresse précédemment rapportée du écartc1 écartc2 mutant (Guo et al, 2012 ).

Figure 3. L'amélioration de Tyr-Asp de la tolérance au stress d'Arabidopsis est associée à l'inhibition de GAPC1/2

  • A–C. Mesures de poids frais d'Arabidopsis de type sauvage et écartc1 écartc2 double k.o. plantes soumises au stress oxydatif (ex : catéchine) et aux traitements Tyr-Asp. Chaque traitement a été comparé à son contrôle respectif, correspondant à des plantes cultivées dans une plaque de 24 puits (représentées par les barres accolées).
  • D–F. Représentant de type sauvage d'Arabidopsis et écartc1 écartc2 double k.o. plantules des différents traitements. Toutes les plantes étaient âgées de 10 jours au début du stress. Les plantules ont été exposées à la catéchine pendant 3 jours.

Informations sur les données : les données sont la moyenne ± SEM de m = 10-12 (semis). Étudiant bilatéral non apparié t-test a été effectué pour comparer les traitements avec le contrôle. Barre d'échelle : 10 cm. Les données d'une expérience indépendante sont présentées dans (Annexe Fig S7).

In silico la prédiction de la liaison de Tyr-Asp à Arabidopsis GAPC1 révèle deux sites spatialement proches

Profitant de la structure cristalline disponible pour la protéine Arabidopsis GAPC1-NAD + (PDB-ID 4z0h) (Zaffagnini et al, 2016 ), nous avons effectué une in silico analyse d'amarrage. Tyr-Asp devait se lier à deux sites spatialement proches du NAD + : au site catalytique entouré des résidus d'acides aminés « SCT », « H », « TAT » et « R » (positions 148-150, 176, 179-181 et 231 de la chaîne R), et proche de la fraction adénosine de NAD + . Dans la première poche, Tyr-Asp se lie avec un K associé de 28,6 µM (Fig 4A–C, poche 1). Dans la deuxième poche, bordée par les résidus d'acides aminés « KTVDGP » (positions de séquence 183-188 de la chaîne O) et « F », « A » et « Q » (positions 34, 179 et 181 de la chaîne R), dans à proximité des fractions ribonucléotide et nicotinamide du NAD + , Tyr-Asp se lie à un K associé de 23,3 µM (Fig 4A–C, poche 2). De plus, nous avons trouvé une poche de reliure alternative avec une efficacité de reliure inférieure, mais toujours appréciable (K de 82,5 µM), relativement éloignés des deux poches précédentes et bordés par les résidus d'acides aminés « VGD » (positions de séquence 284-286 de la chaîne O) et « R », « HGQ », « K » et « W » ( positions 17, 49-51, 53 et 315 de la chaîne R') (Fig 4A, poche 3). Nous avons ensuite retiré la molécule NAD + de la structure cristalline (PDB-ID 4z0h), résultant en une liaison Tyr-Asp à la position de l'adénosine retirée de NAD +, se liant aux résidus d'acides aminés "I", "SAP", " ASC", "T", "R", "NE", "Y" (positions 11, 119-121, 147-149, 179, 231, 313-314 et 317, avec un K de 5,1 µM Fig 4B). Amarrage Tyr-Asp à la structure S-glutathionylée GAPC1-NAD + (PDB-ID 6quq) (Berman et al, 2000 Zaffagnini et al, 2019 ) n'a entraîné aucune détection de poche de liaison au site catalytique, et donc aucune liaison prédite. La forme oxydée de GAPC1-NAD+ (PDB-ID 6qun) (Zaffagnini et al, 2019 ) a montré une affinité 13 fois diminuée pour la liaison à la poche catalytique, avec un K de 304,3 µM. Enfin, nous avons comparé les sites de liaison Tyr-Asp prédits avec la structure publiée de la protéine GAPA d'Arabidopsis avec une petite protéine chloroplastique Cp12-2 (PDB-ID 3qv1 Fig 4C) (Marri et al, 2008 Fermani et al, 2012 ). Le motif Tyr-Asp présent à l'extrémité C-terminale du Cp12-2 a été précédemment rapporté comme étant impliqué dans la stabilisation de l'interaction GAPA/Cp12 avec Tyr76 formant une liaison hydrogène avec le groupe phosphate de NAD + . Le motif Tyr-Asp C-terminal de Cp12 chevauche le Tyr-Asp ancré informatiquement sur le site catalytique (Fig 4C, poche 1). La position de liaison prédite de Tyr-Asp désignée comme la deuxième poche (figures 4A et C, poche 2) chevauche l'acide glutamique (position de séquence 12) de Cp12-2. Par conséquent, Tyr-Asp peut interférer avec la liaison Cp12, posant une hypothèse intéressante à tester à l'avenir.

Figure 4. Prédiction in silico de la liaison Tyr-Asp à GAPC

  1. Représentation en surface du tétramère GAPC1 (dimère de OR-dimère) avec des couleurs indiquant les différentes chaînes et l'identité de séquence respective (O = O' et R = R') et mettant en évidence les conformations de Tyr-Asp (bleu) amarré aux poches identifiées , marqué 1-3, ainsi que le site catalytique (Cys 149 et His 176 en rouge), et NAD + (rose).
  2. La conformation de liaison prévue de Tyr-Asp amarré à GAPC1 sans NAD + (mais montré pour référence et tiré de 4z0h, violet).
  3. Poches de zoom 1 et 2 avec Cp12-2 superposé (tiré de PDB-ID 3qv1, gris de dessin animé) avec de l'acide glutamique surligné en position de séquence 12 et un motif Tyr-Asp C-terminal (tous deux en représentation de bâton), qui interfèrent stériquement avec Reliure Tyr-Asp aux poches 1 et 2.

La caractérisation du protéome de l'expérience d'alimentation Tyr-Asp a révélé des changements dans le métabolisme protéique et redox compatibles avec les interactions protéiques Tyr-Asp au-delà de celles avec GAPC

L'inhibition par Tyr-Asp de l'activité GAPC et le changement associé du rapport NADPH/NADP + fournit une explication de l'amélioration de la résistance au stress des semis supplémentés par Tyr-Asp. Pour explorer des mécanismes alternatifs, nous avons décidé de suivre deux stratégies expérimentales supplémentaires. Tout d'abord, nous avons caractérisé les modifications du protéome et du métabolome associées au traitement Tyr-Asp. Plus précisément, des semis d'Arabidopsis âgés de 10 jours cultivés en culture liquide ont été complétés avec 100 µM de Tyr-Asp et récoltés à cinq moments différents (15, 30 min, 1, 6 et 24 h) avant aux analyses métabolomiques et protéomiques non ciblées basées sur la spectrométrie de masse. Comme auparavant, des semis traités à l'eau fictive ont été utilisés comme témoins. L'analyse statistique des 5257 protéines et 201 métabolites a révélé un total de 212 protéines, mais seuls trois métabolites (Tyr-Asp, Tyr et Asp-Pro) ont été significativement affectés par Tyr-Asp (ANOVA à deux voies, FDR corrigé P 0,05) (Fig 5A Dataset EV2). La teneur en Tyr-Asp mesurée dans les semis d'Arabidopsis traités était élevée dans les 15 minutes suivant la supplémentation en Tyr-Asp, atteignant un pic à 1 h, suivie d'une diminution et d'une accumulation réduite à 24 h (Dataset EV2). Sans surprise, compte tenu du renouvellement rapide du Tyr-Asp supplémenté, les niveaux de tyrosine ont également augmenté lors de l'alimentation en Tyr-Asp (Dataset EV2). Au total, 164 des 212 protéines affectées par le traitement Tyr-Asp (38 régulées à la hausse et 126 à la baisse) à 29 bacs MapMan fonctionnels (Fig 5B Dataset EV3), révélant des changements dans le métabolisme des protéines et de l'oxydoréduction. Alors que les sous-unités ribosomiques étaient enrichies parmi les protéines régulées à la hausse, les chaperons (par exemple, HSP70, HSP90.7, HSP90.1, ROF1 et CPN10) et les protéases (par exemple, les protéases à cystéine RD21 et la cathepsine) ont été régulées à la baisse par le Tyr-Asp traitement. Une diminution de l'abondance a également été mesurée pour les enzymes impliquées dans le métabolisme redox (par exemple, la thiorédoxine H1 et H3, la glutathion réductase, la ferredoxine-thiorédoxine réductase et l'ascorbate oxydase). En effet, 22 des protéines différentielles se lient au NADP(H), dont la glutathion réductase, qui participe à la reconstitution du pool de glutathion réduit, une petite molécule indispensable à la réponse au stress oxydatif (Noctor et al, 2018 ). D'autres protéines régulées à la baisse comprenaient des enzymes du métabolisme des acides aminés et du carbone, notamment la G6PDH plastidiale, les récepteurs de l'acide abscissique PYR1 et PYL1 et les protéines associées à la paroi cellulaire.

Figure 5. Tyr-Asp affecte le métabolisme redox et protéique

  1. Les protéines et les métabolites s'accumulant différemment en réponse à l'alimentation Tyr-Asp ont été délimités à l'aide d'une ANOVA bidirectionnelle intégrée dans le logiciel MeV (Howe et al, 2011 ), suivi de la correction du taux de fausses découvertes (FDR). Représentation par carte thermique des différentiels, respectivement, 212 et trois (ANOVA FDR bidirectionnelle corrigée P ≤ 0,05) protéines et métabolites sur cinq points dans le temps. Les données sont présentées sous forme de log2 changement de pli entre le contrôle et le traitement. Le rouge indique une régulation à la baisse tandis que le bleu indique une régulation à la hausse. 1: journal2 changement de pli (FC) 15 min 2 : bûche2 FC 30 min 3 : bûche2 FC 1 h 4 : journal2 FC 6 h 5 : journal2 FC 24 h M : journal médian2 FC de tous les points temporels.
  2. Médiane du journal2 Le facteur de changement entre le contrôle et le traitement calculé à partir des cinq points dans le temps a été utilisé pour la visualisation MapMan (Thimm et al, 2004 ) des protéines différentielles (carrés) et des métabolites (cercles). Le bleu indique une régulation à la hausse tandis que le rouge indique une régulation à la baisse. MapMan a automatiquement attribué des codes binaires et des protéines ont été classés en différentes fonctions/processus cellulaires. Liaison : liaison CHO : glucides Divers : divers Modif. : modification N : azote OPP : voie oxydative des pentoses phosphates Reg. : régulation S : soufre Targ. : ciblage TCA : cycle de l'acide tricarboxylique.
  3. Comparaison du diagramme de Venn des intéracteurs présumés Tyr-Asp identifiés dans les expériences AP en utilisant différentes sources de matériau de départ.
  4. Comparaison du diagramme de Venn des intéracteurs présumés Tyr-Asp identifiés dans les expériences AP, TPP et PROMIS.
  5. Cytoscape (Shannon et al, 2003 ) visualisation de l'interactome Tyr-Asp. Les nœuds représentent les interacteurs Tyr-Asp et les arêtes ont été importées de la base de données STRING (Szklarczyk et al, 2017 ) à l'aide de preuves expérimentales, de bases de données et de la littérature (score fixé à 0,4). La fonctionnalité a été attribuée sur la base de l'UniProt (Apweiler et al, 2004 ). Les nœuds déconnectés ont été supprimés du réseau.

Parallèlement à l'analyse omique de l'expérience d'alimentation Tyr-Asp, nous avons revisité l'interactome de la protéine Tyr-Asp. Auparavant, des billes d'agarose couplées à Tyr-Asp étaient utilisées pour capturer des liants protéiques du lysat cellulaire natif préparé à partir de cultures cellulaires d'Arabidopsis (Veyel et al, 2018 ). Ici, nous avons effectué deux expériences supplémentaires de purification par affinité (AP), cette fois en utilisant Arabidopsis et des feuilles de tabac. Un total de 13 et 29 protéines ont été identifiés dans les expériences de tabac et d'Arabidopsis AP, respectivement, en comparaison avec les 108 précédemment identifiés à l'aide de cultures cellulaires (Fig 5C Dataset EV4 et EV5). Un chevauchement du diagramme de Venn des trois listes contenait une seule protéine, GAPC1 cytosolique (figure 5C), soutenant un rôle conservé de Tyr-Asp dans la régulation de l'activité GAPDH dépendante du NAD+.

Pour compléter les expériences AP, nous avons décidé d'étudier l'interactome Tyr-Asp par une approche indépendante centrée sur les petites molécules, à savoir le profilage du protéome thermique (TPP) (Savitski et al, 2014 ). Dans l'expérience TPP, les cibles protéiques putatives sont délimitées en surveillant les changements dans la stabilité thermique des protéines provoqués par la liaison de petites molécules. Le lysat cellulaire natif d'Arabidopsis (préparé à partir de la culture en suspension cellulaire cultivée à la lumière) a été traité avec du Tyr-Asp fictif ou 10 pM, suivi d'un gradient de température et d'une analyse protéomique. Le traitement Tyr-Asp a modifié la stabilité thermique de 177 des 3092 protéines quantifiées (Dataset EV6). La liste des intéracteurs Tyr-Asp putatifs a été enrichie en protéines associées au métabolisme des protéines et à la réponse au stress abiotique : chaperons (par exemple, CPN10, CPN20, CPN60A), protéines ribosomiques (par exemple, RPL12-C, RPL10, RPS24/35), protéases et peptidases (p. ex. CLPR3, peptidase C15, DEG1, peptidase M20/M25/M40) et enzymes impliquées dans la défense contre le stress oxydatif (glutarédoxines et thiorédoxines Annexe Fig S8).

Dans une dernière étape, nous avons comparé les listes d'interacteurs Tyr-Asp putatifs des expériences TPP et AP. Nous avons également inclus une troisième liste obtenue à partir de l'expérience PROMIS publiée et comprenant des protéines co-séparées avec Tyr-Asp dans un fractionnement basé sur la taille (Veyel et al, 2018 ). Nous nous référons à 47 protéines identifiées par au moins deux approches indépendantes comme des interacteurs Tyr-Asp putatifs à haute confiance (Fig. 5D Dataset EV7). En interrogeant la base de données STRING sur les interactions protéine-protéine signalées (Szklarczyk et al, 2017 ) et en utilisant Cytoscape comme outil de visualisation (Shannon et al, 2003 ), nous avons construit l'interactome final Tyr-Asp (réseau) comprenant 36 protéines interconnectées. Les protéines ont été regroupées en quatre classes fonctionnelles (i) métabolisme du carbone (GAPC1, GAPC2 et TKL1, TKL2), (ii) chaperons (par exemple, CPN10, CPN20), (iii) traduction et production d'ATP (par exemple, RRF, RPL12-C ), et (iv) la dégradation des protéines (par exemple, RAD23B, DSK2 Fig 5E).

AthL'activité de PEPCK1 est inhibée par les dipeptides d'acides aminés ramifiés et polaires

Ensuite, nous nous sommes demandé si la GAPC était la seule enzyme glycolytique/gluconéogénique ciblée par les dipeptides protéogéniques. Le jeu de données PROMIS (Veyel et al, 2018 ), utilisé dans l'identification de l'interaction Tyr-Asp-GAPDH, contient 92 dipeptides protéogéniques supplémentaires, couvrant toute la plage de séparation des protéines (Dataset EV8). Pour tester la probabilité de liaison des dipeptides protéogéniques à d'autres enzymes glycolytiques/gluconéogènes, nous avons analysé la co-élution de tous les dipeptides et de toutes les enzymes glycolytiques/gluconéogènes présentes dans l'ensemble de données PROMIS (Veyel et al, 2018 ). Notre analyse a identifié de nombreuses interactions putatives (Annexe Fig S9 Dataset EV8). Nous avons concentré notre attention sur l'un des clusters de co-élution contenant l'enzyme gluconéogénique phosphoénolpyruvate carboxykinase 1 (AthPEPCK1) et un groupe de six dipeptides caractérisés par la présence d'acides aminés polaires ou à chaîne ramifiée (Ile-Gln, Ile-Ala, Phe-Gln, Leu-Thr, Ser-Tyr et Ser-Val). L'activité de recombinaison AthPEPCK1 (Rojas et al, 2019) a été analysé à des concentrations croissantes des dipeptides sélectionnés (Fig 6A). Remarquablement, les six dipeptides testés ont inhibé AthActivité PEPCK1 avec je0.5 des valeurs allant de micromolaires moyennes à élevées, alors qu'aucun effet n'a été observé pour Tyr-Asp (Fig 6B). Le dipeptide Ala-Ile était l'inhibiteur le plus puissant, suivi par Ile-Gln, Ser-Tyr, Phe-Gln, Ser-Val et Leu-Thr. Au contraire, aucun des acides aminés testés n'a affecté AthActivité PEPCK1 (Annexe Fig S10). Pour valider l'inhibition des recombinants AthPEPCK1, nous avons mesuré l'activité PEPCK dans un lysat de protéines de rosettes d'Arabidopsis, en utilisant un dosage fluorométrique optimisé ad hoc (Annexe Fig S11). Conformément aux résultats obtenus pour l'enzyme recombinante, les six dipeptides (Ile-Gln, Ile-Ala, Phe-Gln, Leu-Thr, Ser-Tyr et Ser-Val) ont inhibé l'activité PEPCK dans les extraits bruts, avec Ala- Ile montrant l'effet inhibiteur le plus puissant, alors qu'aucun effet n'a été observé avec Tyr-Asp (figure 6C).

Figure 6. AthL'activité de PEPCK1 est inhibée par les dipeptides

  • A, B. Recombinant AthL'activité de PEPCK1 a été mesurée à des concentrations croissantes de six dipeptides H-P différents (A) ou Tyr-Asp (B). je0.5 les valeurs sont indiquées sur chaque graphique. Les mesures ont été effectuées dans le sens de la décarboxylation, comme décrit dans la section Méthodes. Les données ont été ajustées à une équation de Hill modifiée. La valeur de 1 correspond à l'activité de 4,3 ± 0,2 U mg -1 . Les données sont la moyenne ± SEM de 4 mesures indépendantes.
  • C. L'activité PEPCK a été mesurée dans un lysat protéique préparé à partir de feuilles d'Arabidopsis âgées de 3 semaines en l'absence (témoin, C) ou en présence de 500 µM des différents dipeptides. Les mesures ont été effectuées dans le sens de la carboxylation, comme décrit dans la section Méthodes. Les données sont la moyenne ± ET de 4 préparations de lysat indépendantes. Étudiant bilatéral non apparié t-des tests ont été effectués pour comparer les traitements dipeptidiques avec le contrôle.

Discussion

Dans cet article, nous présentons COSMOS, un pipeline d'analyse pour générer systématiquement des hypothèses mécanistes en intégrant des ensembles de données multi-omiques avec un large éventail de ressources organisées d'interactions entre les protéines, les transcrits et les métabolites.

Nous avons d'abord montré comment les activités de TF, de kinase et de phosphatase pouvaient être estimées de manière cohérente à partir d'ensembles de données de transcriptomique et de phosphoprotéomique en utilisant une analyse basée sur l'empreinte. Il s'agit d'une étape critique avant d'approfondir l'exploration mécaniste. En effet, le transcrit et le phosphosite offrent généralement des informations fonctionnelles limitées en eux-mêmes, car leur relation avec l'activité protéique correspondante n'est généralement pas bien caractérisée. Pourtant, ils peuvent fournir des informations sur l'activité des protéines en amont régulant leurs abondances. Ainsi, l'état fonctionnel des kinases, des phosphatases et des TF est estimé à partir du changement d'abondance observé de leurs cibles connues, c'est-à-dire leur empreinte moléculaire. Grâce à cette approche, nous avons pu caractériser simultanément les états fonctionnels des protéines dans les tumeurs au niveau de la voie de signalisation et de la régulation transcriptionnelle. Les acteurs clés de la réponse à l'hypoxie, de la voie de l'inflammation et des gènes oncogènes se sont avérés avoir une altération particulièrement forte de leurs états fonctionnels, tels que HIF1A, APES1, STAT1/2, MYC, et CDK2. Perte de VHL est une marque de fabrique du ccRCC et est directement liée à la stabilité du HIF (HIF1A et APES1) protéines trouvées dérégulées par notre analyse (Maxwell et al, 1999 Ivan et al, 2001 Jaakkola et al, 2001 ). Trouver ces signatures établies de ccRCC à déréglementer dans notre analyse est une confirmation de la validité de cette approche.

Nous avons ensuite appliqué COSMOS avec un nouveau réseau de connaissances préalables métacausales couvrant la signalisation, la transcription et le métabolisme pour trouver systématiquement des mécanismes potentiels liant les activités protéiques dérégulées et les concentrations de métabolites. À notre connaissance, il s'agit de la première tentative d'intégration de ces trois couches omiques ensemble de manière systématique en utilisant un raisonnement causal. Méthodes antérieures étudiant les voies de signalisation avec des ensembles de données quantitatives multi-omiques (Drake et al, 2016 ) connectaient les TF avec des kinases, mais elles étaient limitées par le sous-réseau localement cohérent présélectionné de l'algorithme TieDIE. L'introduction de la causalité globale ainsi que des données métabolomiques nous permet d'obtenir une interprétation mécaniste directe des liens entre les protéines à différents niveaux de régulation et les métabolites. L'objectif de notre approche est de trouver un ensemble cohérent de tels mécanismes reliant autant d'activités protéiques dérégulées observées et de concentrations de métabolites que possible. L'utilisation de COSMOS est particulièrement intéressante car tous les mécanismes proposés entre paires de molécules (protéines et métabolites) doivent être plausibles non seulement dans le contexte de leur propre interaction par paires mais aussi par rapport à toutes les autres molécules que nous souhaitons inclure dans le modèle. Par exemple, l'activation proposée de MYC par NFKB1 et MAPK1 est en outre soutenu par STAT3 l'activation, car MAPK1 est également connu pour activer STAT3. Ainsi, nous avons développé COSMOS pour étendre ce type de raisonnement à l'ensemble de la PKN avec toutes les activités protéiques et métabolites significativement dérégulés. Nous nous sommes appuyés sur une optimisation ILP via le package CARNIVAL R (Liu et al, 2019b ) pour contextualiser ce PKN avec nos données. Nous avons affiné la procédure d'optimisation pour gérer ce très grand PKN et construit un package R pour permettre aux autres de l'utiliser avec leurs propres données. Étant donné un ensemble de TF, de kinases/phosphatases ou de métabolites dérégulés, COSMOS fournit aux utilisateurs un ensemble d'hypothèses mécanistes cohérentes pour expliquer les changements observés dans une couche omique donnée avec des régulateurs en amont d'autres couches omiques. Ainsi, son objectif est d'intégrer les données mesurées aux connaissances antérieures de manière cohérente et systématique, et non de prédire explicitement le résultat de nouvelles expériences.

Étant donné que la voie de réponse de l'interféron gamma était la caractéristique du cancer la plus surreprésentée dans la solution du réseau COSMOS, nous avons étudié plus avant la pertinence de l'hypothèse mécaniste reliant les membres de cette voie. Le réseau a montré que les diaphonies entre MAPK1, NFKB1, MYC, HIF1A, et AA1 pourrait expliquer la dérégulation de la glutamine et la réduction du métabolisme du glutathion, ainsi que l'inosine, l'hypoxanthine et l'adénine. Celles-ci étaient particulièrement pertinentes car il s'agissait d'interactions importantes dans le ccRCC. MYC et le métabolisme de la glutamine semblent être une cible thérapeutique intéressante du ccRCC (Shroff et al, 2015 ). AA1 est un inhibiteur indirect connu de MYC impliqué dans le développement du cancer (Austen et al, 1998 ). Le réseau COSMOS a montré AA1 pourrait également jouer un rôle dans la régulation à la baisse de la ADA et PNP activités enzymatiques métaboliques. De manière cohérente, PNP s'est avéré non essentiel dans les lignées cellulaires ccRCC, ce qui est attendu des enzymes métaboliques régulées à la baisse (Gatto et al, 2015 ). De plus, le lien montré par COSMOS entre NFKB1 et MYC peut avoir des implications pour le traitement du ccRCC, en raison de son rôle central dans le traitement du cancer par l'arsénite (un médicament utilisé en chimiothérapie) (Huang et al, 2014 ). De plus, l'activation de la NFKB1-MYC lien dans FBW7-les cellules déficientes semblent les sensibiliser au Sorafinib (un MEK-Raf inhibiteur), un médicament utilisé dans le traitement du cancer primitif du rein (Huang et al, 2014 ). En outre, NFKB1 et MYC sont tous deux des cibles prometteuses pour le traitement du ccRCC (Peri et al, 2013 Bailey et al, 2017 ). Le lien montré par COSMOS entre KMT2A et l'adénosine est intéressante, car KMT2A des mutations ont été rapportées chez un certain nombre de patients atteints de ccRCC (Yan et al, 2019 ), suggérant que cette enzyme pourrait jouer un rôle fonctionnel dans le développement du ccRCC. De plus, il a été proposé, au moins in vitro, que des lignées cellulaires ccRCC avec de faibles niveaux basaux de phospho-AKT étaient sensibles au traitement par un analogue de l'adénosine (Kearney et al, 2015 ). Le lien entre OUI1, MAPK1, et SMAD4 dans le réseau COSMOS est particulièrement pertinent étant donné que OUI1 est un oncogène ciblable connu (Hamanaka et al, 2019 ). Ces exemples illustrent la capacité de COSMOS à extraire des hypothèses mécanistes pour comprendre et potentiellement améliorer le traitement du cancer en intégrant de multiples données omiques et des connaissances antérieures.

Cependant, il est important de mentionner que COSMOS ne vise qu'à fournir des hypothèses à explorer davantage expérimentalement. COSMOS ne vise pas à récapituler toutes les interactions moléculaires qui peuvent se produire dans un contexte donné. Actuellement, COSMOS fournit simplement un large ensemble d'hypothèses mécanistes cohérentes, compte tenu des données et des connaissances préalables disponibles. Nous soutenons que cela facilite l'interprétation d'un ensemble de données multi-omiques complexe et guide l'exploration des questions biologiques.

Nous avons évalué les performances et la robustesse de notre approche. Nous avons calculé un réseau de corrélation spécifique à la tumeur des activités de TF et de kinase et l'avons comparé à la corégulation prédite par COSMOS. Cela a donné des résultats encourageants, bien qu'imparfaits, soulignant le fait que les mécanismes proposés par COSMOS, comme ceux de tout outil similaire, sont des hypothèses. Il a également souligné que l'ajout de plus de données omics à intégrer permet de générer plus d'hypothèses et de les connecter entre elles, mais n'améliore pas nécessairement leurs performances prédictives.

Il existe trois principales limites connues aux prédictions de COSMOS. Premièrement, les données d'entrée sont incomplètes. Seule une fraction limitée de tous les phosphosites et métabolites potentiels est détectée par spectrométrie de masse. Cela signifie que nous n'avons aucune information sur une partie significative de la partie PKN du réseau non mesuré qui est conservée dans les analyses et les valeurs sont estimées comme des « valeurs cachées » intermédiaires. Deuxièmement, tous les événements régulateurs entre les TF, les kinases et les phosphatases et leurs cibles ne sont pas connus, et l'estimation de l'activité est basée uniquement sur les relations régulatrices connues. Ainsi, de nombreux TF, kinases et phosphatases ne sont pas inclus car ils n'ont pas d'interactions régulatrices organisées ou aucun substrat détecté dans les données. Troisièmement, et inversement, COSMOS trouvera des explications putatives dans les connaissances antérieures existantes qui peuvent ne pas être le véritable mécanisme.

Ces problèmes proviennent principalement de l'importance accordée aux connaissances préalables dans cette méthode. Étant donné que les connaissances antérieures sont par essence incomplètes, les prochaines étapes d'amélioration pourraient consister à trouver des moyens d'extraire davantage de connaissances des données observées pour pondérer la contribution des connaissances antérieures. Par exemple, on pourrait utiliser les corrélations entre les transcrits, les phosphosites et les métabolites pour quantifier les interactions disponibles dans les bases de données telles qu'OmniPath. Il est important de noter que toute autre omique liée à des molécules actives (telles que les miARN ou les flux d'enzymes métaboliques) peut être utilisée pour estimer les activités des protéines grâce à des approches d'empreinte (telles que l'accessibilité de l'ADN ou des PTM autres que la phosphorylation) peut être intégrée de manière transparente (comme nous l'avons montré avec le fluxomique de l'ensemble de données sur le cancer du sein). De plus, COSMOS a été conçu pour fonctionner avec des ensembles de données omiques en vrac, et il sera très intéressant de trouver des moyens d'appliquer cette approche à des ensembles de données à cellule unique. Il est encourageant de constater que les méthodes d'empreinte qui apportent des données dans COSMOS semblent assez robustes aux caractéristiques des données d'ARN unicellulaire telles que les abandons (Hollande et al, 2020 ). Lié à l'importance des connaissances préalables, le PKN peut également dépendre de la façon dont nous interprétons les informations dont nous disposons sur les interactions moléculaires. En particulier, nous avons converti le réseau réactionnel de Recon3D en un réseau causal où les réactifs métabolites « activent » les enzymes métaboliques et les enzymes métaboliques « activent » les produits métabolites. Cette première approximation suppose que les abondances de métabolites ne sont déterminées que par leurs taux de production. Nous prévoyons d'affiner cela à l'avenir pour inclure que l'abondance des métabolites peut également changer en raison de la consommation. Enfin, nous prévoyons qu'à l'avenir, les technologies de génération de données augmenteront la couverture et que nos connaissances antérieures deviendront plus complètes, réduisant les limitations mentionnées. En attendant, nous pensons que COSMOS est déjà un outil utile pour extraire des informations sur le mécanisme causal des études multi-omiques.


Amélioration des procédés de fermentation pour la fermentation ABE

Outre les modifications au niveau microbien, l'ingénierie du processus de fermentation lui-même est une autre stratégie efficace pour atténuer la toxicité du butanol et améliorer la production de butanol. À l'heure actuelle, divers procédés de fermentation, qui déterminent l'investissement en capital dans les procédés en amont et en aval, la consommation de matières premières et les besoins énergétiques, ont été développés pour améliorer encore l'efficacité de la fermentation ABE.

Optimisation des conditions de culture

Effets des additifs exogènes sur la fermentation ABE

Selon la voie métabolique et les caractéristiques physiologiques, divers acides organiques (tels que l'acétate, le butyrate, les acides aminés et l'acide lactique) pourraient servir de substrats alternatifs pour la production de butanol, puis maintenir l'expression robuste des enzymes associées pendant la phase de solvantogénèse et de solvantogenèse. [169, 170]. Fait intéressant, lorsque le butyrate était la seule source de carbone, seulement 0,2 g/L de butanol a été produit, mais la production de butanol a augmenté de manière significative à 10 g/L lorsque l'acide butyrique et le glucose étaient présents, ce qui suggère que l'acide butyrique peut être un facteur important déclenchant la production de solvant [171]. Plus important encore, après optimisation de la concentration en glucose, de l'ajout d'acide butyrique et du rapport C/N, les quantités de production de butanol et d'ABE ont encore augmenté à 17 g/L et 21,71 g/L, respectivement, dans la fermentation à grande échelle de C. acetobutylicum YM1 [172, 173].De même, avec l'ajout d'acétate d'ammonium 30 mM, le temps de fermentation de C. acetobutylicum L'EA a été raccourcie d'environ 12 h, et le rendement en butanol a augmenté de 8,3 à 13 g/L [174].

Généralement, sur la base de la concentration micellaire critique, les tensioactifs pourraient s'auto-assembler et former des micelles, puis soulager la toxicité du butanol contre les micro-organismes en piégeant le butanol dans les micelles. Au final, l'ajout de tensioactif a permis d'améliorer significativement les performances de la fermentation ABE. Le butanol est enrobé de tensioactif pour ralentir sa toxicité vis-à-vis des micro-organismes, afin d'améliorer la production de butanol. Par exemple, avec l'ajout de tensioactif non ionique [3% (v/v) L62], les quantités de butanol et de solvants totaux produits ont augmenté de manière correspondante à 15,3 g/L et 21 g/L, qui étaient respectivement de 43% (w/w) et 55% (w/w), supérieur au témoin. Plus intéressant encore, lorsque le tensioactif a été ajouté à 9 h, les productivités du butanol et du solvant total ont encore augmenté à 0,31 g/L/h et 0,39 g/L/h de 0,13 g/L/h et 0,17 g/L/h, respectivement [175]. De même, un milieu de fermentation combiné additionné de zinc/privé de magnésium pourrait également améliorer efficacement le métabolisme central du carbone grâce à une modulation à plusieurs niveaux, par exemple une régulation à la hausse de la voie glycolytique, une régulation à la hausse de la thiolase, de la butyraldéhyde déshydrogénase et de la butanol déshydrogénase, et une régulation de l'alcool déshydrogénase, puis amélioration de l'utilisation du glucose, réduction de la production d'éthanol et induit la solvantogenèse plus tôt, faisant passer la production de butanol de 11,83 à 19,18 g/L [176].

Culture mixte pour fermentation ABE

Pour améliorer encore la faisabilité économique de la fermentation ABE, des cultures mixtes avec différents micro-organismes ont été développées pour : (1) élargir la gamme de substrats [177] (2) augmenter la disponibilité des intermédiaires [178, 179], et (3) diminuer la coût du maintien de conditions anaérobies strictes [180]. Par exemple, pour éliminer la coûteuse étape d'hydrolyse enzymatique, une culture mixte de C. thermocellule et C. acetobutylicum a été utilisé pour la fermentation ABE, dans laquelle 40 g/L de cellulose ont été directement utilisés pour produire 5,8 g/L de butanol [181]. De même, lorsqu'une culture mixte de C. acetobutylicum et B. subtilis sans traitement anaérobie a été utilisé pour réduire l'application d'agents réducteurs coûteux, 14,9 g/L de butanol a été produit, soit 21,1 % de plus que celui d'une culture pure de C. acetobutylicum [182]. Cependant, la plus grande possibilité d'infection par un bactériophage lorsque le nombre d'étapes de transfert/sous-culture est augmenté est devenue l'inconvénient majeur, ce qui a limité l'application industrielle des systèmes de co-culture.

Régulation du potentiel d'oxydoréduction (ORP) pour la fermentation ABE

Comme le montre la figure 1, un niveau élevé de NADH améliore la production de butanol au détriment de la formation d'acétone réduite, ce qui suggère que la manipulation de l'équilibre redox intracellulaire au niveau moléculaire ou du processus de fermentation peut être une voie efficace pour générer plus de flux de carbone et énergie vers la production de butanol [183, 184].

Régulateurs intracellulaires pour l'équilibre redox

Pour les clostridies, le flux d'électrons est principalement régulé au nœud ferrédoxine/hydrogénase, de sorte que la réduction des activités d'hydrogénase pourrait inhiber efficacement la formation d'hydrogène moléculaire, entraînant le flux d'électrons vers le butanol en raison de la régénération du pool NAD(P) + [185]. Par conséquent, la surexpression du NADH-dépendant adhE2 pourrait réguler efficacement le rééquilibrage redox, et par la suite améliorer encore la production de butanol [80]. De même, Rex, une protéine de détection redox et un régulateur transcriptionnel, pourrait réguler efficacement l'expression de gènes impliqués dans les voies du butanol contre le décalage intracellulaire NADH/NAD+. En conséquence, un mutant Rex-négatif a produit de plus grandes quantités d'éthanol et de butanol avec moins d'hydrogène et d'acétone comme sous-produits [186].

Génie des bioprocédés

Par rapport à la tâche fastidieuse de la modification génétique, l'ingénierie des bioprocédés (comme l'ajout d'un porteur d'électrons pour renforcer la synthèse du NADH ou l'aération avec du CO pour réprimer les hydrogénases) pourrait être explorée avec un impact immédiat sur l'ORP environnemental et intracellulaire [187]. À cette fin, des porteurs artificiels d'électrons (comme le méthyl viologène et le rouge neutre) ont été ajoutés pour diriger le flux de carbone des acides vers les alcools : ajouter 2 g/L de Na2DONC4 (un récepteur d'électrons) a significativement augmenté la production de butanol, qui a atteint 12,96 g/L, soit 34,8% de plus que celle du contrôle [188]. De même, lorsqu'un mélange de 85 % de N2 et 15% de CO a été injecté pendant la fermentation ABE, l'activité hydrogénase et le transfert d'électrons ont été efficacement supprimés, mais le pool cellulaire de NAD(P)H a été significativement augmenté, améliorant la production de butanol de 4,8 à 7,8 g/L [189]. Plus intéressant encore, lorsque l'ORP de la fermentation ABE était régulé à - 290 mV, la production de solvant pouvait être initiée plus tôt, augmentant la productivité du solvant de 35%, mais le rendement en butanol n'était que légèrement augmenté par rapport à celui sans contrôle ORP [190].

Optimisation du processus de fermentation

Fermentation à haute densité cellulaire

Par rapport aux fermentations aérobies, les fermentations avec clostridia ont d'excellents flux de carbone spécifiques [103], mais souffrent d'une faible densité cellulaire [une absorbance maximale d'environ 10-11 à 600 nm (A600)] en raison de l'inhibition du produit, d'un mécanisme de détection de quorum inconnu ou d'un fonctionnement inapproprié du bioréacteur [191,192,193]. À cette fin, divers processus de fermentation (par exemple, cellule immobilisée, batch, fed-batch et continu) ont été développés pour réaliser une fermentation à haute densité cellulaire en atténuant les inhibitions du substrat et du produit [33, 93] (tableau 4).

Par rapport aux fermentations fed-batch et batch (caractérisées par l'inhibition du produit et des temps d'arrêt considérables) et malgré quelques inconvénients (tels que le coût d'investissement élevé, la contamination par les phages et la floculation de la croissance bactérienne), les processus continus (utilisant des cellules libres, des cellules immobilisées, et le recyclage des cellules) offrent une alternative plus attrayante et productive pour la production industrielle commerciale d'ABE. Les divers avantages comprennent des réductions des temps de stérilisation et de réinoculation, une productivité supérieure et moins d'inhibitions du substrat et du butanol [194]. Par exemple, à l'aide d'un bioréacteur de recyclage cellulaire à membrane, une fermentation ABE continue à haute densité cellulaire de C. acetobutylicum BKM19 a été réalisé pour produire du butanol et de l'ABE avec des productivités volumétriques de 10,7 et 21,1 g/L/h, la production de 11,9 et 23,5 g/L, et les rendements de 0,17 et 0,34 g/g, respectivement, sous le régime opérationnel optimal. état [195]. Généralement, une productivité de > 10 g/L/h, un titre de > 10 g/L de butanol, et un rendement jusqu'à 0,44 g/g pourraient être atteints à partir d'une fermentation à haute densité cellulaire, un grand succès dans la fermentation ABE par Clostridium [196, 197].

Techniques de récupération in situ des produits (ISPR)

Pour atténuer davantage la toxicité du butanol, plusieurs techniques de récupération de produit in situ (ISPR), notamment la pervaporation, l'adsorption, l'extraction liquide-liquide et le stripping au gaz, ont également été développées pour s'intégrer au processus de fermentation pour une productivité plus élevée du butanol [198,199,200,201,202] (tableau 5) . Par exemple, avec la combinaison de la fermentation par lots alimentés et du stripping des gaz, la production, la productivité et le rendement du solvant total ont augmenté de manière significative à 233 g, 1,16 g/L/h et 0,47 g/g, respectivement [203]. Cependant, il existe plusieurs avantages et inconvénients de chaque système de récupération pour la production de butanol (tableau 5). L'osmose inverse a semblé être la technique de récupération la plus préférable d'un point de vue économique, mais elle est sujette au colmatage ou à l'encrassement des membranes [204]. Récemment, une série de nouvelles membranes composites (telles que le PDMS réticulé FAS [205], les membranes de pervaporation à base de PDMS [206], l'oxyde de graphème modifié avec un liquide ionique [207] et les membranes à matrice mixte [208]) ont été fabriquées et appliqué aux techniques ISPR, et a affiché une performance plus stable pendant le fonctionnement continu à long terme de la fermentation ABE [24]. Plus important encore, un processus de récupération intégré idéal devrait minimiser la consommation d'énergie et concentrer le butanol avec une sélectivité élevée, de sorte que des processus de récupération intégrés hybrides ont également été développés pour compenser les inconvénients respectifs des processus individuels et ont montré un bon potentiel pour la fermentation ABE industrielle [191, 209] .


Matériaux et méthodes

Performances de recherche de nourriture

La recherche a été menée dans le sud de l'Ontario, au Canada, du début juin au début juillet 2004. La température quotidienne moyenne (± s.e.m.) élevée était de 23,2±0,65 °C. Le fourrage pendant cette période était abondant. Le nid d'abeilles vide que nous avons placé dans la ruche d'observation au début de l'expérience était plein à 100 % 29 jours plus tard. En supposant une masse pleine trame de 4,5 kg (Sammataro, 1998), cela correspond à une augmentation quotidienne moyenne de la masse trame de 155 g. Nous avons marqué les abeilles nouvellement écloses (Apis mellifera L.) avec des étiquettes numérotées individuellement et les a introduites dans une ruche d'observation à deux cadres contenant environ 2000 abeilles. Nous avons fait quatre introductions de 80 abeilles à 3 jours d'intervalle afin que les abeilles commencent à butiner sur plusieurs jours.

Deux semaines après l'introduction de la première cohorte d'abeilles, nous avons retiré quelques abeilles qui avaient déjà commencé à butiner et avons commencé à enregistrer les données. Toutes les abeilles sortant et entrant dans la ruche ont voyagé à travers un tunnel en plexiglas transparent. Les abeilles marquées ont été détournées dans un tunnel latéral, mises en cage et pesées sur une balance analytique avec une précision de 0,1 mg. La balance rapportait le poids de l'abeille et l'heure de la journée à l'ordinateur, et nous ajoutions l'identité de l'abeille, sa direction de voyage et si elle transportait du pollen. Nous avons enregistré des données depuis le début de l'activité des abeilles le matin jusqu'à 18h00 sur un total de 20 jours successifs, en sautant un seul jour de pluie sans activité de butinage. À la fin de l'expérience, nous avons modifié l'ensemble de données pour n'inclure que les trajets de plus de 5 minutes. Nous avons omis tous les voyages plus courts en supposant qu'il s'agissait de voyages d'orientation des abeilles sur le point de commencer à chercher leur nourriture (Capaldi et al., 2000 Dukas et Visscher, 1994 Ribbands, 1953). Pour chaque voyage de recherche de nourriture, nous avons calculé la durée du voyage en min, la masse de fourrage en mg et le taux de livraison de nourriture, défini comme la masse de fourrage sur la durée du voyage.

Parallèlement, les entrées et les sorties ont été surveillées sur un ensemble distinct d'abeilles domestiques marquées, qui ont été utilisées pour des analyses protéomiques et enzymatiques. Ces abeilles ont été recueillies à quatre stades de vie différents : abeilles des ruches (11-15 jours), jeunes butineuses (2 jours d'expérience de recherche de nourriture), butineuses matures (4-11 jours d'expérience de recherche de nourriture) et vieilles butineuses (≥12 jours de recherche de nourriture vivre). Lors de la collecte, les abeilles ont été placées sur de la glace et disséquées de manière à ne conserver que leurs thorax. Les thorax ont été immédiatement congelés dans de l'azote liquide et conservés à -80°C pour de futures analyses.

Il était essentiel de comparer le comportement des mêmes abeilles individuelles tout au long de leur vie pour contrôler la possibilité d'une corrélation positive entre les performances de recherche de nourriture et la durée de vie. Par conséquent, selon les méthodes publiées (Dukas et Visscher, 1994), la principale analyse statistique impliquait des mesures répétées ANOVA sur l'ensemble de données des taux de livraison de nourriture au cours des 7 premiers jours par les 24 abeilles qui ont butiné pendant au moins 7 jours. Seules quatre de ces 24 abeilles ont collecté du pollen lors d'au moins la moitié de leurs voyages de recherche de nourriture, ce qui empêche une analyse détaillée des butineuses de pollen. Pour évaluer l'effet de la sénescence, nous avons mené une deuxième analyse des performances des 14 abeilles qui ont butiné pendant au moins 12 jours. La taille des échantillons était insuffisante pour les analyses au-delà de 12 jours d'expérience de recherche de nourriture.

Électrophorèse bidimensionnelle et analyse du protéome

Des sections thoraciques de taille similaire provenant de neuf abeilles et neuf butineuses matures [masse = 27,0 ± 0,6 mg et 26,3 ± 0,1 mg (moyenne ± sem), respectivement] ont été individuellement homogénéisées dans 500 l de tampon de lyse de gel bidimensionnel glacé [comme détaillé ailleurs (Smith et al., 2005)] à l'aide d'un homogénéisateur motorisé. L'homogénat a été clarifié par centrifugation (18 000 g, pendant 5 min à 4°C) et le surnageant dessalé en utilisant des colonnes de dessalage de protéines disponibles dans le commerce (Pierce, Rockford, IL, USA).

A partir de chaque homogénat, 200 ug de protéine totale ont été résolus par électrophorèse sur gel bidimensionnelle (2D). Toutes les électrophorèses 2D ont été réalisées en utilisant le système d'électrophorèse Investigator™ (Genomic Solutions, Ann Arbor, MI, USA) selon les instructions du fabricant et en utilisant les tampons de réhydratation/solubilisation, d'équilibrage et de fonctionnement préfabriqués. En bref, la première dimension a été résolue sur des bandes pHIash (pH 3-10) à gradient de pH immobilisé (IPG), en utilisant le régime de tension en rampe préprogrammé de l'appareil de focalisation isoélectrique pHaser, pour un total de 100 000 volts-heures, et la deuxième dimension a été résolue sur la chimie trycine/10 % de gels duracryl en plaque sur l'appareil de coulée et de fonctionnement 2D Investigator™ (Ann Arbor, MI, USA), à nouveau en utilisant le régime de tension préprogrammé. Après électrophorèse, les gels ont été fixés avec de l'eau, du méthanol et de l'acide acétique (conformément aux instructions fournies avec le colorant de gel) puis colorés avec du colorant SYPRO-ruby (Genomic Solutions). L'imagerie des gels colorés a été réalisée en utilisant le système d'imagerie sur gel Perkin Elmer Pro-Express. Les images de gel ont ensuite été analysées à l'aide du logiciel d'analyse Phoretix 2D™ version v2004 (Nonlinear Dynamics).

Les modifications du protéome supposées être associées à la transition de l'activité de la ruche à la recherche de nourriture ont été sélectionnées selon des critères similaires à ceux utilisés par Smith et al. (Smith et al., 2005). La tache de protéine était présente sur tous les gels d'abeilles de la ruche et d'abeilles butineuses (c'est-à-dire que la protéine a été résolue de manière cohérente), mais il y a eu un changement significatif dans le volume de tache normalisé moyen, un paramètre offert par le logiciel d'analyse Phoretix qui combine la zone de tache et l'intensité pour donner un indice global d'expression, entre les gels de ruche et de fourrage.

Des spots de protéines sélectionnés (voir Résultats) ont été découpés dans le gel à l'aide de la station de travail robotique Perkin Elmer Pro-Pick et les bouchons de gel ont été conservés dans du glycérol à 2 % à 4°C jusqu'à ce qu'ils soient soumis à une digestion trypsique en gel et à une analyse peptidique.

Digestion tryptique en gel et analyse par spectroscopie de masse à temps de vol par nano électrospray et spectroscopie de masse

Les bouchons de gel, contenant les taches protéiques d'intérêt (voir ci-dessus), ont été décolorés avec 50 mmol 1 -1 de bicarbonate d'ammonium, contenant 50 % d'acétonitrile et séchés à l'air. Les protéines ont ensuite été réduites en ajoutant 30 µl de 10 mmol l -1 de dithiotréitol (DTT) dans 25 mmol l -1 de bicarbonate d'ammonium à chaque bouchon de gel et en incubant pendant 1 h à 56°C. Après refroidissement à température ambiante, la solution de DTT a été éliminée et les bouchons de gel traités avec le même volume de 100 mmol l -1 d'iodoacétamide dans 50 mmol l -1 de bicarbonate d'ammonium. Après 60 min d'incubation à température ambiante, à l'obscurité, les bouchons de gel ont été lavés avec 30 l de bicarbonate d'ammonium 25 mmol l -1 pendant 15 min puis déshydratés avec 100% d'acétonitrile. Après 10 min, la phase liquide a été retirée et les bouchons de gel ont été complètement séchés à l'air. Les protéines ont ensuite été soumises à une digestion in-gel : 0,015 µg de trypsine dans 30 µl de solution de bicarbonate d'ammonium à 50 mmol 1 -1 contenant 10 % d'acétonitrile ont été ajoutés à chaque bouchon de gel et ceux-ci ont été incubés à 37°C pendant une nuit. Les protéines digérées ont été dessalées et concentrées à l'aide d'un ZipTip Millipore C18 avant analyse MS et les peptides ont finalement été élués dans 8 µl d'acétonitrile aqueux à 50 % contenant 0,2 % d'acide formique. Tous les produits de digestion des protéines ont été analysés par un Q-TOF Global Ultima (Micromass Waters, Manchester, Royaume-Uni) avec une source nanoES. La tension capillaire était typiquement de 1,2-1,6 kV, la tension du cône était de 50-100 V et la tension était de 100 V. Les spectres de masse en spectroscopie de masse à temps de vol (TOF MS) et le mode MSMS étaient dans une plage de masse 50-1800 m/e avec une résolution de 8000 pleine largeur à mi-hauteur maximale (FWHM). L'argon a été utilisé comme gaz de collision.

Les volumes de taches normalisés des ruches d'abeilles et des gels 2D de butineuses matures ont été comparés par Student. t-test (logiciel d'analyse Statistix).

Activités enzymatiques

Les thorax de chaque étape de la vie (abeilles des ruches, jeunes butineuses, butineuses matures, moyenne des butineuses âgées ± masse du thorax semi= 27,8 ± 0,8 mg, 27,1 ± 0,5 mg, 26,5 ± 0,3 mg et 26,6 ± 0,6 mg, respectivement) ont été réduits en poudre à l'aide d'un liquide N2-mortier et pilon refroidis. Le poids du thorax ne différait pas selon les stades de la vie (ANOVA F3,39=1.0, P=0,41). Des thorax entiers ont ensuite été homogénéisés sur glace à l'aide d'un homogénéisateur verre sur verre pendant 1 min dans 20 volumes de tampon d'extraction constitués de 75 mmol l -1 de phosphate de potassium (pH 7,3) et 10 mg ml -1 de Lubrol® (Suarez et al.,1996 ). Toutes les enzymes ont été mesurées à 37°C dans un lecteur de microplaques à 96 puits Spectromax Plus 384 (Molecular Devices, Sunnyvale, CA, USA). Les dosages ont été effectués en triple et les taux de contrôle sans substrat ont été déterminés pour chaque dosage.

Activité enzymatique du cytochrome c l'oxydase (COx), la phosphofructokinase (PFK) et l'hexokinase (HK) ont été mesurées sur des homogénats de thorax frais. L'activité enzymatique de la pyruvate kinase (PK) et de la citrate synthase (CS) a été mesurée après avoir été congelée et décongelée une et deux fois, respectivement. Neuf à onze thorax ont été utilisés pour chaque étape de la vie. Les conditions de dosage étaient : COx : 50 mmol l -1 de phosphate de potassium (pH 7,5), 50 μmol l -1 de cytochrome c PFK : 10 mmol l -1 de fructose 6-phosphate (F6P) (omis dans le contrôle), 1 mmol l -1 ATP, 0,15 mmol l -1 NADH, 2 mmol l -1 AMP, 10 mmol l -1 MgCl2, 100 mmol l -1 KCl, 5 mmol l -1 DTT, 1 U aldolase, 5 U triose phosphate isomérase et 5 U α-glycérophosphate déshydrogénase dans 50 mmol l -1 imidazole (pH 7,4) HK : 5 mmol l -1 j -glucose (omis dans le contrôle), 4 mmol l -1 ATP, 10 mmol l -1 MgCl2, 100 mmol l -1 KCl, 0,5 mmol l -1 NADP, 5 mmol l -1 DTT, 1 U glucose-6-phosphate déshydrogénase, 50 mmol l -1 Hepes (pH 7,4) PK : 5 mmol l -1 phosphoénol pyruvate (PEP omise dans le contrôle), 50 mmol l -1 imidazole (pH 7,4), 5 mmol l -1 ADP, 2,5 mmol l -1 MgCl2, 0,15 mmol l -1 de NADH, 10 mmol l -1 de fructose 1,6-phosphate et 9,25 U de lactate déshydrogénase (LDH)CS : 0,5 mmol l -1 d'oxaloacétate (omis dans le contrôle), 0,09 mmol l -1 d'acétyl-CoA, et 0,1 mmol l -1 d'acide dithiobisnitrobenzoïque (DTNB) dans 20 mmol l -1 de Tris (pH 8,0).

Pour chaque enzyme, nous avons testé si l'activité enzymatique augmentait des abeilles des ruches aux jeunes butineuses, aux butineuses matures et aux vieilles butineuses en effectuant une analyse de contraste linéaire de variance (ANOVA linear contrast SPSS version 12.0, SPSS Inc.). Post-hoc l'analyse a été réalisée à l'aide du test de Dunn-Sidak.


Informations sur l'auteur

Affiliations

Faculté d'informatique, Technion, Haïfa, Israël

Shoval Lagziel & Tomer Shlomi

Faculté de biologie, Technion, Haïfa, Israël

Won Dong Lee et Tomer Shlomi

Centre Lokey pour les sciences de la vie et l'ingénierie, Technion, Haïfa, Israël

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Contributions

SL et TS ont conçu l'étude. SL a effectué l'analyse informatique. Tous les auteurs ont interprété les résultats et rédigé le manuscrit. Tous les auteurs ont lu et approuvé le manuscrit final.


Méthodes

Analyse d'expression

Les données prétraitées normalisées ont été obtenues à partir de GEO (GSE59097) [49]. Les sondes sur la plate-forme de puces à ADN GPL18893 ont été annotées à l'aide du BLAST autonome de NCBI corrigeant les étiquettes de gènes pour 647 sondes. Seuls les meilleurs résultats ont été utilisés spécifiquement, les résultats avec plus de 95 % d'identité, aucun écart et un score supérieur à 100 ont été utilisés (Fichier supplémentaire 3 : Tableau S8). Le package R limma a été utilisé pour comparer des échantillons sensibles et résistants à l'artémisinine collectés au Cambodge et au Vietnam [127]. Des échantillons contenant principalement des parasites au stade annulaire sans gamétocytes détectables ont été utilisés. Les parasites résistants étaient définis comme ayant à la fois au moins un allèle Kelch13 mutant et une demi-vie de clairance parasitaire supérieure à 5 h (Fig. 1) [49, 128]. Les parasites sensibles ont été définis par au moins l'absence d'allèles mutants Kelch13 et une demi-vie de clairance parasitaire inférieure à 5 h. Les classificateurs Random Forest ont été construits à l'aide du package R randomForest, en utilisant tous les échantillons de stade annulaire [129]. Le classificateur de métadonnées a utilisé les variables répertoriées dans le fichier supplémentaire 2 : Figure S2, comme indiqué dans l'étude originale [49]. Les transcriptomes des stades annulaires cambodgiens et vietnamiens ont été comparés séparément pour s'assurer que les modèles associés au statut de résistance étaient reproductibles dans toutes les phylogénies. Ces pays ont été choisis pour le grand nombre d'isolats et la prévalence de la résistance. Les sondes de puces à ADN ont été criblées pour éliminer les gènes non métaboliques et pour ne conserver qu'une seule sonde par gène (conformément à la pratique standard). La correction des tests multiples a été effectuée en utilisant un taux de fausses découvertes [130, 131].

Données d'expression génique avec calculs des changements de pli et ajustement associé p-value ont été incorporés dans notre modèle organisé à l'aide de l'algorithme d'ajustement métabolique pour l'expression différentielle (MADE). MADE utilise la signification statistique des modifications de l'expression des gènes ainsi que le contexte du réseau pour attribuer des états de gènes binaires (« on »/« arrêt ») à chaque gène métabolique. Cela contraint le réseau en limitant le flux à travers des réactions mappées sur des gènes « off » tout en maintenant la croissance, ou un objectif similaire. Un seuil de croissance de 80 % a été utilisé étant donné qu'il n'y a aucune preuve rapportée que les parasites résistants et sensibles produisent une biomasse variable telle que mesurée par la taille des parasites au stade annulaire tandis que la variation de ce seuil affecte le rendement de la biomasse des parasites sensibles, cela n'affecte pas les prédictions d'essentialité (données pas montré). Les gènes essentiels ont été prédits pour les modèles spécifiques à l'état résultants (Fig. 3) en effectuant des suppressions de gènes et de réactions uniques avec des algorithmes établis [132]. Des délétions consensuelles de gènes et de réactions létales des modèles de parasites cambodgiens et vietnamiens ont été utilisées.

Analyse de flux et tâches métaboliques

L'analyse du bilan de flux (FBA) est une approche pour explorer les phénotypes métaboliques in silico [133]. FBA simule des valeurs de flux en régime permanent pour chacune des réactions du réseau qui maximisent le flux ultérieur à travers une fonction objectif étant donné un ensemble de contraintes. Nous avons choisi la production de biomasse comme réaction objective, conformément aux études précédentes interrogeant l'essentialité des gènes [50, 53, 79, 134], et permis le flux à travers toutes les réactions de transport. Les contraintes sur le système incluent la conservation de la masse, la réversibilité des réactions et la localisation des réactions. L'analyse de variabilité de flux (FVA) utilise une approche connexe pour trouver la plage de flux admissibles compte tenu des contraintes du système [135].

Nous avons simulé des expériences in vitro et des données in vivo pour évaluer le modèle. Ce sont nos « tâches » métaboliques que la reconstruction doit réussir. Nous simulons les exigences de croissance in vitro en modifiant les composants du milieu ou l'accès à des métabolites particuliers. L'importation ou la production de métabolites a été éliminée de la reconstruction, et la production de biomasse subséquente a été observée. Les effets de l'inhibition enzymatique, des knock-outs de gènes et de la production de métabolites ont également été utilisés pour évaluer le modèle. Les modifications létales ont été définies comme des changements n'entraînant aucune production de biomasse, les modifications réduisant la croissance ont été définies comme produisant moins de 90 % de la valeur de flux sans contrainte [81, 134].

La COBRA Toolbox 2015, Tiger Toolbox (version 1.3.1) et MATLAB R2013b ont été utilisés pour la génération de modèles et les simulations de flux.

Curation

La curation manuelle d'un existant P. falciparum la reconstruction du réseau métabolique [50] a été menée par une revue de la littérature et une référence aux génériques et Plasmodium-bases de données spécifiques (KEGG, Expasy et PlasmoDB, MPMP) [43, 136,137,138]. Les données obtenues à partir de ces sources ont été utilisées pour évaluer l'inclusion des réactions ainsi que leur stoechiométrie, leur réversibilité, leur localisation et leurs annotations génétiques. Les réactions génétiquement et biochimiquement soutenues ont été conservées et de nouvelles réactions ont été ajoutées. Les réactions ont été supprimées si (1) explicitement déterminées comme fausses ou (2) étaient non fonctionnelles et non soutenues biochimiquement ou génétiquement. Les réactions spontanées (réactions qui se produisent sans enzymes) se différencient des réactions orphelines (réactions avec des catalyseurs enzymatiques inconnus).

Afin d'évaluer l'essentialité des gènes, nous avons utilisé une réaction de biomasse comme fonction objectif de modélisation. Ainsi, le flux à travers cette réaction, simulant la croissance cellulaire, a été maximisé pour toutes les procédures expérimentales in silico. Nous avons utilisé la réaction de biomasse d'une étude précédente [50] avec des modifications. La curation de la réaction de biomasse a été informée par les métabolites détectés dans les études de métabolomique [28, 56, 57, 58] si possible, les rapports de métabolites ont été prédits à partir des données de métabolomique. Nous avons organisé la réaction de la biomasse en tenant compte des données publiées sur l'essentialité, les métabolites détectés dans les expériences de métabolomique sans catabolisme ou voies d'importation connues ont été exclus de la réaction de la biomasse.

Études d'essentialité

Nous avons prédit l'essentialité en effectuant des études de délétion simple avec à la fois des gènes et des réactions et des études de délétion de gène double dans notre modèle organisé et chacun des modèles sensibles et résistants à expression limitée. Toutes les simulations ont été réalisées dans un environnement de globules rouges in silico (Fichier supplémentaire 3 : Tableau S9). Les suppressions de gènes ont été simulées en supprimant le gène d'intérêt du modèle. Ce changement entraîne l'inhibition du flux à travers toutes les réactions qui nécessitent que ce gène fonctionne. Si le modèle ne pouvait pas produire de biomasse avec ces contraintes, le gène était jugé essentiel. Des phénotypes réduisant la croissance ont également été observés et notés. Pour les études de suppression de réaction, nous avons supprimé les réactions de manière séquentielle. Les effets de croissance ultérieurs ont été utilisés pour déterminer essentiellement la réaction. Les résultats de consensus pour les modèles résistants ou sensibles sont discutés.


Voir la vidéo: Métabolisme énergétique (Décembre 2022).