Une nouvelle technique révèle de nombreuses conformations possibles qu’une protéine peut prendre – Technoguide

La microscopie cryoélectronique (cryo-EM) permet aux scientifiques de produire des images tridimensionnelles à haute résolution de minuscules molécules telles que des protéines. Cette technique fonctionne mieux pour imager des protéines qui n’existent que dans une seule conformation, mais les chercheurs du MIT ont maintenant développé un algorithme d’apprentissage automatique qui les aide à identifier plusieurs structures possibles qu’une protéine peut prendre.

Contrairement aux techniques d’IA qui visent à prédire la structure des protéines à partir des seules données de séquence, la structure des protéines peut également être déterminée expérimentalement à l’aide de cryo-EM, qui produit des centaines de milliers, voire des millions d’images bidimensionnelles d’échantillons de protéines congelés dans une fine couche de la glace. Des algorithmes informatiques reconstituent ensuite ces images, prises sous différents angles, en une représentation tridimensionnelle de la protéine dans un processus appelé reconstruction.

Dans un article de Nature Methods, les chercheurs du MIT rapportent un nouveau logiciel basé sur l’IA pour reconstruire plusieurs structures et mouvements de la protéine imagée – un objectif majeur de la communauté scientifique des protéines. Au lieu d’utiliser la représentation traditionnelle de la structure des protéines en tant qu’intensités de diffusion d’électrons sur un réseau 3D, ce qui n’est pas pratique pour modéliser plusieurs structures, les chercheurs ont introduit une nouvelle architecture de réseau neuronal qui peut générer efficacement l’ensemble complet des structures dans un seul modèle.

«Grâce au large pouvoir de représentation des réseaux de neurones, nous pouvons extraire des informations structurelles d’images bruyantes et visualiser les mouvements détaillés des machines macromoléculaires», explique Ellen Zhong, étudiante diplômée du MIT et auteur principal de l’article.

Avec leur logiciel, ils ont découvert les mouvements de protéines à partir d’ensembles de données d’imagerie où une seule structure 3D statique était à l’origine identifiée. Ils ont également visualisé des mouvements flexibles à grande échelle du spliceosome – un complexe protéique qui coordonne l’épissage des séquences codant pour les protéines de l’ARN transcrit.

«Notre idée était d’essayer d’utiliser des techniques d’apprentissage automatique pour mieux capturer l’hétérogénéité structurelle sous-jacente et pour nous permettre d’inspecter la variété des états structurels présents dans un échantillon», déclare Joseph Davis, professeur assistant en développement de carrière à Whitehead. Département de biologie du MIT.

Davis et Bonnie Berger, professeur Simons de mathématiques au MIT et chef du groupe Calcul et biologie au Laboratoire d’informatique et d’intelligence artificielle, sont les principaux auteurs de l’étude, qui apparaît aujourd’hui dans Nature Methods. Tristan Bepler, post-doctorant au MIT, est également l’auteur de l’article.

Visualiser un processus en plusieurs étapes

Les chercheurs ont démontré l’utilité de leur nouvelle approche en analysant les structures qui se forment lors du processus d’assemblage des ribosomes – les organites cellulaires responsables de la lecture de l’ARN messager et de sa traduction en protéines. Davis a commencé à étudier la structure des ribosomes alors qu’il était post-doctorant au Scripps Research Institute. Les ribosomes ont deux sous-unités principales, dont chacune contient de nombreuses protéines individuelles qui sont assemblées dans un processus en plusieurs étapes.

Pour étudier les étapes de l’assemblage des ribosomes en détail, Davis a bloqué le processus à différents points, puis a pris des images au microscope électronique des structures résultantes. À certains moments, le blocage de l’assemblage a entraîné l’accumulation d’une seule structure, ce qui suggère qu’il n’y a qu’une seule façon pour cette étape de se produire. Cependant, le blocage d’autres points a abouti à de nombreuses structures différentes, ce qui suggère que l’assemblage peut se produire de différentes manières.

Parce que certaines de ces expériences ont généré tant de structures protéiques différentes, les outils de reconstruction cryo-EM traditionnels n’ont pas bien fonctionné pour déterminer quelles étaient ces structures.

«En général, c’est un problème extrêmement difficile d’essayer de déterminer combien d’états vous avez lorsque vous avez un mélange de particules», dit Davis.

Après avoir commencé son laboratoire au MIT en 2017, il s’est associé à Berger pour utiliser l’apprentissage automatique pour développer un modèle qui peut utiliser les images bidimensionnelles produites par cryo-EM pour générer toutes les structures tridimensionnelles trouvées dans l’échantillon original.

Dans la nouvelle étude Nature Methods, les chercheurs ont démontré la puissance de la technique en l’utilisant pour identifier un nouvel état ribosomal qui n’avait jamais été vu auparavant. Des études antérieures avaient suggéré que lorsqu’un ribosome est assemblé, de grands éléments structurels, qui s’apparentent à la fondation d’un bâtiment, se forment en premier. Ce n’est qu’après la formation de cette fondation que les “sites actifs” du ribosome, qui lisent l’ARN messager et synthétisent les protéines, sont ajoutés à la structure.

Dans la nouvelle étude, cependant, les chercheurs ont constaté que dans un très petit sous-ensemble de ribosomes, environ 1%, une structure qui est normalement ajoutée à la fin apparaît en fait avant l’assemblage de la fondation. Pour expliquer cela, Davis émet l’hypothèse qu’il pourrait être trop coûteux en énergie pour les cellules de s’assurer que chaque ribosome est assemblé dans le bon ordre.

«Les cellules ont probablement évolué pour trouver un équilibre entre ce qu’elles peuvent tolérer, qui est peut-être un petit pourcentage de ces types de structures potentiellement délétères, et ce qu’il en coûterait pour les supprimer complètement du processus d’assemblage», dit-il.

Protéines virales

Les chercheurs utilisent maintenant cette technique pour étudier la protéine de pointe du coronavirus, qui est la protéine virale qui se lie aux récepteurs des cellules humaines et leur permet d’entrer dans les cellules. Le domaine de liaison au récepteur (RBD) de la protéine de pointe a trois sous-unités, chacune pouvant pointer vers le haut ou vers le bas.

“Pour moi, regarder la pandémie se dérouler au cours de l’année écoulée a mis en évidence l’importance des médicaments antiviraux de première ligne dans la lutte contre des virus similaires, qui sont susceptibles d’émerger à l’avenir. Alors que nous commençons à réfléchir à la manière dont on pourrait développer des composés à petites molécules pour forcer tous les RBD à l’état «bas» afin qu’ils ne puissent pas interagir avec les cellules humaines, comprendre exactement à quoi ressemble l’état «haut» et combien de flexibilité conformationnelle il y a sera informatif pour la conception de médicaments. Nous espérons que notre une nouvelle technique peut révéler ce genre de détails structurels », dit Davis.

La recherche a été financée par le programme de bourses de recherche pour diplômés de la National Science Foundation, les National Institutes of Health et la clinique MIT Jameel pour l’apprentissage automatique et la santé. Ce travail a été soutenu par le cluster de calcul MIT Satori hébergé au MGHPCC.

.

Lire plus

A propos Technoguide

Voir aussi

Un “ poison miracle ” pour de nouvelles thérapies – Technoguide

Lorsque les gens entendent la toxine botulique, ils pensent souvent à l’une des deux choses …

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Défiler vers le haut