Vers une conception de nouvelles protéines par apprentissage statistique

Biologie

Une équipe de recherche de l'Institut de biologie Paris-Seine (Sorbonne Université / CNRS), en collaboration avec l'École normale supérieure - PSL et l’École polytechnique de Turin a proposé une nouvelle approche très efficace de modélisation informatique de protéines dite "générative". Publiée dans la revue Nature Communications le 4 octobre 2021, cette approche permet de concevoir des séquences protéiques artificielles statistiquement équivalentes aux séquences naturelles, une caractéristique de grand intérêt dans le domaine du « protein design ». Cette publication  est la première à bénéficier du soutien financier de l'initiative i-Bio de l’Alliance Sorbonne Université pour la promotion de l'interdisciplinarité dans la recherche biologique.

 

 

Sont impliqués dans ces travaux le Laboratoire biologie computationnelle et quantitative (LCQB, CNRS/Sorbonne Université) à l'IBPS et le Laboratoire de physique de l'ENS (LPENS, CNRS/ENS Paris/Sorbonne Université/Université de Paris).

Bibliographie

Efficient generative modeling of protein sequencesusing simple autoregressive models
Jeanne Trinquier, Guido Uguzzoni, Andrea Pagnani, Francesco Zamponi & Martin Weigt, 
Nature Communications, 4 octobre 2021 - DOI : https://doi.org/10.1038/s41467-021-25756-4

Contact

Martin Weigt
Chercheur Sorbonne Université
Claire de Thoisy Méchin
Responsable service de presse à Sorbonne Université
CNRS - Bureau de presse
Marion Valzy
Attachée de presse à Sorbonne Université