| |
Comme les boucles protéiques sont très variables en termes de structure et de séquence elles sont souvent considérées comme des régions irrègulières.
Au cours de ma thèse, j'ai développé une méthode statistique permettant d'analyser systématiquement des motifs structuraux récurrents extraits des boucles.
Cette méthode utilise l'alphabet structural HMM-SA.
HMM-SA est une description de la structure locale des protéines à l'aide de 27 prototypes de 4 résidus, appelés lettres structurales.
A partir d'un jeu de structures des boucles simplifiées dans l'espace de HMM-SA, les motifs de 4 lettres structurales, correspondant à des fragments de 7 résidus, ont éte extraits.
95% de ces fragments correspondent à des motifs structuraux vus au moins deux fois dans la banque de boucles.
Nous avons montré que la majorité de ces motifs structuraux présentent une stabilité structurale et des préférences en acides aminés.
Nous avons ensuite analysé le lien entre ces motifs et la fonction des protéines.
Pour cela, nous avons recherché les motifs structuraux sur-représentés dans des échantillons de boucles extraites de protéines ayant une origine évolutive commune, c'est-à-dire appartenant à la même superfamille de la classification des protéines SCOP.
Cette approche a permis de différencier deux types de motifs structuraux : les motifs ubiquitaires qui semblent avoir un rôle structural et les candidats fonctionnels, qui semblent être impliqués dans la fonction des protéines.
Cette hypothèse a été confirmée par le fait que certains candidats fonctionnels correspondent à des sites biologiques annotés dans la banque de données Swiss-Prot.
| |