Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Les fragments protéiques Au-dessus: Méthode d'apprentissage Précédent: Base de données

Description des protéines

Nous avons choisi d'utiliser comme descripteur de la structure des protéines les angles dièdres $\phi $ et $\psi $. (cf. figure 3.1). La définition des angles dièdres est donnée au paragraphe 2.1.2.


  
Figure 3.1: Schéma représentant le calcul des angles $\phi $ et $\psi $ à partir de la structure tridimensionnelle.
\begin{figure}
\centerline{\epsfxsize=15cm
{\epsfbox{Images/Chapitre_3_PBs/phi_psi.eps}}}
\end{figure}

L'angle $\omega$ n'a pas été pris en compte, car il reste particulièrement constant autour de 180o. Sur la PDB de juillet 2000, moins de 0,5 % des résidus étaient en dehors de l'intervalle classique [180o-10o;180o+10o]. En outre, l'angle $\omega$ suit directement les variations des angles $\phi $ et $\psi $ [125]. Selon la zone de Ramachandran [$\phi $,$\psi $], l'angle $\omega$ est statistiquement plus présent dans certaines zones. Leur utilisation aurait tendance à surestimer ce paramètre, 99,5 % ne jouant alors aucun rôle, les 0,5 % restant deviendraient trop important au regard de leur faible nombre.

La conformation des protéines a donc été décrite via leurs angles $\phi $ et $\psi $. Une protéine de longueur L est ainsi traduite en un vecteur de longueur 2 x (L-2) (le premier $\phi $ et le dernier $\psi $ ne pouvant pas être calculés). L'intérêt d'utiliser des valeurs réelles des angles permet de ne pas avoir d'a priori particulier envers certaines zones préférentielles du diagramme de Ramachandran comme les zones répétitives et ainsi d'obtenir des blocs pertinents particulièrement au niveau des boucles.




Page 42

(c) 2001- Alexandre de Brevern