Blocs Protéiques

Alexandre de Brevern - Thèse de Bioinformatique Moléculaire

Prochain: Prédictions de la structure Au-dessus: Les différents niveaux de Précédent: Les boucles et les

Le nombre de repliements

L'utilisation des structures secondaires permet de catégoriser les protéines en différentes familles, tout- $\alpha$ , tout- $\beta$ , $\alpha$ / $\beta$ , $\alpha$ + $\beta$ , non classifiable [127]. Elle a permis ainsi de créer de véritables arbres reliant des sous-familles structurales, donnant lieu à des classifications parfois totalement supervisées comme pour SCOP [132] ou automatisées en grande partie comme CATH [136] ou FSSP [86]. L'intérêt de ces approches n'est pas une simple classification mais permet aussi de trouver de nouveaux liens entre structure, séquence et fonctions [131,87,89,73,139,140,123], et ainsi d'estimer la variété de repliements qui existent dans les protéines [138].

Des études plus théoriques basées sur des méthodes statistiques montrent qu'un certain pourcentage de repliements (70 %) possède une spécificité séquentielle suffisante pour impliquer un repliement local particulier [177]. Le reste est trop peu déterminé et ne pourrait donc pas servir dans le cas d'une prédiction de la structure 3D protéique à partir de la séquence.

Le nombre global de repliements est estimé à un peu plus de 2000 [69]. Toutefois, seuls 900 seraient vraiment différents. Plus récemment, les mêmes auteurs augmentent leurs chiffres à 4000 repliements. 375 de ces repliements représenteraient 70 % des repliements existants dans les protéines, les plus courants, il en faudrait au final 930 pour en représenter 90% [70].

Prochain: Prédictions de la structure Au-dessus: Les différents niveaux de Précédent: Les boucles et les

Page 10