Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
L'utilisation des structures secondaires permet de catégoriser les protéines en différentes familles,
tout-
, tout-
,
/
,
+
, non classifiable [127].
Elle a permis ainsi de créer de véritables arbres reliant des sous-familles structurales, donnant lieu
à des classifications parfois totalement supervisées comme pour SCOP [132]
ou automatisées en grande partie comme CATH [136] ou FSSP [86].
L'intérêt de ces approches n'est pas une simple classification mais permet aussi
de trouver de nouveaux liens entre structure, séquence et fonctions [131,87,89,73,139,140,123],
et ainsi d'estimer la variété de repliements qui existent dans les protéines [138].
Des études plus théoriques basées sur des méthodes statistiques montrent qu'un certain pourcentage de repliements (70 %) possède une spécificité séquentielle suffisante pour impliquer un repliement local particulier [177]. Le reste est trop peu déterminé et ne pourrait donc pas servir dans le cas d'une prédiction de la structure 3D protéique à partir de la séquence.
Le nombre global de repliements est estimé à un peu plus de 2000 [69]. Toutefois, seuls 900 seraient vraiment différents. Plus récemment, les mêmes auteurs augmentent leurs chiffres à 4000 repliements. 375 de ces repliements représenteraient 70 % des repliements existants dans les protéines, les plus courants, il en faudrait au final 930 pour en représenter 90% [70].
Page 10
(c) 2001- Alexandre de Brevern