Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Ayant recodé l'ensemble des protéines à l'aide de l'alphabet structural, plusieurs questions se posent quand à la pertinence et à la stabilité structurale du réseau : (1) Quelle est la part des parties non-répétitives dans le réseau ? (2) Est-ce que les fragments protéiques contenus au même site du réseau sont bien structuralement identiques ?
Pour répondre à la première question, l'ensemble des protéines a été suivi sur le graphe, comme pour l'exemple (cf. figure 5.3) et les taux des résidus appartenant au réseau a été calculé. Avec cette métrique (un minimum de 5 BPs consécutifs compris dans le réseau) et le réseau proposé, plus de 83 % des acides aminés des protéines est inclus dans le graphe, mais le point le plus intéressant n'est pas que les structures répétitives secondaires soient bien retrouvées (96,14 % pour les hélices et 89,11 % pour les feuillets) mais que 70,58 % des boucles soient aussi présentes.
Le premier point ayant été validé,
il faut se pencher sur le second car, en effet,
l'alphabet structural a été construit pour approximer localement la structure
tridimensionnelle sur 5 C et le réseau utilise des successions chevauchantes
de 5 BPs (soit 9 C
), il convient donc de vérifier
que ces approximations locales n'ont pas généré des fragments protéiques trop distincts.
(c) 2001- Alexandre de Brevern