Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Comparaison entre les cartes Au-dessus: Application à l'étude des Précédent: Correspondance entre la protéine

Conclusion

La répartition des Blocs Protéiques montre ainsi une forme de regroupement que l'on pourrait simplement comparé à l'alphabet structural classique à 3 états (hélices, feuillets et boucles). Un simple comptage des 3 types de structures donne une information évidemment corrélée à celle obtenue dans l'hybride. Toutefois, cette information ne tient aucun compte de l'aspect séquentiel. La correspondance avec l'alphabet structural à 16 états permet au niveau de la structure d'avoir une information bien plus précise. On peut ainsi voir la spécificité de l'entrée dans l'hélice $\alpha$ (autour de la position 3 principalement) sur le plan de la composition en acides aminés, de même en sortie d'hélice (positions 8-11). L'hybride permet de tenir compte de l'hétérogénéité de longueur inhérente aux structures répétitives. De plus l'utilisation des structures secondaires se heurte à l'établissement toujours arbitraire de règle d'attribution à l'une des 3 classes [31,33]. Avec les feuillets $\beta$, l'exemple est encore plus frappant, l'apprentissage ayant permis d'obtenir deux types distincts de feuillets (positions 14-17 et positions 19-23), de longueurs et surtout de compositions fort distinctes.

La protéine hybride permet, en apprenant structure et séquence de concert, d'avoir une compression de ces données en un nombre fini d'états, où les deux types d'information sont combinés. L'utilisation des 16 BPs, outil intéressant pour analyser les structures, permet de distinguer de facon fine les divers états de la structure. En conclusion, la correspondance entre la succession des fragments de 5 résidus dans la protéine hybride et les différents types de Blocs Protéiques d’'autre part a permis de mettre en relief le concept de relation séquence-structure "floue". C’'est à dire qu’'une chaîne d’'acides aminés est associée à une distribution de patterns structuraux (i.e. les BPs) et inversement. Cela implique que sur le plan d'’une prédiction de la séquence vers la structure, certains blocs protéiques doivent être considérés comme équivalents.

Un tel concept devrait être pris en compte dans la construction de modèles structuraux protéiques que ce soit par une stratégie d’'enfilage (threading) ou une modèlisation ab initio. Cette méthode peut aussi de servir de validation lors de l'élaboration de modèles structuraux complets, à la manière de ProCheck avec la carte de Ramachandran. La figure 6.15 de gauche pourrait aussi servir à l'analyse des relations entre séquence et structure à l'intérieur de familles de protéines. Toutefois, des améliorations restent à effectuer, comme par exemple, changer d'échelles pour décrire les acides aminés.




Page 142

(c) 2001- Alexandre de Brevern