Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Conception du graphe Au-dessus: Dépendance entre les blocs Précédent: Dépendance entre les blocs

   
Objectif

Après avoir développé une méthode d'apprentissage de blocs protéiques (cf. paragraphe 3, "Apprentissage de la structure locale du squelette protéique"), nous avons utilisé ces blocs dans une méthode bayésienne de prédiction locale de ces blocs à partir de la séquence (cf. paragraphe 4, "Prédiction de la structure locale en blocs protéiques"). Conserver seize PBs au final, permet d'obtenir des BPs purement boucles ainsi que plusieurs types d'extrémités N- et C-terminales des structures périodiques.

Toutefois, cette approche comme beaucoup d'autres approches locales ne ne prend pas implicitement en compte le problème de la continuité implicite de la structure protéique. Ce problème a été déjà soulevé avec la prédiction des structures secondaires [210]. Le réseau neuronal PHD [166] le résout en traitant les résultats de sa prédiction par un second réseau. Actuellement, seules les Chaînes de Markov Cachées [149] utilise directement cette information, comme HMMSTR, pour les structures secondaires, développé par le groupe de Baker [20] et pour les alphabets structuraux par Camproux et collaborateurs [23,24].

Pour prendre en compte cette continuité, nous avons décidé d'analyser les séries de BPs ayant les occurrences les plus fréquentes, par une approche qui présente certaine similitude avec le travail de Fetrow et collaborateurs [53]. Les séries de blocs ont été établies en tenant en compte des transitions préférentielles. Ces successions de blocs les plus fréquentes se suivent de manière particulièrement régulière. Les chevauchements sont nombreux. Nous proposons donc de construire un réseau simple formé par la succession de ces mots. Ce travail est à rapprocher d'autres descriptions des structures par des graphes pour trouver des fragments protéique structuralement proches [170], des groupes de chaînes latérales [101], des domaines protéiques [201], mais surtout des "topologies proches" dans les protéines, en d'autres termes des fragments protéiques de tailles variables ayant des repliements locaux similaires [106,191], nous regarderons ensuite si la construction d'un tel réseau permet une bonne conservation structurale des fragments protéiques et enfin si la présence de certains acides aminés est dépendante des voies différentes du réseau. Cette approche est intéressante car au lieu de se focaliser sur des zones de longueur constante entre des structures secondaires [203,204], des zones plus ou moins étendues seront obtenues. Ainsi, les séries de blocs permettent d'observer et d'analyser de manière fine la structure 3D sans avoir les limites liées au choix de longueur fixe.


Prochain up previous
Prochain: Conception du graphe Au-dessus: Dépendance entre les blocs Précédent: Dépendance entre les blocs

Page 94

(c) 2001- Alexandre de Brevern