Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Conclusion Au-dessus: Application à la recherche Précédent: Homologie structurale pour deux

Analyse des résultats

Jean et al. avaient trouvé 15 CSBs notés de 1 à 13. Les CSB 2A-2B et 12A-12B étaient clairement liés mais n'avaient pas pu être déterminés automatiquement par leur méthode. Avec notre approche, 11 des 15 CSBs ont été retrouvés. Les CSBs 6, 11 et 13 n'ont pas été détectés du fait de leur faible taille (12, 8 et 9 résidus). Utilisant des séries de 10 blocs protéiques de longueur 5 C$_{\alpha }$, soit 14 C$_{\alpha }$ au total, ce type de fragments est considéré comme trop petit. Le CSB 8 est plus long avec ses 17 résidus, mais n'a pas été détecté non plus. Ce dernier point est discuté plus bas. Les structures locales I, IV, V, VI,VII et IX ont la même longueur que leurs CSBs correspondants.

Quelques structures locales ont des différences notables en comparaison des précédents travaux. Ce sont les fragments II, IV, V, VI and VII par rapport au travail de Haseman et collaborateurs et les fragments II, VII, X et XI par rapport au travail de Jean et collaborateurs. Le taux de d'identité des blocs protéiques (cf. tableau 6.2, cinquième colonne) donne une idée de la proximité entre les structures locales. Ils dépassent globalement 73 %, sauf pour la structure locale II avec un taux de 58,3 %.

structure locale II : La structure locale II n'est pas retrouvée dans les CSBs et possède un RMSd important. Toutefois, ce type de structure locale est pratiquement équivalente entre les deux cytochromes, surtout dans la partie N-terminale. Un seul motif caractéristique est retrouvé dans ce fragment, une hélice 310 helix, notée b, trouvée exclusivement dans le cytochrome P450terp [80].

structure locale IV : La structure locale IV est composée d'hélices $\alpha$ et 310, toutefois, la classification en structures secondaires note que l'hélice $\alpha$ C' n'existe pas dans le cytochrome P450BM3 et les deux hélices 310 b and c sont disposées à des positions distinctes. Cette différence de classification n'empêche pas un RMSd faible de 0,7 Å.

structure locale V : La structure locale commune V a un RMSd de 1.8 Å entre les cytochromes 450terp et P450BM3. Cette valeur plus importante est due à l'absence d'une hélice $\pi$, notée E', dans le cytochrome P450BM3. Cette zone se retrouve incluse dans une hélice $\alpha$, notée E. La différence est ponctuelle, mais fait augmenter le RMSd. Toutefois, il faut noter que ces structures locales possèdent le même type de repliement.

structure locale VI : Elle possède une hélice 310, notée c, qui se trouve incluse pour le cytochrome P450BM3 dans le fragment IV.

structure locale VII : Elle correspond, comme la structure locale VI, au CSB 4. Toutefois sa localisation est distincte au niveau du cytochrome P450BM3. Le RMSd est de 3,6 Å contre 1.1 Å précédemment. Les raisons de cette différence s'explique par le taux plus faible d'identité des blocs protéiques (75,0% contre 88,8% pour le fragment VI). Le CSB est composé principalement d'une hélice, notée F [80], qui présente des longueurs fort différentes selon les cytochromes, et surtout, c'est le seul CSB à avoir été sélectionné manuellement par Jean et collaborateurs.

structure locale X : La structure locale X inclus le CSB 10 et la fin du CSB 9.

structure locale XI : La structure locale XI inclus les CSBs 12A (une poche cysteique [80]) et 12B (une hélice $\alpha$ notée L [80]) qui avaient été décrits séparément, mais sont vraiment liés comme le montre le RMSd de 0,7 Å.

Ces résultats démontrent bien l'intérêt de la protéine hybride dans l'extraction de structures locales stucturellement similaires entre deux protéines. Un simple dotplot n'utilisant que les blocs protéiques ne permet pas une extraction aussi simple et rapide, du fait de la répétitivité des structures secondaires. Le bon résultat obtenu est dû au principe de l'apprentissage de la protéine hybride qui apprend des fragments protéiques et regroupent les fragments similaires au même site.

Un point à noter est que les 11 paires de structures locales n'ont jamais un taux d'identité de blocs protéiques de 100 %, mais varient entre 73,3 % et 95,0 % avec l'exception de la paire II avec 58.3%. Le taux d'identité de séquence en acide aminés est faible comme attendu (inférieur à 30%). Les différences majeures entre les différentes méthodes concernent les zones les plus variables comme la structure locale II. Les divergences avec la classification des structures secondaires viennent du fait que cette classification place des petites structures un peu partout, sans tenir compte de la modularité des cytochromes. Par exemple, l'hélice 310 c notée en position [173-176] pour le cytochrome P450terp est en position [109-114] pour le P450BM3. De la même manière la structure locale V est composée d'un court feuillet $\beta$, une hélice $\pi$ et d'une hélice $\alpha$ de 12 résidus pour le cytochrome P450BM3. Pour le cytochrome P450terp, le même feuillet $\beta$ est présent, mais l'hélice $\pi$ est alors incluse dans une hélice $\alpha$ de 12 résidus. Le CSB 8 n'a pas été trouvé alors qu'il est d'une taille conséquente et possède un RMSd correct de 1,2 Å. Cet oubli vient de la métrique du filtrage du dotplot qui est en tout ou rien. 3 sites du CSB 8 sur la protéine hybride sont différents entre le cytochrome P450terp et P450BM3 et donc n'ont pas été pris en compte. Une amélioration du filtrage serait nécessaire.




Page 133

(c) 2001- Alexandre de Brevern