Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Jean et al. avaient trouvé 15 CSBs notés de 1 à 13.
Les CSB 2A-2B et 12A-12B étaient clairement liés mais n'avaient
pas pu être déterminés automatiquement par leur méthode.
Avec notre approche, 11 des 15 CSBs ont été retrouvés.
Les CSBs 6, 11 et 13 n'ont pas été détectés du fait de leur faible taille (12, 8 et 9 résidus).
Utilisant des séries de 10 blocs protéiques de longueur 5 C, soit
14 C
au total, ce type de fragments est considéré comme trop petit.
Le CSB 8 est plus long avec ses 17 résidus, mais n'a pas été détecté non plus. Ce dernier point est discuté
plus bas.
Les structures locales I, IV, V, VI,VII et IX
ont la même longueur que leurs CSBs correspondants.
Quelques structures locales ont des différences notables en comparaison des précédents travaux. Ce sont les fragments II, IV, V, VI and VII par rapport au travail de Haseman et collaborateurs et les fragments II, VII, X et XI par rapport au travail de Jean et collaborateurs. Le taux de d'identité des blocs protéiques (cf. tableau 6.2, cinquième colonne) donne une idée de la proximité entre les structures locales. Ils dépassent globalement 73 %, sauf pour la structure locale II avec un taux de 58,3 %.
structure locale II : La structure locale II n'est pas retrouvée dans les CSBs et possède un RMSd important. Toutefois, ce type de structure locale est pratiquement équivalente entre les deux cytochromes, surtout dans la partie N-terminale. Un seul motif caractéristique est retrouvé dans ce fragment, une hélice 310 helix, notée b, trouvée exclusivement dans le cytochrome P450terp [80].
structure locale IV : La structure locale IV est composée d'hélices et 310,
toutefois, la classification en structures secondaires note que l'hélice
C' n'existe pas
dans le cytochrome P450BM3 et les deux hélices 310 b and c
sont disposées à des positions distinctes.
Cette différence de classification n'empêche pas un RMSd faible de 0,7 Å.
structure locale V : La structure locale commune V a un RMSd de 1.8
Å entre les cytochromes 450terp et P450BM3.
Cette valeur plus importante est due à l'absence d'une hélice , notée E', dans le cytochrome P450BM3.
Cette zone se retrouve incluse dans une hélice
, notée E.
La différence est ponctuelle, mais fait augmenter le RMSd.
Toutefois, il faut noter que ces structures locales possèdent le même type de repliement.
structure locale VI : Elle possède une hélice 310, notée c, qui se trouve incluse pour le cytochrome P450BM3 dans le fragment IV.
structure locale VII : Elle correspond, comme la structure locale VI, au CSB 4. Toutefois sa localisation est distincte au niveau du cytochrome P450BM3. Le RMSd est de 3,6 Å contre 1.1 Å précédemment. Les raisons de cette différence s'explique par le taux plus faible d'identité des blocs protéiques (75,0% contre 88,8% pour le fragment VI). Le CSB est composé principalement d'une hélice, notée F [80], qui présente des longueurs fort différentes selon les cytochromes, et surtout, c'est le seul CSB à avoir été sélectionné manuellement par Jean et collaborateurs.
structure locale X : La structure locale X inclus le CSB 10 et la fin du CSB 9.
structure locale XI : La structure locale XI inclus les CSBs 12A (une poche cysteique [80]) et
12B (une hélice notée L [80]) qui avaient été décrits séparément, mais
sont vraiment liés comme le montre le RMSd de 0,7 Å.
Ces résultats démontrent bien l'intérêt de la protéine hybride dans l'extraction de structures locales stucturellement similaires entre deux protéines. Un simple dotplot n'utilisant que les blocs protéiques ne permet pas une extraction aussi simple et rapide, du fait de la répétitivité des structures secondaires. Le bon résultat obtenu est dû au principe de l'apprentissage de la protéine hybride qui apprend des fragments protéiques et regroupent les fragments similaires au même site.
Un point à noter est que les 11 paires de structures locales
n'ont jamais un taux d'identité de blocs protéiques de 100 %, mais varient entre 73,3 % et 95,0 %
avec l'exception de la paire II avec 58.3%.
Le taux d'identité de séquence en acide aminés
est faible comme attendu (inférieur à 30%).
Les différences majeures entre les différentes méthodes
concernent les zones les plus variables comme la
structure locale II.
Les divergences avec la classification des structures secondaires
viennent du fait que cette classification place des petites structures un peu
partout, sans tenir compte de la modularité des cytochromes.
Par exemple, l'hélice 310 c notée en position [173-176]
pour le cytochrome P450terp est en position [109-114] pour le P450BM3.
De la même manière la structure locale V est composée
d'un court feuillet , une hélice
et d'une
hélice
de 12 résidus pour le cytochrome P450BM3.
Pour le cytochrome P450terp, le même feuillet
est présent,
mais l'hélice
est alors incluse dans une hélice
de 12 résidus.
Le CSB 8 n'a pas été trouvé alors qu'il est d'une taille conséquente et
possède un RMSd correct de 1,2 Å.
Cet oubli vient de la métrique du filtrage du dotplot qui est en tout ou rien.
3 sites du CSB 8 sur la protéine hybride sont différents entre
le cytochrome P450terp et P450BM3 et donc n'ont pas été pris en compte.
Une amélioration du filtrage serait nécessaire.
(c) 2001- Alexandre de Brevern