Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Conclusion Au-dessus: Comparaison avec les autres Précédent: Comparaison avec les super-structures

Comparaison avec les blocs structuraux de Camproux et collaborateurs

Les deux précédents exemples montrent bien l'intérêt d'un alphabet plus complet avec un nombre d'états supérieurs à une dizaine. La comparaison avec l'alphabet à 12 états mis au point par Anne-Claude Camproux qui a utilisée la méthode des Chaînes de Markov Cachées est donc particulièrement intéressant. L'analyse est en deux parties. La première étant simplement la recherche de l'équivalence entre le bloc protéique et le bloc structural. La seconde tient compte du fait que les blocs structuraux (SSBs) font 4 C$_{\alpha }$, et donc un bloc protéique est représenté par une série de deux blocs structuraux.


 
Tableau 3.8: Correspondance entre les 12 blocs protéiques (SBBs) définis par des chaînes de Markov cachées par Camproux et collaborateurs [23] (centré sur le troisième C$_{\alpha }$) et les 16 blocs protéiques (centrés sur le troisième C$_{\alpha }$). Les fréquences données sont relatives à chacun des 16 blocs.
  SBBs $\alpha_1$ $\alpha_2$ $\alpha'$ $\alpha'_{+}$ $\alpha'_{-}$ $\gamma_{\alpha\beta}$ $\gamma_{\beta\alpha}$ $\gamma_1$ $\gamma_2$ $\gamma_{\beta}$ $\beta_2$ $\beta_1$
PBs                          
a     0,2   2,1 0,2 11,4 0,4 3,5 0,6 3,9 0,6 77,0
b     6,2 2,3 47,6 0,4 8,8 26,1 4,9   0,8 1,5 1,5
c     0 0,5 2,6 0,2 1,7 2,2 0,7 21,9 9,4 29,1 31,7
d     0,1   1,3 0,1 0,3 1,1 0,9 16,4 9,3 55,8 14,7
e     0   7,7   0,4 3,5 2,1 18,3 15,5 45,1 7,4
f     0 0,1 4,3   0,6 5,6 1,2 36,8 8,4 27,6 15,3
g     10,7 19,7 4,1 1,6 8,2 3,3 1,6 2,5 1,6 5,7 41,0
h     0,7   6,8 3,9 0,7 2,5 11,1 22,9 23,3 17,6 10,4
i       0,9   18,9 0,5 0,9 76,5   0,9   1,4
j           2,8     10,4 2,8 54,7 0,9 28,3
k     0,2   31,1 0,3 2,3 55,0 9,8 0,2 0,2 0,5 0,6
l   10,7 64,1 0,8 1,8 0,9 9,2   5,4   0   7,2
m   65,1 18,4 6,6 1,1 0,1 4,4 0,4 0,9   0 0,1 2,9
n   35,3 27,5 14,9 3 1,5 7,1 2,2 4,1 0,4 0,4   3,7
o   24,8 31,9 20,5 1,4 2,8 5,7 0,9 6 0,3     5,7
p     15,9 7,6 2,2 55,4 4 0,4 4,3 0,7 0,2 0,7 8,5

                         
 

Les répartitions des blocs sont nettement plus déterministes qu'auparavant. Par exemple, le bloc structural $\alpha_1$ ne correspond qu'aux blocs associés aux hélices (PBs l à o). Plus de 80% du BP m se retrouve en $\alpha_1$ et en $\alpha_2$, et inversement, le BP d ne leur est jamais associé. Toutefois, pour les blocs correspondant de part et d'autres aux boucles, les situations sont nettement plus diverses. Le bloc structural $\gamma_1$ est principalement lié aux PBs h à k, alors que le bloc structural $\gamma_{\alpha\beta}$ est réparti dans un nombre nettement plus grand de blocs protéiques. De même, les blocs associés aux feuillets sont particulièrement contrastés. Ainsi, le PB a est lié principalement au bloc structural $\beta_1$, mais le bloc structural $\beta_1$est lui présent dans de nombreux PBs distincts (PBs a, c, d, fet j).

Les blocs protéiques associés aux hélices $\alpha$ sont les blocs les plus directement reliables aux blocs structuraux avec un nombre limité de successions préférentielles et surtout quelques unes fort importantes. Le PB m est totalement compris dans les blocs structuraux $\alpha_1$ et $\alpha_2$.

Cette étude montre qu'il y a une convergence certaine entre ces deux approches malgrè des informations et la méthode différentes, les alphabets obtenus possèdent une grande spécificité. Leur utilisation conjointe serait d'un grand intérêt.




Page 73

(c) 2001- Alexandre de Brevern