Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Rooman et collaborateurs ont décrit 4 types de blocs avec 4 longueurs
différentes,
ici nous n'analyserons que les résultats obtenus pour les blocs de
longueurs 5 C et 6 C
.
En quelques mots,
la famille
(
) est proche des blocs
PBs k à m . La plupart des blocs protéiques
associés aux boucles et aux feuillets en sont éloignés.
Seule la famille
(boucles) a une forte association avec le BP p.
Les famille
et
ne montrent qu'un fort éloignement
par rapport aux BPs.
|
Le bloc structural de longueur 6 C a été analysé en deux
parties pour les 5 premiers
et les 5 derniers C
.
Comme précédemment,
peu de lien existe entre un bloc ou ensemble de BPs et l'un des 4 blocs structuraux.
La famille
correspond à une hélice
possédant une extrémité N-terminale,
alors que la famille
est synonyme de la partie centrale de l'hélice.
correspond bien
à des boucles, et est proche du BP n.
La famille
(
) n'est pas aussi liée aux blocs
que cela.
De cette simple comparaison, on peut conclure qu'il n'y a pas de
correspondance directe entre ces deux
types d'alphabet. Une première raison est la différence dans le
nombre de blocs utilisés
(4 contre 4 fois plus). Une autre cause est sûrement le faible nombre de
protéines utilisées
dans la première étude. Il semble que ce sont certains repliements
qui ont été appris,
ainsi la figure 2.13b montre clairement que pour ,
censée
être caractéristique des boucles et des feuillets
, le bloc
le plus proche est le bloc m soit une hélice
.
Cette famille est donc caractéristique non pas
de boucles et des feuillets
simples, mais de boucles et des feuillets
allant vers une
hélice
.
Ayant fait des apprentissages avec un nombre aussi limité de blocs,
le résultat est surprenant. Pour avoir
ce type de blocs caractéristiques,
il faudrait au moins deux fois plus de blocs. La seule
possibilité est que les protéines utilisées
aient été particuliérement riches en certains repliements
particuliers.
(c) 2001- Alexandre de Brevern