Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
L'ensemble des sites ayant été précédemment caractérisé du point de vue de leur composition en acides aminés, se pose la question de la similitude existante entre ces sites. Pour voir si des sites ayant le même type de distribution du point de vue des acides aminés sont associés aux mêmes structures locales ou non, les sites ont été regroupés avec la méthode de classification k-means [79]. Cette méthode permet de regrouper dans un même groupe des observations proches (cf. Annexe 1).
![]() |
Le groupe 1 (25 sites) ne montre aucune spécificité en acides aminés et possède un nombre très divers de blocs pour chaque site, les 16 types de blocs protéiques se retrouvent associés à ce groupe. Le groupe 2 (5 sites) montre une forte sur-représentation en Glycine et Asparagine, cependant des blocs fort distincts lui sont associés comme les blocs d, j ou m. Le groupe 3 possède le même type de sur-représentation. Cependant il est fortement éloigné du précédent, car il est associé avec des sous-représentations plus fortes et ne correspond, par ailleurs, qu'à des blocs i, j et k qui correspondent à des zones de ruptures de structures régulières.
Les groupes 4 à 6 sont associés à des feuillets ,
et les groupes 7 et 8 à des hélices
.
Le groupe 4 (17 sites) est associé à une sur-représentation d'acides aminés aliphatiques
tels l'Isoleucine et la Valine correspondant à des feuillets
centraux et des extrémités
N-terminales de feuillet
.
Le groupe 5 (12 sites) est composé de PB d et d'autres blocs associés aux extrémités N- et C-terminales
des feuillets
(de PB a au PB f) et lié à
une sur-représentation de Valine et une sous-représentation de résidus chargés.
Le groupe 6 (1 site en position 58) est un
feuillet
régulier avec une forte sur-représentation d'acides aminés non-polaires
et une sous-représentation
d'acides aminés polaires.
Le groupe 7 (10 sites) correspond à une hélice
, plus spécifiquement,
une extrémité C-terminale d'hélice
.
Une sous-représentation de Leucine, Méthionine et de résidus polaires est retrouvée.
Le groupe 8 (8 sites) montre une sur-représentation d'Alanine, de Méthionine,
d'Isoleucine et de Proline et une sous-représentation
de Glycine; ce groupe ne comprend que les parties centrales des hélices
.
Le groupe 9 (15 sites) avec une
sur-représentation de petits acides aminés polaires est caractéristique des changements brusques de structures
avec des PBs comme les PBs f, h, a, l et o.
Le groupe 10 (1 site en position 81) est associé au PB h;
il a une sur-représentation de résidus aliphatiques
et de Proline, ainsi qu'une forte sous-représentation des résidus polaires.
Le groupe 11 (3 sites) montre une sur-représentation de petits résidus polaires
et des sous-représentation de résidus non-polaires et de Proline.
Le groupe 12 (1 site en position 70) montre une sur-représentation de Glycine
et une sous-représentation des résidus non-polaires.
Pour les quatres sites qui composent les deux derniers groupes
le bloc protéique le plus important est toujours le PBf,
avec cependant une différence notable;
dans le groupe 11, le bloc f est dans une série fkl
alors que dans le groupe 12, il est dans une succession fbd.
Ce détail est d'importance car, comme l'a montré le graphe (cf. paragraphe 5.2),
le premier
fait partie d'une série allant vers des hélices alors que le second est plus présent dans les transitions vers
des feuillets .
(c) 2001- Alexandre de Brevern