Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Le tableau 3.4 mentionne pour chaque bloc protéique, en chaque position, de la fenêtre allant de -4 à +4 autour de la position centrale, les acides aminés sur- et sous- représentés (Z-score >4.4 noté +, ou, <-4.4 noté -). Un grand nombre d'acides aminés par position ont un Z-score important.
Pour se focaliser sur les plus spécifiques des résidus, la valeur de 4,4 comme valeur seuil a été choisie comme pour la figure 3.13. Seule la zone allant de -4 a +4 est représentée. En dehors de cette zone, une seule position présentait encore un intérêt. Les positions informatives ont été retenues sur la base d'une valeur de Kld supérieure à 300 / 2Nk, avec Nk le nombre de PBkobservé.
Les transitions principales entre les blocs protéiques (cf. tableau 3.3) sont retrouvées dans les compositions en acides aminés. Par exemple, les sur-représentations des Glycines et des Asparagines sont observées pour les blocs protéiques n, o, p et a en positions (+2), (+1), (0) et (-1). De la même manière, les blocs protéiques e et g en position +2, vont vers le BPh (en position +1) and BPi (en position 0). Cependant des différences existent, comme pour le BP d qui va vers le BPf avec une fréquence de 51,9%, sa position (+1) a une sous-représentation différente par rapport au bloc f en position (0) où la Valine et l'Isoleucine sont sous-représentées pour le premier et sur-représentées pour le second. En fait, les proportions des acides aminés ne sont pas toujours conditionnées par les transitions préférentielles entre blocs. Ainsi, la sur-représentation de la Proline en position (+1) du BP b est remplacée par une sous-représentation dans le bloc c alors que la fréquence de transition du BP b au c est de 17,9 %.
Les sous- et sur-représentations sont concentrées principalement autour de la position centrale, dans une zone recouvrant le bloc structural [-2;+2]. Le tableau 3.4 montre l'importance de ces positions.
On peut noter que les structures répétitives montrent bien des
représentations classiques
avec des sur-expressions de [AEL] et des sous-représentations de
[GPST] pour le bloc protéique BPm,
prototype de la partie centrale de l'hélice ,
et des sur-expressions de [IV] et des sous-représentations de
[ADEGN] pour BP d [90,145,113].
De même, la sur-représentation de Glycine est le plus
souvent associée
à celle d'Asparagine dans les boucles. La flexibilité due à la Glycine permet
une torsion importante, et la fonction amine de l'Asparagine permet une
liaison directe avec le squelette peptidique assurant ainsi un brusque changement de
conformation [47].
(c) 2001- Alexandre de Brevern