Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Comparaison avec les autres Au-dessus: Relation entre blocs protéiques Précédent: Quatre Exemples

Utilisation des Z-scores pour déterminer les acides aminés sur- et sous-représentés dans chaque bloc


 \begin{sidewaystable}% latex2html id marker 1757
\footnotesize
\begin{tabular}{c...
...pr\'esentations (Z-score $<$\space -4.4) not\'es (+) et (-).}\end{sidewaystable}

Le tableau 3.4 mentionne pour chaque bloc protéique, en chaque position, de la fenêtre allant de -4 à +4 autour de la position centrale, les acides aminés sur- et sous- représentés (Z-score >4.4 noté +, ou, <-4.4 noté -). Un grand nombre d'acides aminés par position ont un Z-score important.

Pour se focaliser sur les plus spécifiques des résidus, la valeur de 4,4 comme valeur seuil a été choisie comme pour la figure 3.13. Seule la zone allant de -4 a +4 est représentée. En dehors de cette zone, une seule position présentait encore un intérêt. Les positions informatives ont été retenues sur la base d'une valeur de Kld supérieure à 300 / 2Nk, avec Nk le nombre de PBkobservé.

Les transitions principales entre les blocs protéiques (cf. tableau 3.3) sont retrouvées dans les compositions en acides aminés. Par exemple, les sur-représentations des Glycines et des Asparagines sont observées pour les blocs protéiques n, o, p et a en positions (+2), (+1), (0) et (-1). De la même manière, les blocs protéiques e et g en position +2, vont vers le BPh (en position +1) and BPi (en position 0). Cependant des différences existent, comme pour le BP d qui va vers le BPf avec une fréquence de 51,9%, sa position (+1) a une sous-représentation différente par rapport au bloc f en position (0) où la Valine et l'Isoleucine sont sous-représentées pour le premier et sur-représentées pour le second. En fait, les proportions des acides aminés ne sont pas toujours conditionnées par les transitions préférentielles entre blocs. Ainsi, la sur-représentation de la Proline en position (+1) du BP b est remplacée par une sous-représentation dans le bloc c alors que la fréquence de transition du BP b au c est de 17,9 %.

Les sous- et sur-représentations sont concentrées principalement autour de la position centrale, dans une zone recouvrant le bloc structural [-2;+2]. Le tableau 3.4 montre l'importance de ces positions.

On peut noter que les structures répétitives montrent bien des représentations classiques avec des sur-expressions de [AEL] et des sous-représentations de [GPST] pour le bloc protéique BPm, prototype de la partie centrale de l'hélice $\alpha$, et des sur-expressions de [IV] et des sous-représentations de [ADEGN] pour BP d [90,145,113]. De même, la sur-représentation de Glycine est le plus souvent associée à celle d'Asparagine dans les boucles. La flexibilité due à la Glycine permet une torsion importante, et la fonction amine de l'Asparagine permet une liaison directe avec le squelette peptidique assurant ainsi un brusque changement de conformation [47].


Prochain up previous
Prochain: Comparaison avec les autres Au-dessus: Relation entre blocs protéiques Précédent: Quatre Exemples

Page 68

(c) 2001- Alexandre de Brevern