Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Similitude des sites de Au-dessus: Analyse de la répartition Précédent: Analyse de la répartition

KLd pour quantifier la spécificité des acide aminés

Les répartions des acides aminés attendues ont été retrouvées. Toutefois, elles ne donnent pas d'idées quant à la spécificité de chaque site d'un point de vue statistique. Aussi pour l'évaluer, les données précédentes ont été analysées á l'aide du KLd. Le calcul de l'entropie relative ou mesure de la divergence assymétrique de Kullback-Leibler (noté KLd [112]) a été explicitée dans le paragraphe 3.3.5.1. La spécificité des résidus a été calculée par rapport à ceux de la base de données. La quantité Ni.K(pi,q) suit une distribtion de type $\chi^2$ , avec Ni le nombre d'observations (ici, le nombre de structures locales associées au site i). Ainsi, les positions ayant une forte spécificité seront associées à des valeurs élevées.


  
Figure 6.6: KLd associé à la répartition en acides aminés (cf. figure 6.5) en chaque position de la protéine hybride, avec en abcisse les sites de la protéine hybride et en ordonnée la valeur de Ni $ \times $ KLd, la valeur seuil est de 36 et représente une erreur de premier ordre de 0,05 avec 19 ddl.
\begin{figure}
\centerline{\epsfxsize=10cm
\rotatebox{270}{\epsfbox{Images/Chapitre_4_HPM/TCA/figure_5b.ps}}}
\end{figure}

Un premier résultat visuel net apparaît: les valeurs obtenues sont nettement supérieures à celles calculées précédemment avec les blocs protéiques seuls (cf. Figure 6.6). La valeur seuil utilisée est de 36 soit un risque de première espèce ($\alpha$) de 0,05 pour 19 degrés de liberté (les 20 types d'acides aminés). Les hélices $\alpha$ et les feuillets $\beta$ sont présents, mais d'autres positions en dehors des structures répétitives présentent une structure stable comme des boucles en [59:60] incluant la série de blocs kl.




Page 126

(c) 2001- Alexandre de Brevern