Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Les répartions des acides aminés attendues ont été retrouvées.
Toutefois, elles ne donnent pas d'idées quant à la spécificité de chaque
site d'un point de vue statistique.
Aussi pour l'évaluer, les données précédentes ont été analysées
á l'aide du KLd.
Le calcul de l'entropie relative ou mesure de la divergence assymétrique de
Kullback-Leibler (noté KLd [112]) a été explicitée dans le paragraphe 3.3.5.1.
La spécificité des résidus a été calculée par rapport à ceux de la base de
données.
La quantité Ni.K(pi,q)
suit une distribtion de type , avec Ni le nombre d'observations (ici,
le nombre de structures locales associées au site i).
Ainsi, les positions ayant une forte spécificité seront associées à des valeurs élevées.
![]() |
Un premier résultat visuel net apparaît: les valeurs obtenues sont nettement supérieures à celles calculées
précédemment avec les blocs protéiques seuls (cf. Figure 6.6).
La valeur seuil utilisée est de 36 soit un risque de première espèce ()
de 0,05 pour 19 degrés de liberté (les 20 types d'acides aminés).
Les hélices
et les feuillets
sont présents,
mais d'autres positions en dehors des structures répétitives
présentent une structure stable comme des boucles en [59:60] incluant la série de blocs kl.
(c) 2001- Alexandre de Brevern