Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Ce terme K quantifie la différence existante entre la
distribution
des acides aminés dans le bloc p
et
celle attendue au vue de l'occurrence du bloc dans la base de données
si tout était aléatoire.
Le terme Kk(pj,q) a été calculé en chaque
position j pour observer la différence existant entre la
distribution observée en acides aminés pj et la distribution
de référence de la base de donnée
q ajustée pour PBk.
Cette mesure de divergence, notée KLd, permet de détecter des positions "informatives" en observant les positions j dans l'intervalle [-w;+w].
L'entropie relative K(p,q) est une valeur toujours
supérieure ou
égale à zéro. Elle suit, multipliée par 2N (N étant le nombre
d'observations dans la base de données),
une loi classique du à 19 degrés de liberté (ou ddl, car défini
sur les 20 types d'acides aminés).
La valeur seuil a été choisie pour un risque
de premier ordre de 10-5. Toute valeur supérieure à
cette valeur seuil est donc
fortement significative.
(c) 2001- Alexandre de Brevern