Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Pour évaluer localement l'influence de chaque type d'acide aminé, l'utilisation de la méthode des Z-scores est fort pertinente. Elle permet de mettre en évidence les sous- et sur-représentations. Ainsi, chaque matrice d'occurrence associée à chaque bloc a été normalisée comme suit :
avec nib le nombre attendu du ième acide aminé (nib = Nk.fi où Nk et fi sont respectivement le nombre de PBket la fréquence observée de l'acide aminé i dans la base de données). Les Z-scores positifs (ou négatifs) correspondent, pour le bloc protéique k, à des sur-représentations d'acides aminés (ou sous-représentations). La valeur seuil a été prise égale à 4,4 ce qui représente une probabilité p inférieure à 10-5.
(c) 2001- Alexandre de Brevern