Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Relation entre blocs protéiques Au-dessus: Analyse des matrices d'occurrences Précédent: La mesure de divergence

   
Z-scores

Pour évaluer localement l'influence de chaque type d'acide aminé, l'utilisation de la méthode des Z-scores est fort pertinente. Elle permet de mettre en évidence les sous- et sur-représentations. Ainsi, chaque matrice d'occurrence associée à chaque bloc a été normalisée comme suit :


\begin{displaymath}Z^k_{ij} = \frac{\left(n^k_{ij}-n_{ib}\right)}{\sqrt{n_{ib}}} \end{displaymath}

avec nib le nombre attendu du ième acide aminé (nib = Nk.fi où Nk et fi sont respectivement le nombre de PBket la fréquence observée de l'acide aminé i dans la base de données). Les Z-scores positifs (ou négatifs) correspondent, pour le bloc protéique k, à des sur-représentations d'acides aminés (ou sous-représentations). La valeur seuil a été prise égale à 4,4 ce qui représente une probabilité p inférieure à 10-5.


Prochain up previous
Prochain: Relation entre blocs protéiques Au-dessus: Analyse des matrices d'occurrences Précédent: La mesure de divergence

Page 65

(c) 2001- Alexandre de Brevern