Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Les boucles Au-dessus: Résultats Précédent: Test de l'homogénéite structurale

Relation avec les acides aminés

D'un point de vue composition en acides aminés, la distribution des Z-scores en certains sites est ainsi beaucoup plus prononcée que pour les BPs seuls. Il a fallu tenir compte du fait qu'un bloc protéique est présent en plusieurs sites et donc que certains sites nettement moins observés que le BP seul ne sont pas statistiquement représentatifs. Certains BPs sont peu influencés d'un point de vue compositionnel par leur environnement local, d'autres le sont fortement. La figure 5.5 montre un exemple les différentes répartitions en acides aminés pour les n\oeuds du réseau correspondant aux blocs protéiques f, k, l. Ainsi les n\oeuds b, 14 de la suite dfbf et 27 de fkbc, ont peu de différence entre eux, le premier représentant 4/5 des sites b du graphe. L'absence de Proline dans le second n\oeud, alors qu'elle est fortement sur-representée pour le BP b, est compensée par une présence de Glycine, absente elle du BP b. Le cas des n\oeuds e est assez similaire pour le n\oeud 15 de la suite deh (89 %) et 15 de eeh (11 %) avec peu de différence avec le BP e original, sauf pour la Proline et la Glycine totalement absente du n\oeud 15 de la série eeh. Les n\oeuds c 06 de la série acd (68 % des c du graphe) et 21 de mpc (13 %) ont peu de différence sauf pour des hydrophobes moins présents dans le dernier cas. Les sites k 09 de la série fkl (75 %) et 29 de mkl (18 %) ont peu de différence avec le BP k : une absence de Thréonine dans le premier et une sur-représentation de Sérine dans le second. Le principal n\oeud l 10 de la série klm (85 %) n'apporte que peu de spécificité avec juste une légère augmentation du nombre d'Alanine et une sous-représentation accrue de Glycine par rapport au BP l.


  
Figure 5.5: Comparaison entre les distributions en acides aminés normalisés en Z-scores des nuds correspondants aux blocs protéiques f (8, 13 et 24), k (9, 22 et 31) et l (10, 28 et 30).
\begin{figure}
\centerline{\epsfxsize=8cm
\rotatebox{270}{\epsfbox{Images/Chapitre_3_PBs/Graph/dist_aa_03_fkl.ps}}}
\end{figure}

Les sites p des n\oeuds 04 de la série opa (65 %) et 20 de mpc (28 %) montrent des caractéristiques assez éloignées. Le premier est très proche de la composition du BP p, avec juste une accentuation de sous-représentations pour la Méthionine et le Tryptophane. Le second se différencie fortement par une présence d'acides aminés Isoleucine, Leucine, Alanine, Tryptophane et Cystéine inexistants dans le BPp, ainsi qu'une sur-représentation accrue de Lysine. Les n\oeuds f 08 et 13 montrent dans les suites fklm (56 %) et cdf (42 %) une forte dissemblance en acides aminés. Le premier est assez proche du BP f seul, le second nettement moins avec une fréquence plus élevée en Isoleucine, Valine, Tyrosine, Tryptophane et Glutamine. Enfin, les n\oeuds a 05 et 18 dans les suites opa (65 %) et hia (35 %) sont totalement antagonistes, le premier assez proche du BP a montre une surreprésentation en Isoleucine, Valine et Phénylalanine plus importante que le BP a, le second lui ne possède presque plus aucun acide aminé Isoleucine, Valine, Leucine, Méthionine, Tyrosine, Thréonine, Sérine, Glutamate, Lysine et Arginine et montre une forte propension en Glycine et Aspartate.

Longueur des protéines n'influence en rien le taux de résidus compris dans le graphe par protéines qui est assez constant. La longueur moyenne des fragments inclus dans le graphe n'en dépend d'ailleurs pas.




Page 105

(c) 2001- Alexandre de Brevern