Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
D'un point de vue composition en acides aminés, la distribution des
Z-scores en certains sites est ainsi beaucoup plus prononcée que pour les BPs seuls. Il a fallu
tenir compte du fait qu'un bloc protéique est présent en plusieurs sites et donc que certains sites nettement
moins observés que le BP seul ne sont pas statistiquement
représentatifs.
Certains BPs sont peu influencés d'un point de vue compositionnel par leur environnement local,
d'autres le sont fortement.
La figure 5.5 montre un exemple les différentes répartitions en acides aminés
pour les nuds du réseau correspondant aux blocs protéiques
f, k, l.
Ainsi les n
uds b, 14 de la suite dfbf et 27 de fkbc, ont peu de différence entre
eux, le premier représentant 4/5 des sites b du graphe.
L'absence de Proline dans le second n
ud,
alors qu'elle est fortement sur-representée pour le BP b, est
compensée par une présence de Glycine, absente elle du BP b.
Le cas des n
uds e est assez
similaire pour le n
ud 15 de la suite deh (89 %) et 15
de eeh (11 %) avec peu de différence avec le BP e original, sauf pour
la Proline et la Glycine totalement absente du n
ud 15 de la série eeh.
Les n
uds c 06 de la série acd (68 % des c du
graphe) et 21 de mpc (13 %) ont peu de différence sauf pour des hydrophobes moins présents dans le
dernier cas.
Les sites k 09 de la série fkl (75 %)
et 29 de mkl (18 %) ont peu de différence avec le BP k :
une absence de Thréonine dans le premier et une sur-représentation de Sérine dans le second.
Le principal n
ud l 10 de la série klm (85 %) n'apporte que peu de spécificité
avec juste une légère augmentation du nombre d'Alanine et une sous-représentation accrue de
Glycine par rapport au BP l.
![]() |
Les sites p des nuds 04 de la série opa (65 %)
et 20 de mpc (28 %) montrent des caractéristiques assez éloignées. Le
premier est très proche de la composition du BP p, avec juste une accentuation de sous-représentations
pour la Méthionine et le Tryptophane.
Le second se différencie fortement par une
présence d'acides aminés Isoleucine, Leucine, Alanine, Tryptophane et Cystéine inexistants dans le BPp,
ainsi qu'une sur-représentation accrue de Lysine.
Les n
uds f 08 et 13 montrent dans les suites fklm (56 %)
et cdf (42 %) une forte dissemblance en acides aminés.
Le premier est assez proche du BP f seul, le second nettement moins avec
une fréquence plus élevée en Isoleucine, Valine, Tyrosine, Tryptophane et Glutamine.
Enfin, les n
uds a 05 et 18 dans les suites opa (65 %)
et hia (35 %) sont totalement antagonistes, le premier assez proche du BP a montre une
surreprésentation en Isoleucine, Valine et Phénylalanine plus importante que le BP a,
le second lui ne possède presque plus aucun
acide aminé Isoleucine, Valine, Leucine, Méthionine, Tyrosine, Thréonine, Sérine,
Glutamate, Lysine et Arginine et montre une forte propension en Glycine et Aspartate.
Longueur des protéines n'influence en rien le taux de résidus compris dans le graphe par protéines qui est assez constant. La longueur moyenne des fragments inclus dans le graphe n'en dépend d'ailleurs pas.
(c) 2001- Alexandre de Brevern