Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Hélice et feuillet
sont les deux formes répétitives
les plus importantes des protéines représentant
chacune respectivement 30 et 20 %
des résidus. Cette importance vient de leur stabilité énergétique
particulière [184].
Les hélices tournent dans le sens dit "main droite".
Les chaînes latérales sont situées à l'extérieur de l'hélice.
L'ensemble s'inscrit dans un cylindre de 10,5 Å de diamètre,
le tour de spire ou pas de l'hélice fait 5,4 Å soit 3.6
résidus. L'hélice
est une structure thermodynamiquement stable
du fait de nombreuses liaisons hydrogènes entre groupements amines (NH2)
et carboxyles(C=O).
La figure 2.5a montre la structure de l'hémoglobine (code PDB : 1bbb)
qui est une protéine pratiquement tout-
,
ces hélices assurent intégralement la fonction biologique de la protéine.
La figure 2.5b montre le domaine 3
de l'hélicase de Escherichia coli (code PDB: 1cuk) qui est un domaine comportant trois hélices
.
La figure 2.5c montre le squelette de la chaîne polypeptidique.
La répétitivité du motif est nette, les groupements carboxyles sont presque parallèles.
Les liaisons hydrogènes existantes entre les résidus sont indiquées en
pointillés.
Ce sont des liaisons entre l'oxygène d'un résidu en position i
et le groupement azoté d'un résidu en position i+4; cette liaison est notée [i:i+4].
|
Les hélices, malgré leur définition, ne sont pas des tubes rigides.
Plus d'un quart des hélices sont fortement non-régulières [3].
Un lien direct entre la longueur de l'hélice et son
degré de courbure a d'ailleurs été déterminé [113].
Les hélices possèdent une composition en acides aminés particulière.
De nombreuses études ont montré aussi l'existence d'acides aminés
sur-représentés aux extrémités C- et N-terminales des hélices.
Une dizaine de successions spécifiques qui forment des
terminaisons stables et qui induisent ces fins d'hélices ont été caractérisées [154,2].
En plus des acides aminés classiques du type Proline ou Glycine,
certains acides aminés ont un rôle structural dans ces motifs.
Les Glycines se trouvent dans la zone des positifs (cf. figure 2.4b).
Les hélices sont présentes dans la zone des
et
négatifs.
Certaines classes d'hélices
ont été étudiées du fait
de leur importance fonctionnelle comme les hélices amphipatiques (ayant une face polaire et une autre
non-polaire) [176].
Les feuillets sont moins stables thermodynamiquement que les hélices [184].
Ils sont dus à un aller-retour de la chaîne polypeptidique qui
fait que les segments deviennent adjacents. Ils se retrouvent dans la zone
des
négatifs et
positifs (cf. figure 2.4b).
La figure 2.6a montre une porine, protéine tout-transmembranaire, son ouverture permet le passage de divers solutés.
La figure 2.6b représente le premier domaine de la protéine
ldu TNF (code PDB : 1ext) d'Escherichia coli, où se trouvent plusieurs feuillets
. La figure 2.6c montre un agrandissement du feuillet comprenant les résidus
126-130 et 150-154.
Les liaisons stabilisantes existant entre les groupements CO et NH
ont été notées en pointillés.
Quand les segments sont orientés dans des directions opposées,
les feuillets sont dits anti-parallèles.
S'ils sont orientés dans la même direction, ils sont dits parallèles.
|
Ces deux conformations ne font pas intervenir les chaînes latérales
mais seulement le squelette polypetidique. Ceci distingue la structure secondaire
de la structure tertiaire. Les hélices représentent environ 30% des protéines,
les feuillets
environ 20%. Le reste est souvent dénommé boucles et a fréquemment
été considéré comme variable. Toutefois, on trouve d'autres formes régulières.
|
L'attribution des structures secondaires est souvent un problème délicat. Cinq méthodes d'assignation sont actuellement utilisées :
Comparaison entre les différents algorithmes :
L'ensemble de ces méthodes, à l'exception du consensus, dépend d'un certain nombre de définitions sur la valeur des angles ou des distances et des variations autorisées autour de ces valeurs. Les différentes méthodes d'assignation sont donc loin d'être équivalentes. La méthode consensus dérive d'ailleurs de cette constatation, seulement 64 % des résidus assignés par les trois méthodes DSSP, P-CURVE et DEFINE étant attribués au même type de structure secondaire, et propose de prendre en compte l'ensemble des 3 algorithmes précédents.
|
Le tableau 2.3 récapitule les attributions comparées suivant le type de structure assigné
par P-SEA. De fortes différences sont visibles principalement pour les feuillets qui
sont les plus difficiles à caractériser. Dans le tableau 2.4, j'ai
récapitulé les concordances d'assignation entre les 5 algorithmes
actuellement disponibles (PSEA, DSSP, STRIDE, DEFINE, PCURVE) pour une base de données de 906 chaînes protéiques
possédant moins de 50% de similitudes de séquences.
Les fichiers ne pouvant être analysés par un programme donné
n'ont pas été pris en compte. Les résultats obtenus sont en forte concordance avec ceux
de la littérature. Un maximum de similitude se trouve entre l'assignation effectuée par DSSP et STRIDE,
ce qui est logique du fait de l'utilisation par STRIDE des valeurs angulaires définies dans DSSP.
Le logiciel qui possède une assignation la plus divergente des autres méthodes est le logiciel
DEFINE qui utilise uniquement des distances sur les C
.
Sa notice d'utilisation dit d'ailleurs qu'il
est loin d'avoir les critères optimaux nécessaires à l'assignation. Par ailleurs,
il a le taux le plus élevé d'impossibilité de lecture de fichiers PDB.
Page 7
(c) 2001- Alexandre de Brevern