Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Hélice et feuillet sont les deux formes répétitives les plus importantes des protéines représentant chacune respectivement 30 et 20 % des résidus. Cette importance vient de leur stabilité énergétique particulière [184].
Les hélices tournent dans le sens dit "main droite". Les chaînes latérales sont situées à l'extérieur de l'hélice. L'ensemble s'inscrit dans un cylindre de 10,5 Å de diamètre, le tour de spire ou pas de l'hélice fait 5,4 Å soit 3.6 résidus. L'hélice est une structure thermodynamiquement stable du fait de nombreuses liaisons hydrogènes entre groupements amines (NH2) et carboxyles(C=O). La figure 2.5a montre la structure de l'hémoglobine (code PDB : 1bbb) qui est une protéine pratiquement tout-, ces hélices assurent intégralement la fonction biologique de la protéine. La figure 2.5b montre le domaine 3 de l'hélicase de Escherichia coli (code PDB: 1cuk) qui est un domaine comportant trois hélices . La figure 2.5c montre le squelette de la chaîne polypeptidique. La répétitivité du motif est nette, les groupements carboxyles sont presque parallèles. Les liaisons hydrogènes existantes entre les résidus sont indiquées en pointillés. Ce sont des liaisons entre l'oxygène d'un résidu en position i et le groupement azoté d'un résidu en position i+4; cette liaison est notée [i:i+4].
Les hélices, malgré leur définition, ne sont pas des tubes rigides. Plus d'un quart des hélices sont fortement non-régulières [3]. Un lien direct entre la longueur de l'hélice et son degré de courbure a d'ailleurs été déterminé [113].
Les hélices possèdent une composition en acides aminés particulière. De nombreuses études ont montré aussi l'existence d'acides aminés sur-représentés aux extrémités C- et N-terminales des hélices. Une dizaine de successions spécifiques qui forment des terminaisons stables et qui induisent ces fins d'hélices ont été caractérisées [154,2]. En plus des acides aminés classiques du type Proline ou Glycine, certains acides aminés ont un rôle structural dans ces motifs. Les Glycines se trouvent dans la zone des positifs (cf. figure 2.4b). Les hélices sont présentes dans la zone des et négatifs. Certaines classes d'hélices ont été étudiées du fait de leur importance fonctionnelle comme les hélices amphipatiques (ayant une face polaire et une autre non-polaire) [176].
Les feuillets sont moins stables thermodynamiquement que les hélices [184]. Ils sont dus à un aller-retour de la chaîne polypeptidique qui fait que les segments deviennent adjacents. Ils se retrouvent dans la zone des négatifs et positifs (cf. figure 2.4b).
La figure 2.6a montre une porine, protéine tout-transmembranaire, son ouverture permet le passage de divers solutés. La figure 2.6b représente le premier domaine de la protéine ldu TNF (code PDB : 1ext) d'Escherichia coli, où se trouvent plusieurs feuillets . La figure 2.6c montre un agrandissement du feuillet comprenant les résidus 126-130 et 150-154. Les liaisons stabilisantes existant entre les groupements CO et NH ont été notées en pointillés. Quand les segments sont orientés dans des directions opposées, les feuillets sont dits anti-parallèles. S'ils sont orientés dans la même direction, ils sont dits parallèles.
Ces deux conformations ne font pas intervenir les chaînes latérales mais seulement le squelette polypetidique. Ceci distingue la structure secondaire de la structure tertiaire. Les hélices représentent environ 30% des protéines, les feuillets environ 20%. Le reste est souvent dénommé boucles et a fréquemment été considéré comme variable. Toutefois, on trouve d'autres formes régulières.
|
L'attribution des structures secondaires est souvent un problème délicat. Cinq méthodes d'assignation sont actuellement utilisées :
Comparaison entre les différents algorithmes :
L'ensemble de ces méthodes, à l'exception du consensus, dépend d'un certain nombre de définitions sur la valeur des angles ou des distances et des variations autorisées autour de ces valeurs. Les différentes méthodes d'assignation sont donc loin d'être équivalentes. La méthode consensus dérive d'ailleurs de cette constatation, seulement 64 % des résidus assignés par les trois méthodes DSSP, P-CURVE et DEFINE étant attribués au même type de structure secondaire, et propose de prendre en compte l'ensemble des 3 algorithmes précédents.
|
Le tableau 2.3 récapitule les attributions comparées suivant le type de structure assigné par P-SEA. De fortes différences sont visibles principalement pour les feuillets qui sont les plus difficiles à caractériser. Dans le tableau 2.4, j'ai récapitulé les concordances d'assignation entre les 5 algorithmes actuellement disponibles (PSEA, DSSP, STRIDE, DEFINE, PCURVE) pour une base de données de 906 chaînes protéiques possédant moins de 50% de similitudes de séquences. Les fichiers ne pouvant être analysés par un programme donné n'ont pas été pris en compte. Les résultats obtenus sont en forte concordance avec ceux de la littérature. Un maximum de similitude se trouve entre l'assignation effectuée par DSSP et STRIDE, ce qui est logique du fait de l'utilisation par STRIDE des valeurs angulaires définies dans DSSP. Le logiciel qui possède une assignation la plus divergente des autres méthodes est le logiciel DEFINE qui utilise uniquement des distances sur les C. Sa notice d'utilisation dit d'ailleurs qu'il est loin d'avoir les critères optimaux nécessaires à l'assignation. Par ailleurs, il a le taux le plus élevé d'impossibilité de lecture de fichiers PDB.
Page 7
(c) 2001- Alexandre de Brevern