Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Les autres alphabets structuraux décrits ont souvent des tailles supérieures [162,53,19]. Pour analyser la qualité du recodage, des séries de blocs de différentes tailles ont été extraites de la base de données structurales. J'ai regardé spécifiquement des séries de deux structures secondaires répétitives définies par les blocs m et/ou d. Des motifs de tailles 1 à 6 ont ainsi été examinés. Les exemples les plus représentatifs de chaque longueur sont réunis dans le tableau 3.2 avec le RMSd moyen associé. Pour expliciter les exemples, mm(xyz)dd est un motif xyz qui relie deux BPm et deux PBd.
Pour des motif courts d'un ou deux blocs, les occurrences sont faibles (moins de 40 observations). Pour des motifs plus longs, le nombre global de combinaisons de blocs protéiques augmente fortement. Par exemple, pour une longueur de 4 (respectivement 5 et 6), un nombre moyen de 20 motifs différents est trouvé (respectivement 22 et 30 motifs). Le nombre et le type de motifs sont importants et dépendent principalement du type de structures secondaires localisées aux extrémités du motif. Pour un motif de longueur 3 ayant en extrémité N-terminale dd et finissant par les blocs mm, le motif fkl représente 98 % des occurrences trouvées; et en reliant mm à mm, le motif nop représente 82 % des occurrences trouvées avec 24 occurrences présentes. Dans les autres cas, et pour toutes les longueurs observées, il n'existe pas de motif représentant plus de 75 % des occurrences.
Les RMSd moyens calculés pour ces exemples montrent une forte
stabilité structurale avec une
moyenne proche de 1,0 Å.
L'approximation structurale induite par l'utilisation
des blocs protéiques
reste correcte pour des motifs de taille importante.
Cette notion couplée avec
les propriétés des transitions existants entre les blocs, sera reprise dans le paragraphe
5.2 pour des fragments de tailles supérieures à 5 C.
(c) 2001- Alexandre de Brevern